Open Interpreter 01 Lightで遊んでみた

こんにちは。B4の坂村です。

前回はAIのデバイスについて解説を行いましたが、その中でも唯一手軽に試すことのできるOpen Interpreterの01 Lightで遊んでみようと思います。

Open Interpreter 01ってなに?

公式サイトには以下のようにあります。

01.openinterpreter.com

01プロジェクトは、人工知能バイスのためのオープンソースエコシステムです。

コード解釈言語モデル(「インタプリター」)と音声認識音声合成を組み合わせることで、01の主力オペレーティングシステム(「01OS」)は、Rabbit R1やHumane Pinのような対話型コンピュータ操作のAIデバイスを駆動することができます。

私たちは、この新しい領域の「Linux」となることを意図しています - オープンで、モジュール化され、個人や商用利用に無料です。

The 01 project is an open-source ecosystem for artificially intelligent devices.

By combining code-interpreting language models (“interpreters”) with speech recognition and voice synthesis, the 01’s flagship operating system (“01OS”) can power conversational, computer-operating AI devices similar to the Rabbit R1 or the Humane Pin.

We intend to become the “Linux” of this new space— open, modular, and free for personal or commercial use.

01にはLightとHeavy(準備中)があり、Lightはサーバーとなるコンピューターを音声コマンドによって操作するものです。

Open InterpreterはChat GPTの機能であるCode Interpreter(現 Advanced Data Analysis)のオープンソース版であり、プログラムの実行をローカルで行うことができるプロジェクトです。これに音声による操作が加わったのが01 Lightです。

今回は簡単に、デスクトップにテキストファイルを作成してみます。

実行時の様子

リファレンス

01.openinterpreter.com

github.com

https://openai.com/index/openai-api

用意するもの

  • OpenAI API
    • 01の核となる部分。環境さえ構築できればMetaのLLaMAなども使用可能。
  • ATOM Echo(M5 Stack社)
    • BluetoothWi-Fiモジュールを持ったEPS32のスピーカーモジュール。
  • ATOM TailBAT(M5 Stack社)
    • ATOM Echoの充電モジュール。必須ではないです

ATOM Echo & TailBAT

環境

やってみる

環境を作る

上記のリファレンスをもとに環境を作ります。(今回はMacでの実行です)

  1. 必要なライブラリのインストールとコンパイル
brew install portaudio ffmpeg cmake
  1. リポジトリのクローン
git clone https://github.com/OpenInterpreter/01.git
cd software
  1. OpenAI API Keyの登録
export OPENAI_API_KEY=sk-...
  1. Python周り
pip install poetry
poetry install

ATOM Echoにプログラムを書き込む

Arduino IDEを介し、ATOM Echoにプログラムを流し込みます。

インストールする必要があるライブラリはこれらですが、必要に応じてインストールしてください。

サーバー側のプログラムを実行

ATOM Echoは同一のネットワークを介してサーバーとなるPCにアクセスします。ifconfigなどで現在のIPアドレスを取得しておきましょう。

以下を01/software下で実行することでサーバーが起動します。

poetry run 01 --server --server-host [IPアドレス] --server-port 10001

なお、以下のようにオプションをつけずに実行すれば、ATOM Echoなどハードウェアを使わずにPCのマイクからも実行可能です。

poetry run 01

実行時に以下のようなエラーが出ましたが、Pythonの環境を3.11にすることで解決しました。

Cannot call "receive" once a disconnect message has been received.

https://github.com/OpenInterpreter/01/issues/127

ATOM Echoをサーバーに接続

ATOM Echoをサーバーに接続するには設定が必要です。ATOM Echoでプログラムを動作させると、01-Lightというアクセスポイントが出現するので、サーバーとしている機器以外からこれに接続します。接続すると設定画面が開くので使用しているネットワークのパスワードやサーバーのアドレスを入力します。(今回は[IPアドレス]/1001)

これで準備は整いました。

命令!

いざ、命令を実行してみます。

ATOM Echoのボタンを押しながら話すことで命令が可能です。

poetry run 01 --server --server-host [IPアドレス] --server-port 10001

○                                                          

Starting...                                                

INFO:     Started server process [6565]
INFO:     Waiting for application startup.

Ready.                                                     

INFO:     Application startup complete.
INFO:     Uvicorn running on http://[IPアドレス]:10001 (Press CTRL+C to quit)
INFO:     ('[IPアドレス]', 50577) - "WebSocket /" [accepted]
INFO:     connection open
audio/raw /var/folders/lx/m240njn17m90yywb2n15m_kr0000gn/T/input_20240505134141001086.dat /var/folders/lx/m240njn17m90yywb2n15m_kr0000gn/T/output_20240505134141004104.wav
>  [ここに命令が文字起こしされて表示される]

結果

今回はデスクトップにテキストファイル(ファイル名は今日の日付とする)を作ってもらいました。以下は実行時の動画です。

命令を受け、コンソールでプログラムを実行している様子です。

1
2
3

ご覧のように、無事デスクトップにテキストファイルを作ることができました!!!(うやむやEnglishはご愛嬌)

テキストファイルが作成された!

命令は日本語でも可能ですが、聞き取りに難ありだったので英語での命令としましたが、ヒューマンエラーというか、発音が微妙で何度かチャレンジしています。

体感としてはATOM Echoのマイクの品質も聞き取りに影響していそうで、PCのマイクだともう少し精度がよかったです。

また、ATOM EchoのスピーカーがどことなくHAL9000を想起させる点も推しポイントです。

おわりに

こうして手軽に未来を感じられるのはとっても楽しいです! なんだかんで色々と試しているうちに$15相当のクレジットを使ってしまいました🫠

光の集える空間-AIに生成されたタイトルをもとに、プレイリストを作ってみた。vol.3

こんにちは、B4魚田です。 今回は1月から続けているプレイリスト制作withAIの第3回となります。

前回までのおさらい

このシリーズはAIにテーマを決めてもらって、プレイリストを作成してもらうというものです。そのプレイリストを公開するのはもちろんのこと、プレイリストを分析し、AIの選曲の傾向を把握することで、現時点でのAIと音楽の関係を捉えることを目指しています。 全体のテーマは「光の集える空間」で、4つのプレイリストを企画しています。

・4つのプレイリストのタイトル

  1. 「Vividなバースデーworld」GPTClaude
  2. 「時の儀式のダンスパーティーGPTClaude
  3. 「Anothre Scape」
  4. 「連鎖的酔狂行列の発光」

前回までに「Vividなバースデーworld」と「時の儀式のダンスパーティー」のプレイリストを作成しました。

今回はプレイリスト「Anothre Scape」を作成してもらいます。この作業は2024年5月2日に行いました。

Adobe FireFlyで生成

制作

選曲してもらうのにあたって、聴きやすく、興味深いプレイリストになるように3つの条件を与えています。1つ目が、一般的なアルバムと同じように10曲という制限を設けること、2つ目がアーティストの出身地は問わないこと、3つ目が同じアーティストの楽曲は1曲までとすることです。それぞれで、プレイリストとちょうどよい長さにする、英語圏以外の楽曲でも選ぶ、人気アーティスト一辺倒にならないようにするというのを理由に設定しています。

↓チャットボックスのやりとりはこんな感じです。

Chat-GPT

Claude

GPTの考えたプレイリストは特に修正点はありませんでした。一方、Claudeが考えたプレイリストでは1曲目のPink Floyd『Another Brick in the Wall』(1979)Pt.1,2,3があり、どのパートか指定されていませんでした。なので、3つのバージョンから1つ選ぶように指示し、Pt.2を選んでもらいました。

Chat-GPT

Claude

分析

ここからは、2つのプレイリストの選曲について分析していきます。

まず、分析するにあたって、楽曲の情報を、スプレッドシートにまとめました。

プレイリスト「Another Scape」の選曲

スプレッドシートを見てわかることとしては、楽曲のタイトルの類似性です。GPTの選曲した楽曲のタイトルに特徴は見られませんが、Claudeの選曲した楽曲のタイトルは10曲中9曲に"Another"が含まれており、唯一違う場合も"Different"といった別のものを意味している単語が含まれています。前回のプレイリストには見られなかった傾向ですが、楽曲の選曲方法に違いがありそうな感じがします。

次に、チャートを使って、分析していきます。 2つのプレイリストの楽曲のYouTubeの再生回数(2024年5月2日時点)を比較してみます。

GPTの選曲は赤、Claudeの選曲は青で描写しています。

もっとも再生回数が多かったのはQueen『Another One Pites the Dust』(1980)の628378039回です。一方で、最も少なったのはMike + The Mechanics『Another Cup Of Coffee』(1995)の1244442回で、その差は627133597回です。今回も再生回数では幅広く選んでいたといえます。

次に選曲されたアーティストの出身地を見てみます。

棒グラフより選曲数はアメリカが最も多く、次いで、イギリス、フランスとなっていることがわかります。全体でみると、前回よりも、欧米圏のアーティストの楽曲を選ぶ傾向が強くなりました。プロンプトでは“国籍を問わない”として、多国籍なプレイリストとしたかったのですが、結果として地域が集中してしまいました。

最後にリリース年を見てみます。

GPTの選曲は赤、Claudeの選曲は青で描写しています。円の大きさは各曲の再生回数を示しています。

このチャートを見ると、GPTの選曲が、2000年以後に集中しているのに対して、Claudeの選曲が、2000年以前に集中していることがわかります。これは前回までも見られた傾向で、それぞれの選曲は2000年が一つの基準になっている可能性があります。

以上からある程度、AIの制作するプレイリストの方向性がつかめたように感じられます。

プレイリストの感想

2つのプレイリストを聴いてみて、感じたことをまとめてみました。

まず、GPTのプレイリストはMGMT『Electric Feel』(2007)から始まります。電子ポップといえる曲調で、浮遊感のある楽曲です。これの流れは3曲目まで続き、特に2,3曲目のつながりは印象的です。4曲目はシンプルなベースから始まるPortugal. The Man『Feel It Still』(2017)でバンドサウンドというか、生楽器の音が中心ですが、3曲目までの雰囲気を崩していません。5曲目は再びDaft Punk電子音楽が挟まり、6、7曲目で徐々に盛り上がり、8曲目、Franz Ferdinand『Take Me Out』(2004)でピークに達します。ここまでの3曲で2004年リリースの楽曲が並んでいるのが、面白いポイントです。9曲目、Phoenix『1901』(2009)がそれまでの楽曲をまとめるようなポップソングで、10曲目、Grouplove『Tongue Tied』(2011)が浮遊感を着地させるような、エンディングに相応しい楽曲でプレイリストは終了します。結果として、浮遊感を着地させるというストーリーのあるプレイリストになりました。

次にClaude.verは1曲目の『Another Brick in the Wall Pt.2』がイントロも短く、すぐに歌が始まってしまうので違和感がありましたが、2曲目以降は比較的静かな曲調の楽曲がまとまっていたので、落ち着いて聴くことができました。しかし、6曲目のDisturbed『Another Way to Die』(2010)、7曲目、Blind Guardian『ANOTHER STRANGER ME』とハードロック調の楽曲が連続します。落ち着いてきたところに差し込まれてしますので、はじめは驚きますが、聴いているとプレイリストのアクセントになっているように感じられます。8曲目、Phil Collins『Another Day in Paradise』(1989)からは再度、落ち着いた曲調になります。ただ、イントロ部分には無音な時間が数秒あるので、ぶつぎりになったような印象は弱いです。この後は、ディスコで流れていそうな9曲目、Real McCoy『Another Night』(1994)、10曲目、Roger Sanchez & Oliver Heldens『Another Chance』(2001)が続きます。クライマックスといった感じで、いい感じに盛り上げてくれます。様々な楽曲が違和感がありながらも接続されているプレイリストになりました。

2つとも、いい感じのプレイリストでしたが、個人的な好みとしては、浮遊感の演出がおもしろかったGPTのプレイリストの方がいいかなと思いました。

おわり

今回は「Another Scape」というタイトルのプレイリストをChat-GPTとClaudeに制作してもらい、その選曲について少し分析を行いました。今回のプレイリスト内の楽曲のMV一覧や分析で使用したチャートはここで確認することができます。

次回は「連鎖的酔狂行列の発光」になります。ご高覧頂き、ありがとうございました。

おまけ

同じタイトルで僕が作ったプレイリストも公開しておきます。

フルーツを食べた時の口内の違和感の原因

はじめに

 こんにちは。ネットワークデザインスタジオB4の山上です。いきなりですが、皆さんはフルーツを食べた後、口の中がイガイガ、キシキシしたという経験はありますか?私は先日、自宅で大量のパイナップルを食べた時に、口の中がイガイガして苦い思いをしました。(パイナップルはとても美味しかったです。)今回は、果物を食べた後の口内の違和感の原因について、気になったので調べてみました。その結果、大きく2つの原因があることがわかりました。

1 タンパク質分解酵素

 調べてみると、食べた後に口内に違和感を感じる果物には『タンパク質分解酵素』が多く含まれていることがわかりました。例えば、パイナップルには「ブロメライン」というタンパク質分解酵素が含まれています。タンパク質を分解する作用が、口内を保護する粘膜の中のタンパク質に働くことで、口内がノーガードの状態になり、刺激を感じやすくなります。その結果、口内がイガイガします。一般的に、食べるとイガイガするといわれている果物と、それに含まれるタンパク質分解酵素の名前を下記にまとめてみました。

  • パイナップル→ブロメライン

  • キウイフルーツ→アクチニジン

  • メロン→ククミシン

同じタンパク質分解酵素でも様々な種類があるようです。

2 タンニン

 上の三つの果物の他にも、口の中に違和感を感じる果物があります。桃や葡萄、柿などです。これらのフルーツの違和感の原因は、『タンニン』というポリフェノールの一種によるものです。タンニンは唾液中のタンパク質と複合体を形成し、ぬるぬるの層を取り除くことで口内が乾き、違和感に繋がります。タンニンによる違和感は、タンパク質分解酵素とは異なり、イガイガというよりもキシキシに近いといえます。

おわりに

 今回は、フルーツを食べた後の口内の違和感について調べました。結果、原因は大きく2つあり、個人の感覚ではありますが、『タンパク質分解酵素』による違和感はイガイガ、『タンニン』による違和感はキシキシ、に分類することができました。口内が痒くなった場合はアレルギーの可能性もあるようなので注意しつつ、フルーツを美味しく頂きたいです。

参考文献

タンパク質を分解してアミノ酸にする消化酵素の分解する仕組みや効果を解説 | ヤヱガキ醗酵技研株式会社

パイナップルアレルギー? - おやなぎアレルギークリニック|アレルギー専門医

キウイフルーツによるタンパク質消化促進効果について| 健康と栄養にちょっといい話| ニュース&トピックス|健康栄養学科|大学・短期大学・大学院| 駒沢女子大学・駒沢女子短期大学

ククミシンについて | みんなのひろば | 日本植物生理学会

  • タンニン

タンニンの正しい理解 その① (タンニンとは?渋みとは?) | ワイン・ブログ 情熱とサイエンスのあいだ

タンニンについて

読書記録 働く気持ちに火をつける

はじめに

こんにちは。ネットワークデザインスタジオB4の鈴木です。 今回は、齋藤孝『働く気持ちに火をつける』を読んだ記録を書きます。

手に取ったきっかけ・感想

 高校の頃の部活動のスローガンが『ミッション・パッション・ハイテンション』だった。 ちょうど今、就活で自分のモットーや性格、物事に取り組む姿勢などを、過去の経験を通して説明する機会が多い。そんな時にふと思い浮かんだのが、このスローガンだ。

 高校生だった当時、このスローガン通り 『目標や使命感を持つ・情熱を持つ・上機嫌でいる』ことを心がけてはいたものの、それは私にとって不完全燃焼の原因ともいえる言葉だった。 当時の私にとっての最大のミッションそのものがコロナによって無くなったからだ。聞くとネガティブな過去を思い出さずにはいられないが、最近になってこの言葉が『働く気持ちに火をつける』という本のサブタイトルであることを知った。そこでこの本を手に取り、現在の自分の考えや人生観を整理していきたい。

ミッション

 私は昔から自分で自分のための目標(学業や部活動、資格など)を立てることが苦手だった。人に認められたい、負けたくない、迷惑をかけたくない。何かを一生懸命頑張るときの原動力はこのいずれかだ。

 『ミッションは、誰かから具体的な指令を与えられるという点が重要だ』という一文があるが、読んで少し安心した気持ちになった。就活において何となく、自分をさらに高めるための崇高な目標がなくてはならないと感じていた。しかし実際には自分で自分にミッションを与えることができる人は少なく、他者から与えられてこそより大きな目的のために働く意識につながっていく。動力源を自分の外側から得ることは社会において当然のことであるという認識を得られたことは、肩の荷が降りるような感覚であった。

パッション

 パッションは、自分に一番欠けているものだ。文中で『ある屈辱や不愉快な体験を、その後の自分のエネルギーに転化する』という意味合いで用いられている。私は良くも悪くも得意不得意が自分の中ではっきりしていて、諦めが良く、「不得意なことは他人の力を借りる」主義を採用している。よって屈辱や不愉快な体験を未然に防ぐ、ある意味都合のいい人間であることになる。

 文頭で述べたように、私にとって一番の「不」の体験は高校時代の最大のミッションそのものがコロナで無くなったことだ。何事も割り切って考えるようになったのはこの体験も起因していると思う。これをパッション的思考で捉えるとすると、「自分の努力してきた過去を肯定する」「これからも好きなことにとことんのめり込む」といった所だろうか。好きなことに対してのめり込む素質は人一倍あると思う。文中の『パッション』の意味とは少しズレるが、このような原動力は仕事上でも私生活でも持ち続けたい。

ハイテンション

 『仕事がうまくて不機嫌な人よりも、仕事では少々落ちてもご機嫌な人に依頼したくなるのが自然な感覚である』。その通りだと思う。『一緒に働く者同士が、労働を楽しいひとときととらえ、内側から湧き上がる喜びのメッセージを出し続ける』。世の中がこんな人々で溢れていたらなと思う。

 就活の軸について考えることがあるが、私は心からこのような人に囲まれて過ごしたい。どのようなコミュニティにも良い人間関係無しに居続けることはできない。どんな状況でも笑顔でいること、上機嫌でいることは決して簡単ではない。しかし「きついのを顔や声に出さない」ことでなんとなく自分が強くあれる気がする。ポジティブ思考はいつまでも大切にしていきたい。

終わりに

 社会人になる前のこの時期にこの本と出会うことができて良かったと思う。

 『ミッション・パッション・ハイテンション』を働く上での原則だけにとどめず、一つの集団を盛り上げる言葉として取り入れていた部活の顧問は今まで出会った「先生」の中で最も尊敬できる人だった。

 働くことは決して万人にとってポジティブなことではないかもしれないが、どうせ働くからにはこの3つの言葉を心に留め、社会人としてだけではなく一人間としてもこの言葉を実践できるようになりたい。

books.bunshun.jp

2024年、AIハードウェアの現在地 〜 Humane Ai Pin・rabbit r1・Brilliant Labs Frame・Open Interpreter 01・Rewind Pendant・Tabから考える〜

はじめに

B4の坂村です。 今回は発展目覚ましく、私が動向を追っているAIハードウェアについて深掘りします。

AIを主軸に置いたハードウェアは、ChatGPTの登場から1年経過した2023年後半から現在にかけて多く発表されており、実現可能な処理やその形状はさまざまで、中にはスマートフォンを置き換えようとするものまであります。今回はそれらをまとめることでAIファーストのハードウェアがどのようなものかを考えます。

今回紹介するAIハードウェア一覧

少し見づらいですが表にしてみました。情報のインプット方法や形状、プロジェクトのスタンスなどがさまざまなのがわかります。拡大してご覧ください!

AIハードウェアリスト
AIハードウェアリスト

フォームファクターについて

スマートフォンは、その機能はもちろん、一面のタッチスクリーンという形状がガラケーを置き換えたと言っても過言ではありません。つまり、その形状は機能と同等に影響力を持つということです。では、AIハードウェアはどのような形状(フォームファクター)を持つのでしょうか。

AIはコンピュータの処理を自然言語で行うため、アプリケーションという概念を取り払って処理を行うことができると言われます。となると必ずしも一面のタッチスクリーンが必要でないかもしれません。

以下に紹介するハードウェアの多くがウェアラブル端末として設計されていることはとても面白い状況だと考えます。ウェアラブル端末は体に着用するためサイズや機能が制限されがちですが、AIによって形状から制限を取り払われると大きな効果を発揮するのではないでしょうか。

AIの発達と同時に通信技術の発展により、データの処理をローカル上で行う必要がなくなったこともこの現象の一端を担っています。実際、多くがローカルで処理を行わずにサーバーやスマートフォンを利用して処理を行っています。

つまり、AIと通信技術の双方が発展したことによってウェアラブル端末にその可能性が託されたわけです。

では、実際にその例を見てみましょう。

AIの利用の仕方について

ひとくちにAIハードウェアと言っても多くのパターンが存在します。今回はこれらを2つに大別してご紹介します。

ユーザからのリクエストを元に処理を実行

Humane Ai Pin・rabbit r1・Brilliant Labs Frame・Open Interpreter 01

スマートフォンと同様、ユーザは能動的に望む処理をリクエストします。 これらは基本的に現在目にするChatGPTなどの機能を活用し、自然言語によって検索や操作を行うことができます。

利点:AIとの会話にコンテキストを持ち込める

Web上のインターフェースと異なり、ユーザについての情報や前後のリクエスト、現在地などのリアルタイムな情報を前提にリクエストを処理することが可能です。

問題点:スマートフォンに対する優位性が少ない

一見すると多くの優位性を持つように見えますが、実態は音声コマンドによってアプリケーションを動作させられることに留まり、個別の仔細な要望に応えているスマートフォンのアプリケーション群と比較するとまだまだできることは少ないのが現状です。

セカンドブレインとして動作

Rewind Pendant・Tab

スマートフォンを置き換えようとしたり、機能を拡張させようとするのが上記のものですが、こちらは少し違います。

ウェアラブル端末であることを前提とすることで、ユーザについての情報を常に収集して記憶の補助やアシスタントとして機能するのがこちらです。

利点:コンピュータの「記憶力」の活用

記憶とはコンピュータが人間に対して圧倒的な優位性を持つ領域であり、AIがこれらのデータを活用することでその優位性を増幅することができます。

問題点:プライバシー

データを集め続ける必要があるという特性上、プライバシーが付き物です。これをどう解決するかはどこも明確な答えを持っていません。

実際のAIハードウェアの紹介

では、実際に現在発表されているハードウェアを紹介します。この市場は発展目覚ましく漏れがあるとは思いますが、大きなプロジェクトはカバーできていると思います。(今回は大企業のプロジェクトは省いています)

Humane Ai Pin

2023年11月発表。

現在発表されているAIハードウェアの中で唯一スマートフォンをリプレイスする可能性をもつ。ウェアラブルな端末は、音声コマンドやジェスチャーで電話やテキストメッセージなどを行うことができるほか、Laser Ink Displayによって手に情報を映し出すことが可能。AIを効果的に使うことでスマートフォンによってもたらされた多くの煩わしい事柄から解放されることを大きなメリットとして挙げるほか、AIはローカルで動作するためAIに付き物のプライバシー問題も解消していると言える。

humane.com

rabbit r1

2024年1月発表。

独自の概念LAM(Large Action Model)によって既存のアプリケーションのUIの操作方法を学習し、ユーザの代わりに操作する。r1も音声コマンドを主な操作方法とし、スマートフォンと同様液晶ディスプレイに情報を表示する。特徴的なハードウェアデザインだが、可能なことは限りなくスマートフォンに近い。通話などには対応していない。AIはサーバーによって動作する。

www.rabbit.tech

Brilliant Labs Frame

2024年1月発表。

メガネ型のウェアラブル端末。スマートフォンと接続することで動作し、カメラとマイクから指示を受付け、テキストと画像による出力はレンズ上に表示される。メガネ型の利点は最も顔に近い形状であることで情報へのアクセスが容易なことと端末の取り出しが不要なこと。処理をスマートフォン経由で行うことでハードウェア自体を軽量にし、スマートフォンと共存させることは使用上の多くの問題点に対する現実的な解決策。完全なオープンソースプロジェクトでもあり、ソフトウェアだけでなくハードウェアのCADデータまで公開するなど、ユーザコミュニティによる開発の促進を狙っていることも特徴。

brilliant.xyz

Open Interpreter 01 Light

2024年3月発表。

rabbit r1のオープンソースバージョンを作ることを目的としたプロジェクト。Open Interpreter自体は2023年9月に公開されたプロジェクトで、PCのローカル上で動作し、AIを使用してコマンドライン上からPCの操作を可能にしたもの。2024年3月に発表された01 Lightは音声コマンドの入力装置として外部ハードウェアを使用し、サーバーとして動作するPCの操作を行うことができる。PCの操作方法を音声でAIに学習させることができる。完全にローカル動作する01 Heavyも開発中で、Frameと同じくソフトウェアからハードウェアまで全てがオープンソースで公開されている。

www.openinterpreter.com

Rewind Pendant

2023年9月発表。

PCやスマートフォン上での操作記録を記憶するRewindというソフトウェアを元にしたプロジェクト。ペンダント型で会話を記録し、それらを検索することができる。PCなどの操作記録と併せて検索可能になると予想されるため、実質的に生活上自分が接したほとんどの情報に対して検索を行うことができる。会話の記録はユーザによって承認されたもののみで、データはスマートフォンローカルに保存される。

www.rewind.ai

Tab

2023年10月発表。

ペンダント型で会話を記録する。Rewindと異なる点は常時録音する点と、そのデータの活用方法にある。ユーザが能動的に検索をするだけでなく、AIをパーソナルなアシスタントとして機能させ、会話の記録から必要な情報を必要なときにスマートフォンに通知したり、ユーザの会話からメンタル上の問題などを推測することでユーザのことを100%知るセラピスト的な役割を果たす。

mytab.ai

その他の色々なウェアラブルバイス

先にも述べた通り、処理をローカルに依存しないこれらは簡素な技術でも実現可能なことから多くのプロジェクトを産んでいます。これらは上記のものにインスパイアされたものも多く、まさに黎明期といった感じです。

Friend

2024年3月25日発表。

多くのペンダント型デバイスが高価かつクローズドプロジェクトであることを批判して作られたオープンソースプロジェクト。

github.com

Compass

2024年3月24日発表。

tone

2024年3月27日発表。

tone.computer

Tap

2024年3月16日発表。

heytap.tech

最後に

OpenAIなどのAPIを呼び出すだけで多くのことが実現可能なAIの領域において、ハードウェアはその形を模索されている真っ只中です。この記事を執筆時点ではユーザによって触られていないものがほとんどでどのかたちが適切なのかはまだ誰もわかっていません。

また、複数がオープンソースプロジェクトであることも特筆すべき点だと考えます。ハードウェアでありながらその設計自体の余地をユーザに委ねるというのも面白い動きです。

ChatGPTの登場から約1年でこれほど多くのプロジェクトが立ち上がっていることを鑑みると、その影響力には驚かされます。また、これらの技術単なるがチャットボットに収まらないことは明白です。

今後も動向を追っていきたいです。

東京都立大学での学生生活を振り返って

はじめに

こんにちは。
修了式を無事終え、明日4/1から社会人となる及川です(3/31執筆)。

修了式では、高校2年生の夏に撮った写真と同じ画角で写真を撮りました。

f:id:jun7a:20240331225933j:image
この6年間で、個性的な同期や個性的な先生方から多くの刺激を貰いながら、様々な経験ができました。
話が散らかってしまいそうですが、この6年間での心に残っている出来事を振り返りたいと思います。

 

授業

まず1つ目は、なんと言ってもたくさんの授業です。  

インダストリアルアート学科・学域の授業では、講義形式のものは少なく、グループワークや個人での制作が多くあります。この制作の過程を通して様々なことを学びました。それは、デザインに関する事だけでなく、グループにおける立ち回りやスケジュール管理など、今後も役立つようなことばかりでした(とはいえ、スケジュール管理はまだまだ問題ですが笑)。締切直前まで、良いものを作ろうとするあまり徹夜をすることも数多くありましたが、これも良い思い出となっています。私は一人暮らしをしていたので、私の家に友達を招き、夜な夜な課題に取り組んだのが懐かしいです。(ちなみにこの徹夜のことを、「インダスナイト」と呼んでいます。先輩から引き継いだ訳では無いのに、気づいたらどの代もそう呼んでいるのが不思議ですね。)

 

卒展

2つ目は、卒業展示です。  
学部4年生と、大学院2年生の3月に学科・学域で卒業制作展を行いました。会場は東京都美術館です。この卒展には多くの来場者のみなさんが来てくださり、感想や質問を直接いただく貴重な経験ができました。自分の作品を見てもらう機会というのは、なかなか経験できないことだと思います。卒展を通して、自分の作品を体験してもらうことができたことを嬉しく思います。また、卒展に向けた準備も思い出となりました。みんなでバタバタと何かを用意するのは最後か…と少し寂しい気持ちもありつつ、パネルやアプリケーションの用意を進めました。最終的に、大きなトラブルもなくワイワイ楽しく卒展を終えることが出来、ほっとしています。

 

海外留学・海外旅行

3つ目は、海外留学・海外旅行です。  
大学1年生のときに、大学生協が主催するWalt Disney World(アメリカ・フロリダ州)でのワークショップに参加しました。このワークショップの旅程は全部で9日間程度で、4つのパークに自由に行き来することが出来ました。ずっと夢見ていた海外のディズニーパークに行けることが本当に幸せでしたし、現地の方からウォルト・ディズニーの精神などについてレクチャーを受けることが出来る大変貴重な機会でした。また、ここで出会った他の大学の方々とは、Instagramを交換し今でも刺激をもらっています。  
大学2年生の時には、カナダのトロントへ2ヶ月間短期語学留学をしました。大学は休学せず、夏休みをフルに使っての留学でした。航空券の手配や滞在先を自分で手配し、1人で長いフライトに耐え、入国審査を通過することから始まったこの経験は、私を強くしたように思います。ここでは、世界各国から集まった留学生と交流し、日本と海外の暮らしの違いをヒシヒシと感じました。また、日本・韓国・メキシコの友人それぞれ2名ずつで集まった際に、同じ出身国の者同士で母国語で会話をしたあと、みんなで英語で話し始めました。その時に、全然違う言語で考えていたことを共有できる英語ってすごいな!と思いました。短期留学を通して、「人生変わった!」とは思いませんが、じわじわと私の価値観にプラスな影響を及ぼしていると感じています。  
大学院1年生の時には、アメリカ・ロサンゼルスへ、大学院2年生の時には、シンガポールギリシャへ旅行しました。  
この旅行達のために、授業や研究以外の時間はアルバイトに時間を費やすことになりましたが、大学生のうちにいろんな所へ行くことが出来て良かったと思います。海外での生活に憧れていたこともありましたが、今の気持ちとしては、たまに旅行に行って刺激を貰うくらいがちょうどいいんだろうなと考えています。社会人は「お金はあるが時間が無い」とよく言いますが、今後も何とか時間を作り出して海外旅行に行きたいと思っています。

 

おわりに

今回は、大学・大学院での思い出を振り返りました。この6年間は本当に貴重で大切なものとなりました。明日から社会人として、頑張っていきたいと思います。
杉本先生、同期のみんな、ありがとうございました!

僕とジェネラティブアートの5年間

目次

はじめに

unTie by Samuel YAN

 こんにちは、M2のアンです。前回のゼミで、先生からM2の3人に最後の一篇のブログを頼まれました。そのときから、ずっとブログの内容に悩みました。でも、それをきっかけとして2019年4月から今までの日本での生活をもう一回脳の中で廻しました。その5年間、日本で色々勉強させていただきました。自分としては充実と激変の5年でした。では、今回のすぎもと組での最後のブログは僕とジェネラティブアートの5年間について少し詳しく話します。

2019:Processingとの出会い

 2019年3月に上海での仕事をやめて、4月に来日しました。未来の進路を考えたとき、知り合いからProcessing、TouchDesigner、vvvvなどを初めて知りました。大学時代(2009〜2013)に学校の講義でC言語を勉強したことがあります。そのため、自信を持ってProcessingの勉強を始めました。

2019年5月10日に投稿したインスタのスクリーンショット

 そのとき、日本語学校に通って日本語の勉強もともにしてました。日本語とProcessingを一緒に勉強できたらお得だと思って、日本語版のProcessingについての書籍を探しました。秋葉原書泉ブックタワーで「Processing:ビジュアルデザイナーとアーティストのためのプログラミング入門」を見つけました。税込7,700円の価格にびっくりしました。日本の書籍は高いというイメージも残っています。

書籍の表紙のスクリーンショット 出典:BNN

 しかし、2019年は、Processingに興味があり、ときどき勉強したり練習したりするだけでした。

2020:Processingと研究の繋がり

 2020年の10月から研究生として、東京都立大学の杉本先生のもとで研究活動を始めました。先生と相談したうえ、Processingを使って幾何学図形についての研究と制作を開始しました。そのとき、円についての研究と作品制作するため、真剣にProcessingを使って作品制作に試行錯誤しました。未熟な作品の「円と声」「集団の声」「さまざまな声」「少数者の声」などを制作しました。ちなみに、プロフィールアイコンとして使っている画像はその期間で制作した「集団の声」のアウトプットの1つです。

プロフィールアイコン

2021:Processingからp5.jsへ・NFTの試み

 2021年の2月から、p5.jsの勉強を始めました。

最初のp5.jsの試作のスクリーンショット

 いろいろな学習資料を探すとき、書籍の「Generative Design with p5.js」とサイトのOpenProcessingを発見しました。takawoやChe-Yu WuなどのOpenProcessingで活躍しているアーティストたちを知りました。そのあと、毎日OpenProcessingで皆様が公開している作品のソースコードを見て分析しながらp5.jsを勉強することがルーティンになりました。少し時間が経って、2021年10月19日に作品の「Shape of CONNECT 001」と「Shape of CONNECT 002」をOpenProcessingに投稿しました。

「Shape of CONNECT 001」のスクリーンショット

 そのあとの11月23日にOpenProcessingからのメールが届きました。メールの内容はOpenProcessingが運営しているジェネラティブアートNFTプラットフォームのCrayonCodesに出品の誘いでした。恐ろしくなりながら「興味があります。詳しく教えて頂いてもよろしいでしょうか」と返事しました。そして、12月に私の最初のNFT作品の「MEMOs」がリリースされました。

MEMOs by Samuel YAN

 そのとき、reona396、Che-Yu Wu、Vamoss & Anastácio、Ricard Dalmau、takawo、Senbaku、Okazz、Aleksandra Jovanić、Clay Heaton、Jerome Herr、Sayo、kusakariと一緒に出品されてすごく光栄です。

2022:dailycodingと研究

 takawoさんのdailycoding活動に影響を受けて、Genuary2022をきっかけとして、真面目にdailycodingを始めました。2022年4月から、東京都立大学大学院に進学して院生としての研究活動も開始しました。そのため、学校に集中して、学外の活動にあまり参加していませんでした。学外の活動は主に2つありました。1つは、Neurographyのメンバーとして100BANCHに選出されたプロジェクトの「脳波からリアルタイムNFTアートを生成。 唯一無二のものとして主観を永続させる。」に参加しました。もう1つは、中国の小紅書(RED)のデジタルアートを販売するプラットフォームの「R-SPACE」にシリーズ作品の「Sands」「印象の城」と「Urban ME」を出品しました。

2023:ジェネラティブアーティストとして活躍

 2023年は自分にとって激変の一年でした。ジェネラティブアーティストとしてたくさんの学外の活動に参加させていただきました。

 その1年間、さまざまなワークショップや展示会などに参加して、いろんなアーティスト、コレクター、鑑賞者、主催や運営の方たちと出会って良かったと思います。みんなにお世話になりました。今年もよろしくお願いいたします。

さいごに

 5年間の生活と変化を一気に振り返って見ると感慨深いです。そのなかで、一番印象に残って私に影響を与えているのは指導教員の杉本先生の2つの言葉です。それは「発信する力」と「ゼロから始める勇気」です。その2つの言葉を信じて、dailycodingを行っています。そしてこれからも、新しいものに好奇心を持って、失敗しても試行錯誤し続けてゆくと思います。