Manus創業者が語る「能動的な」AIエージェント
日本国内でも注目が高まっているAIエージェントサービス「Manus」のセッションでは、共同創業者兼CPOのTao Zhang氏が登壇した。氏は現在のAIエージェントについて「能動性(Proactivity)が欠けている」と指摘する。
その観点に立ち、ユーザーの指示を待つのではなく、AIが自律的に動くプロトタイプの検証を社内で進めているという。例えば、ユーザーの毎日のタスクをAIが事前に洗い出し、朝起きた時にはすでに面倒なタスクが完了している、といった具合だ。
Runway CEOが予見する「世界モデル」の可能性
動画生成AIサービス「Runway」の共同創設者兼CEO、Cristóbal Valenzuela氏のセッションでは、生成AIにおいてLLMの次のフロンティアとして注目を集める「世界モデル」について語られた。
世界モデルとは、AIが環境やルールを観測によって学習(+予測)するもので、「子どもの知能」に例えられ、自動運転やロボティクスなどのフィジカルAI領域での活用が期待されている。動画生成AIはある種の現実世界のシミュレーションとして機能しており、高度な世界モデルの足がかりとして注目されている。
Valenzuela氏はこの世界モデルについて、テキスト生成におけるGPT-3の登場時のような「爆発的進化の前夜」にあり、今後現実世界に基づいてシミュレーションしたり、インタラクションしたりすることが可能になるという。
現在、私たちは何かを学ぶときにテキストや動画を見て、一方通行の学習をすることが多い。しかし将来的には、自分用にカスタマイズされたビデオや物語、ゲームがリアルタイムに生成され、ユーザーは世界を探索・体験しながら学ぶようになると氏は予見する。世界モデルは、コンテンツの定義を拡張する可能性を秘めている。
Amazon Roboticsチーフテクノロジストが示す「フィジカルAI」の未来像
前述の「フィジカルAI」は今後一層の発展が見込まれている。この領域をリードするのが、世界中の倉庫ですでに100万台以上のロボットを稼働させている Amazon だ。
Amazon Roboticsのチーフテクノロジスト・Tye Brady氏は、動き・バランス・流れといった「文法」を学習するAIを、LLMになぞらえて 「Large Motion Model(大規模動作モデル)」と呼称した。移動距離の最適化に加え、触覚センサーを備えたロボットが商品のピッキングを行うことで、従業員は重量物の運搬や高所作業から解放され、安全性も向上しているという。
Brady氏は、AIはあくまで 「Assisted Intelligence(支援知能)」 であるべきだと述べる。人間を置き換えるのではなく、人間をサポートし、新たな雇用を創出する存在であるとして、Amazonが米国で最大の雇用を生み出している実績を挙げ、「AIが仕事を奪う」という論調への反論を示した。
ここまで紹介したセッションを聴講する中で、筆者は2025年のCES(コンシューマー・エレクトロニクス・ショー:米ネバダ州ラスベガスで毎年1月に開催される、世界最大級のテクノロジー見本市。AI、モビリティ、ヘルスケアなど、多岐にわたる分野の最新技術が発表される場であり、世界中の企業が新製品やプロトタイプを披露する)におけるNVIDIA CEO・Jensen Huang氏のキーノートスピーチを想起していた。
そこでは、AIが 「認識AI」→「生成AI」→「エージェントAI」→「フィジカルAI」 と進化するビジョンが示されていた。しかし、今回のWeb Summitでの議論を通じ、その進化は(少なくとも各産業レベルにおいては)それほど単純な一本道ではない、という印象を強くした。

- 1
- 2




メルマガ登録

