人工知能とロボット工学のおかげで、物体を要求して数分でそれを作成できる日がますます近づいています。実際、MIT の研究者らは、ロボット アームに入力して「物体を音声で存在させる」ことを可能にする AI 主導のワークフローである音声現実システムを開発し、わずか 5 分で家具などを作成しました。
音声認識システムを使用すると、テーブルに取り付けられたロボット アームが人間からの音声入力 (「シンプルなスツールが欲しい」など) を受け取り、モジュール式コンポーネントからオブジェクトを構築できます。これまでに、研究者らはこのシステムを使用して、スツール、棚、椅子、小さなテーブル、さらには犬の像などの装飾品を作成しました。
「私たちは自然言語処理、3D 人工知能、ロボットの組み立てを結びつけています」と、MIT 大学院生でモーニングサイド アカデミー オブ デザイン (MAD) フェローのアレクサンダー ハット ケオ氏は言います。 「これらは急速に進歩している研究分野ですが、単純な音声プロンプトから実際に物理的なオブジェクトを作成できるような方法にはまだまとめられていません。」
ビデオを再生する
現実を語る: AI、3D ジェネレーター、個別のロボット アセンブリを使用したオンデマンド生産
このアイデアは、建築、電気工学、コンピューター サイエンスの大学院生である Keo が、ニール ガーシェンフェルド教授の「ほぼすべてのことを行う方法」というコースを受講したときに始まりました。その能力において、彼は音声システムを現実に構築しました。彼は、ガーシェンフェルドが監督する MIT ビット・アンド・アトムセンター (CBA) で、機械工学科の大学院生 Se Hwan Jeon および CBA の Myanna Smith と協力して、プロジェクトに取り組み続けました。
音声現実システムは、大規模な言語モデルを使用してユーザーのリクエストを処理する音声認識から始まり、オブジェクトのデジタル ネットワーク表現を作成する 3D ジェネレーター AI、および 3D ネットワークをアセンブリ コンポーネントに分解するボクセル化アルゴリズムが続きます。
次に、幾何学的処理により、コンポーネントの数、拡張子、ジオメトリの接続性など、現実世界の製造と物理的制約が考慮されるように、AI で生成されたアセンブリが変更されます。その後、組み立てシーケンスの作成が可能になり、ユーザーの指示に従ってロボットアームが物理的なオブジェクトを組み立てる経路を自動的に計画します。
このシステムは自然言語を活用することで、3D モデリングやロボット プログラミングの専門知識を持たない人でも設計や製造にアクセスできるようにします。また、数時間または数日かかる 3D プリントとは異なり、このシステムは数分で構築されます。
「このプロジェクトは、人間、人工知能、ロボットの間のインターフェースであり、私たちの周りの世界を共同創造します」と Keo 氏は言います。 「『椅子が欲しい』と言うと、5分以内に物理的な椅子が目の前に現れるというシナリオを想像してみてください。」
チームは、ブロックの接続方法を磁石からより強力な接続に変更することで、家具の耐荷重能力を向上させる当面の計画を立てています。
「私たちはボクセル構造を小型の分散型モバイル ロボットの実現可能な組み立てシーケンスに変換するためのパイプラインも開発しました。これは、この作業をあらゆる規模の構造に変換するのに役立ちます」と Smith 氏は言います。
モジュール式コンポーネントを使用する目的は、物理的なオブジェクトを分解して別のものに再組み立てすることで、物理的なオブジェクトの製造に伴う無駄を排除することです。たとえば、ソファが不要になったらソファをベッドに変えるなどです。
Keo 氏は、製造プロセスでロボットと対話するためにジェスチャ認識と拡張現実を使用した経験があるため、現在、音声とジェスチャの制御を音声合成システムに統合することに取り組んでいます。
ケオは、『スタートレック』シリーズのレプリカントやアニメ映画『スーパーヒーロー 6』のロボットの思い出をもとに、自分のビジョンを説明します。
「人々が物理的なオブジェクトを迅速かつアクセスしやすく持続可能な方法で作成できるようにしたいと考えています」と彼は言います。 「私は、物質の本質そのものが真に制御できる未来、オンデマンドで現実を創造できる未来に向けて取り組んでいます。」
同チームは、11月21日にMITで開催されたSociety for Computing Machinery (ACM) のComputational Manufacturing Symposium (SCF ’25)で論文「Speech to Reality: On-Demand Manufacturing using Natural Language, 3D Generative AI, and Discrete Robotic Assembly」を発表した。