生成 AI を使用してロボットがより高くジャンプし、安全に着地できるようにする

OpenAI の DALL-E のような普及モデルは、新しい設計のブレインストーミングを支援する上でますます有用になってきています。人間はこれらのシステムに画像を作成したり、ビデオを作成したり、計画を修正したりするよう指示し、これまで考えもしなかったアイデアを導き出すことができます。

しかし、生成人工知能 (GenAI) モデルは、作業ロボットの作成においても進歩していることをご存知ですか?最近の拡散ベースのアプローチでは、構造とそれを制御するシステムがゼロから作成されました。ユーザー入力の有無にかかわらず、これらのモデルは新しい設計を生成し、製造前にシミュレーションで評価できます。

MIT のコンピューターサイエンスおよび人工知能研究所 (CSAIL) による新しいアプローチは、この創造的な知識を応用して人間のロボット設計を改善します。ユーザーはロボットの 3D モデルを作成し、事前に寸法を指定して古い普及モデルを見たい部分を指定できます。次に、GenAI はこれらの領域に最適な形状をブレインストーミングし、そのアイデアをシミュレーションでテストします。システムが適切な設計を見つけたら、保存して 3D プリンターで現実世界の作業ロボットを製造できます。それ以上の変更は必要ありません。

研究者らはこのアプローチを使用して、平均約 2 フィート、つまり自分たちで作った同様のマシンよりも 41% 高く跳躍するロボットを作成しました。両方の機械の外観はほぼ同じで、どちらもポリ乳酸と呼ばれるプラスチックの一種でできており、最初は平らに見えますが、取り付けられたワイヤーをモーターで引っ張るとひし形に跳ね上がります。では、AI は具体的に何が違うのでしょうか?

よく見ると、AI が生成したリンクは曲がっていて太いドラムスティック (ドラマーが楽器を使用します) に似ていますが、標準的なロボットの接続部分は直線で長方形であることがわかります。

ますます汚れが良くなります

研究者らは、初期埋め込みベクトル (AI モデルによって生成された設計を導くための高レベルの特徴を捕捉する数値表現) を使用して 500 の潜在的な設計をサンプリングすることで、ジャンプロボットの改良を開始しました。これらの中から、シミュレーションパフォーマンスに基づいて上位 12 のオプションを選択し、それらを使用して埋め込みベクトルを最適化しました。

このプロセスは 5 回繰り返され、AI モデルがより良いデザインを作成するように徐々に導かれました。結果として得られるデザインはブロックに似ているため、研究者らはシステムにドラフトを 3D モデルに一致させるよう依頼しました。その後、その形状を作成したところ、ロボットのジャンプ能力が向上することがわかりました。

共著者で CSAIL ポスドクの Byungchul Kim 氏によると、このタスクに拡散モデルを使用する利点は、ロボットを完成させるための型破りなソリューションを見つけられることです。

「マシンをより高くジャンプさせたかったので、部品を接続するリンクをできるだけ薄くして軽量にできると考えました」とキム氏は言います。「しかし、このような薄い構造は、3D プリントした材料だけを使用すると簡単に壊れてしまいます。私たちの拡散モデルは、リンクをあまり薄くせずに、ロボットがジャンプする前により多くのエネルギーを蓄えることができる独自の形状を提案することで、より良いアイデアを思いつきました。この創造性は、私たちが機械の基本的な物理学について学ぶのに役立ちました。」

次にチームは、安全に着地するために最適な足をプロットするようシステムに課しました。彼らは最適化プロセスを繰り返し、最終的にはマシンの底部に取り付ける最高のパフォーマンスの設計を選択しました。 Kim 氏と彼の同僚は、AI マシンの低下率がベースラインよりもはるかに低く、84% の改善率であることを発見しました。

ロボットのジャンプと着地スキルを向上させる普及モデルの能力は、他の機械の設計方法を改善するのに役立つ可能性があることを示唆しています。たとえば、製造ロボットや家庭用ロボットに取り組んでいる企業は、同様のアプローチを使用してプロトタイプを改善することができ、通常、それらの変更を繰り返すために確保されているエンジニアの時間を節約できます。

バウンスの背後にあるバランス

高くジャンプして安定して着地できるロボットを作成するには、研究者らは 2 つの目標のバランスを取る必要があることを認識しました。彼らは、ジャンプの高さと着地成功率の両方を数値データとして表し、最適な 3D 構造の構築に役立つ 2 つの埋め込みベクトル間のスイートスポットを見つけるようにシステムをトレーニングしました。

研究者らは、AIを活用したロボットは人間が設計したロボットを上回っているが、近いうちにさらに新たな高みに達する可能性があると指摘している。今回のバージョンでは 3D プリンターと互換性のある素材の使用が特徴でしたが、将来のバージョンではより軽量な素材を使用してさらに飛躍する予定です。

筆頭著者であり、MIT 博士課程の学生であり、CSAIL パートナーでもある Tsun-Hsuan “Johnson” Wang 氏は、このプロジェクトは、生成人工知能が役立つ新しいロボット設計の出発点であると述べています。

「私たちは、より柔軟な目的地に事業を拡大したいと考えています」とワン氏は言います。「自然言語を使用して普及モデルをガイドし、マグカップを持ち上げたり電気ドリルを操作したりできるロボットを定式化することを想像してください。」

キム氏は、拡散モデルは関節を作成したり、部品がどのように組み合わされるかを考えたり、ロボットがジャンプする高さを改善したりするのにも役立つと述べています。チームはまた、マシンがどの方向にジャンプするかを制御し、着陸の安定性を向上させるために追加のモーターを追加する可能性も検討しています。

研究者らの研究は、とりわけ、国立科学財団の研究革新プログラムの新興フロンティア、シンガポール・MIT研究技術アライアンスのメンズ・マヌス・アンド・チャイナ・プログラム、光州科学技術大学（GIST）とCSAILの協力によって支援された。彼らは、2025 年のロボティクスとオートメーションに関する国際会議で研究成果を発表しました。