
巨大な自律型倉庫内では、数百台のロボットが通路を駆け巡り、商品のピッキングと配送を行い、絶え間なく続く顧客の注文に応えています。この混雑した環境では、小さな交通渋滞や小さな衝突でも、大幅な速度低下につながる可能性があります。
このような非効率の雪崩を避けるために、MIT とテクノロジー企業 Symbotic の研究者たちは、ロボット群を自動的にスムーズに動かし続ける新しい方法を開発しました。彼らの手法は、渋滞の発生状況に基づいて各瞬間にどのロボットを最初に進めるべきかを学習し、行き詰まりそうなロボットを優先するように適応します。このようにして、システムは事前にロボットのルートを変更してボトルネックを回避できます。
ハイブリッド システムは、複雑な問題を解決するための強力な人工知能手法である深層強化学習を使用して、どのロボットを優先すべきかを判断します。高速で信頼性の高い計画アルゴリズムがロボットに命令を送り、刻々と変化する状況にロボットが迅速に対応できるようにします。
実際の電子商取引倉庫のレイアウトにヒントを得たシミュレーションでは、この新しいアプローチは他の方法と比べてスループットが約 25% 向上しました。重要なのは、このシステムは、ロボットの数や倉庫のレイアウトが異なる新しい環境にもすぐに適応できることです。
「製造業や物流業では、企業が人間の専門家によって設計されたアルゴリズムに依存しているため、多くの意思決定の問題があります。しかし、深層強化学習の力を使えば、超人的なパフォーマンスを達成できることを示しました。これは非常に有望なアプローチです。なぜなら、これらの巨大な倉庫では、生産量が 2 ~ 3% 増加するだけでも、学生やデータに精通した学生に大きな影響を与える可能性があるからです。」と Han Zheng 氏は言います。 MIT の Decision Systems (LIDS) であり、この新しいアプローチに関する論文の筆頭著者です。
Zheng 氏の論文には、LIDS の博士研究員である Yening Ma 氏も参加しています。 Symbotic の Brandon Araki 氏と Jingkai Chen 氏。および主著者である Cathy Wu 氏は、1954 年卒業生で、MIT 土木環境工学 (CEE) およびデータ・システム・社会研究所 (IDSS) のキャリア開発准教授であり、LIDS のメンバーでもあります。この研究は今日、 人工知能研究ジャーナル。
ロボットのルーティング
電子商取引倉庫内で数百台のロボットを同時に調整するのは簡単な作業ではありません。
倉庫は動的な環境であり、目的地に到着したロボットには常に新しいタスクが与えられるため、この問題は特に複雑です。倉庫のフロアに出入りする人を素早く誘導する必要があります。
企業は多くの場合、人間の専門家によって作成されたアルゴリズムを活用して、ロボットが処理できる荷物の数を最大化するためにロボットがいつどこに移動すべきかを決定します。
しかし、混雑や衝突が発生した場合、手動で問題を解決するために倉庫全体を何時間も停止せざるを得なくなる可能性があります。
「この枠組みでは、将来について正確な予測はできません。私たちが知っているのは、到着する荷物や将来の注文の配分という点で、将来何が起こるかだけです。倉庫活動が続く限り、計画システムはこれらの変化に適応する必要があります。」と Zheng 氏は言います。
MIT の研究者は、機械学習を通じてこの適応性を実現しました。彼らは、倉庫環境を観察し、ロボットの優先順位を決定するためのニューラル ネットワーク モデルを設計することから始めました。彼らは、深層強化学習を使用してこのモデルをトレーニングします。これは、モデルが実際の倉庫を模倣したシミュレーションでロボットを制御する方法を学習する試行錯誤の方法です。モデルは、競合を回避しながら全体の生産性を向上させる意思決定を行うことで報酬を受けます。
時間が経つにつれて、ニューラル ネットワークは多くのロボットを効率的に調整する方法を学習します。
「実際の倉庫のレイアウトにインスピレーションを得たシミュレーションと対話することで、私たちのシステムはフィードバックを受け取り、それを使用して意思決定をよりインテリジェントに行うことができます。トレーニングされたニューラル ネットワークは、異なるレイアウトの倉庫に適応することができます」と Zheng 氏は説明します。
これは、倉庫内を移動するロボット間の動的な相互作用を考慮に入れて、各ロボットの経路にある長期的な制約や障害物を捕捉するように設計されています。
このモデルは、現在および将来のロボットのインタラクションを予測することで、渋滞が発生する前に回避することを計画しています。
ニューラル ネットワークがどのロボットを優先するかを決定した後、システムは経験豊富な計画アルゴリズムを使用して、ある地点から別の地点に移動する方法を各ロボットに指示します。この効率的なアルゴリズムにより、ロボットは変化する倉庫環境に迅速に対応できます。
この方法の組み合わせが重要です。
「このハイブリッド アプローチは、機械学習と従来の最適化手法の両方を最大限に活用する方法に関する私のグループの研究に基づいています。純粋な機械学習手法は、依然として複雑な最適化問題を解決するのに苦労していますが、人間の専門家が効率的な手法を設計するには非常に時間と労力がかかります。しかし、専門家が設計した手法を一緒に使用することで、正しい方法で機械のタスクを大幅に簡素化できます。」
複雑さを克服する
研究者らはニューラルネットワークを訓練した後、訓練中に見たものとは異なる模擬倉庫でシステムをテストした。この複雑な問題に対して産業用シミュレーションはあまり効果的ではなかったため、研究者らは実際の倉庫で起こっていることを模倣するように環境を設計しました。
同社の学習ベースのハイブリッド アプローチは、各ロボットに配信されるパケット数の点で、従来のアルゴリズムやランダム検索方法よりも平均して 25% 高いスループットを達成しました。彼らのアプローチは、従来の方法によって引き起こされる混雑を克服した現実的なロボットの経路計画を生成することもできます。
「特に倉庫内のロボットの密度が増加すると、複雑さが指数関数的に増大し、これらの従来の方法はすぐに機能不全に陥り始めます。このような環境では、私たちの方法ははるかに効率的です」と Zheng 氏は言います。
彼らのシステムはまだ現実世界への展開にはほど遠いものの、これらのデモンストレーションは、倉庫自動化におけるガイド付き機械学習アプローチの使用の実現可能性と利点を強調しています。
どのロボットが各タスクを完了するかは混雑に影響するため、研究者らは将来的には、問題の定式化にタスクの割り当てを含めたいと考えている。また、数千台のロボットを備えたより大きな倉庫にシステムを拡張することも計画しています。
この研究は Symbotic から資金提供を受けました。