ロボットによる液体の取り扱いを支援する
前の画像 次の画像
風の強い日に川岸でピクニックを楽しんでいると想像してみてください。 突風が誤って紙ナプキンを巻き込み、水面に落ち、すぐにあなたから離れていきます。 近くにある棒をつかんで慎重に水をかき混ぜ、一連の小さな波を作りながら水を回収します。 これらの波は最終的にナプキンを岸に押し戻すので、あなたはそれをつかみます。 このシナリオでは、水が力を伝達する媒体として機能するため、直接接触せずにナプキンの位置を操作できるようになります。
人間は日常生活の中でさまざまな種類の流体と定期的に関わっていますが、これは現在のロボットシステムにとっては手ごわい、とらえどころのない目標となっています。 ラテを渡しますか? ロボットならそれができる。 成功する? それにはもう少しニュアンスが必要になります。
MIT コンピューター科学・人工知能研究所 (CSAIL) の研究者による新しいシミュレーション ツールである FluidLab は、ラテアート、アイスクリームの作成、さらには空気の操作など、複雑な流体操作タスクのロボット学習を強化します。 仮想環境は、固体と液体の両方、および複数の流体を同時に扱う、複雑な流体処理の課題の多彩なコレクションを提供します。 FluidLab は、弾性体、プラスチック、剛体、ニュートン液体と非ニュートン液体、煙と空気を含む固体、液体、気体のモデリングをサポートします。
FluidLab の中心となるのは、グラフィックス プロセッシング ユニット (GPU) のパワーを活用して高速処理を実現しながら、さまざまなマテリアルとその相互作用をシームレスに計算およびシミュレーションできる使いやすい物理シミュレータである FluidEngine です。 このエンジンは「差動型」です。つまり、シミュレーターはより現実的な物理世界モデルの物理知識を組み込むことができ、ロボット タスクのより効率的な学習と計画につながります。 対照的に、既存の強化学習手法のほとんどには、試行錯誤のみに依存する世界モデルが欠けています。 この強化された機能により、ユーザーはロボット学習アルゴリズムを実験し、現在のロボット操作能力の限界を試すことができると研究者らは述べています。
準備を整えるために、研究者らは FluidLab を使用してロボット学習アルゴリズムをテストし、流体システム特有の課題を発見して克服しました。 賢い最適化手法を開発することで、これらの学習をシミュレーションから現実世界のシナリオに効果的に移すことができました。
「家庭用ロボットが、コーヒーを淹れる、朝食の準備、夕食の準備などの日常業務を楽に支援してくれる未来を想像してみてください。これらの作業には、流体操作に関する多くの課題が伴います。私たちのベンチマークは、ロボットがこれらのスキルを習得し、家庭に利益をもたらすことを可能にする第一歩です。と職場も同様です」と、MIT CSAIL の客員研究員であり、MIT-IBM Watson AI Lab の研究科学者であり、この研究に関する新しい論文の主著者である Chuang Gan 氏は述べています。 「たとえば、これらのロボットは、混雑したコーヒーショップでの待ち時間を短縮し、顧客エクスペリエンスを向上させることができます。私たちの知る限り、FluidEngine は、完全に微分可能でありながら、広範囲の材料と結合をサポートする、この種では初の物理エンジンです。私たちの標準化された流体操作タスクにより、研究者はロボット学習アルゴリズムを評価し、今日のロボット操作能力の限界を押し広げることができます。」
流体ファンタジア
過去数十年にわたり、ロボット操作分野の科学者は主に硬い物体の操作や、水を注ぐなどの非常に単純な流体操作タスクに焦点を当ててきました。 現実世界で流体を扱うこれらの操作タスクを研究することは、安全ではなく、費用がかかる作業になる可能性があります。
ただし、流体操作では、必ずしも流体だけが問題になるわけではありません。 完璧なアイスクリームの渦を作る、固体を液体に混ぜる、水中をパドリングして物体を動かすなどの多くの作業では、流体と他のさまざまな材料の間の相互作用のダンスが行われます。 シミュレーション環境は、「カップリング」、つまり 2 つの異なる材料特性がどのように相互作用するかをサポートする必要があります。 流体操作タスクは通常、ブロックを押したりボトルを開けたりする単純なタスクとは異なり、繊細な相互作用や材料の取り扱いなど、かなり細かい精度が要求されます。
FluidLab のシミュレータは、さまざまな材料がどのように相互作用するかを迅速に計算できます。
GPU を支援するのは、Python に組み込まれたドメイン固有言語である「Taichi」です。 このシステムは、さまざまな種類の材料とそれらの相互作用 (カップリング) の勾配 (ロボットの動作に対する環境構成の変化率) を計算できます。 この正確な情報を使用してロボットの動作を微調整し、パフォーマンスを向上させることができます。 その結果、シミュレーターはより高速かつ効率的なソリューションを可能にし、他のシミュレーターとは一線を画します。
チームが提案した 10 のタスクは、流体を使用して到達しにくいオブジェクトを操作するものと、流体を直接操作して特定の目的を達成するものの 2 つのカテゴリに分類されます。 例としては、液体の分離、浮遊物の誘導、ウォーター ジェットによる物体の輸送、液体の混合、ラテ アートの作成、アイスクリームの成形、空気循環の制御などが含まれます。
「このシミュレーターは、人間がメンタルモデルを使って自分の行動の結果を予測し、流体を操作する際に情報に基づいた意思決定を行うのと同じように機能します。これは、他のシミュレーターと比較した場合の当社のシミュレーターの大きな利点です」と、カーネギーメロン大学の博士課程の学生、チョウ・シアンは言う。紙の著者。 「他のシミュレータは主に強化学習をサポートしていますが、当社のシミュレータは強化学習をサポートしており、より効率的な最適化手法が可能です。シミュレータが提供する勾配を利用することで、非常に効率的なポリシー検索がサポートされ、より多用途で効果的なツールになります。」
次のステップ
FluidLab の未来は明るいです。 現在の研究では、シミュレーションで最適化された軌道を、開ループ方式で直接現実世界のタスクに転送することを試みました。 次のステップとして、チームはシミュレーションで閉ループ ポリシーの開発に取り組んでいます。このポリシーは、環境の状態または視覚的観察を入力として受け取り、リアルタイムで流体操作タスクを実行し、学習したポリシーを現実世界のシーンに転送します。 。
このプラットフォームは一般に公開されており、研究者らは、これが複雑な流体操作タスクを解決するためのより良い方法を開発する将来の研究に役立つことを期待している。「人間は、液体(コーヒー、ヨーグルト、スープ、バッター)を注いだり混ぜたりするなど、日常的な作業で流体と対話します。洗濯や水での掃除などです」と、この作業には関与していないメリーランド大学コンピューターサイエンス教授のミン・リン氏は言う。 「ロボットが人間を支援し、日常業務で同様の能力を発揮するには、異なる特性(材料の粘度や密度など)のさまざまな液体を相互作用させて取り扱うための新しい技術が必要であり、現実の計算においては依然として大きな課題となっています。この研究では、最初の包括的な物理エンジン FluidLab を導入し、多様で複雑な流体と、環境内の他の物体や動的システムとの結合のモデリングを可能にします。論文で示されている「微分可能な流体」の数学的定式化により、現実世界のアプリケーションで動作するインテリジェント システムの学習ベースのアルゴリズムとニューラル ネットワーク アーキテクチャのネットワーク層として、多用途の流体シミュレーションを統合することが可能です。」
Gan と Xian は、MIT 脳認知科学部門のポスドクである Hsiao-Yu Tung と共同で論文を執筆しました。 アントニオ・トラルバ氏は、マサチューセッツ工科大学の電気工学およびコンピューターサイエンスの教授であり、CSAIL の主任研究員です。 ダートマス大学助教授Bo Zhu、コロンビア大学博士課程学生Zhenjia Xu、CMU助教授Katerina Fragkiadaki。 このチームの研究は、MIT-IBM Watson AI Lab、Sony AI、DARPA Young Investigator Award、NSF CAREER Award、AFOSR Young Investigator Award、DARPA Machine Common Sense、および National Science Foundation によって支援されています。
この研究は今月初めに開催された学習表現に関する国際会議で発表された。
前の項目 次の項目
流体ファンタジア 次のステップ