反復的なタスクを実行するロボットの学習能力を向上させる新しい技術
2023 年 6 月 5 日
この記事は、Science X の編集プロセスとポリシーに従ってレビューされています。 編集者は、コンテンツの信頼性を確保しながら、次の属性を強調しました。
事実確認済み
校正する
by カクタスコミュニケーションズ
過去の失敗から学ぶのは人間に限ったことではありません。 コンピューターもそれを行います。 産業では、これは生産システムの運用を支援するコンピュータベースの制御システムを通じて行われます。 衣料品、コンピューターチップ、焼き菓子の製造など、特定のタスクをバッチで実行する産業用ロボットの場合、最も一般的に使用される制御手法は反復学習制御 (ILC) です。 ほとんどの業界は依然として、比例型更新ルール (PTUR) と呼ばれる学習戦略を使用する ILC システムに依存しています。 この技術は、同じタスクを何度も繰り返し、以前の反復で発生したエラーに基づいて制御入力を更新することにより、ILC システムのパフォーマンスを向上させます。
ただし、この制御方法は数十年前に提案されました。 また、より複雑なタスクを実行するために ILC システムがますます採用されているため、より速く、より正確に学習できる技術が必要です。
最近の進歩として、科学者のグループは、単入力単出力線形 ILC システムの潜在的な性能を向上させるためにフラクショナル パワー アップデート ルール (FPUR) を使用する新しい技術を提案しました。 この研究は、IEEE/CAA Journal of Automatica Sinica に掲載されました。
収束率 (目標出力と実際の出力の差が時間の経過とともに減少する速度) は、ILC システムの効率を定義する上で重要な役割を果たします。 収束率を向上させるための既存の方法は、高精度が必要な状況では満足できないことがよくあります。 一定の学習ゲインまたは手動で選択された学習ゲインの場合でも、線形更新方法を使用する現在の ILC システムは、利用可能な情報を最大限に活用できません。 したがって、科学者らは、非線形更新手法を利用して学習して目的の出力に到達する、PTUR を超えたアプローチを調査しました。
「従来の PTUR は、制御入力を更新するためにトラッキング エラーの線形項を使用します。一方、FPUR は更新に分数項を使用します。1 より小さい正の数値はそれ自体よりも大きな分数電力を持つため、FPUR の更新強度は小さい追跡誤差では PTUR よりも大きいため、収束速度が速くなります」と、この研究の筆頭著者で中国人民大学数学科の修士課程の学生である Zihan Li 氏は説明します。
チームは、新しい有限時間制御 (FTC) およびターミナル スライディング モード制御 (TSMC) 戦略に触発された新しい FPUR 手法を開発しました。これらは、前述の問題を克服し、収束速度を向上させる可能性のある手法です。 科学者らはまた、時間の経過に伴う誤差のダイナミクスを調査するために、非線形マッピングのアプローチも採用しました。 このアプローチにより、高速収束性能を報告し、ILC システムで発生する可能性のある追跡エラーのリミット サイクルを特徴付けることができました。 さらに、新しい手法の有効性を検証するために数値シミュレーションも実行されました。
提案されたシステムが ILC システムの分野をどのように変えるかについて尋ねられたとき、Li 氏は次のように述べています。「この研究は 3 つの主な目的を果たします。第 1 に、学習能力を向上させるために非線形更新方法を使用するアルゴリズムを提供します。第 2 に、学習能力を向上させることを示します。」 「分数電力項により、実際のパフォーマンスに基づいて収束速度を調整できます。そして最終的に、FTC や TMSC と同等の高速収束速度を示します。」
この研究は、単入力単出力線形システムにおける ILC 用の FPUR の使用を初めて実証しました。 提案された手法は、自律走行車、無人航空機、リハビリテーション ロボットなどの他の反復システムでも使用できる可能性があります。
詳しくは: Zihan Li et al、Enhancing Iterative Learning Control With Fractional Power Update Law、IEEE/CAA Journal of Automatica Sinica (2023)。 DOI: 10.1109/JAS.2023.123525
詳細情報: 引用次: 高い