つまずき防止ロボットが困難な地形にリアルタイムで適応– TechCrunch

by PCJISAKUTECH
0 comment


ロボットは即興で演奏するのに苦労しており、異常な表面や障害物に遭遇すると、通常、突然の停止や激しい落下を意味します。 しかし、Facebook AIの研究者は、遭遇するあらゆる地形にリアルタイムで適応するロボット移動の新しいモデルを作成し、砂、岩、階段、その他の突然の変化にぶつかったときにトラックを続けるようにその場で歩行を変更しました。

ロボットの動きは用途が広く正確であり、ロボットは階段を上るのを「学ぶ」ことができますが、 壊れた地形を横切る などなど、これらの動作は、ロボットが切り替える個々の訓練されたスキルのようなものです。 スポットのようなロボットは、押したり蹴ったりすることで跳ね返ることが有名ですが、システムは実際には、変更されていない歩行ポリシーを追求しながら、物理的な異常を修正するために機能しています。 幾つかある 適応運動モデル、しかし、非常に特殊なものもあれば(たとえば、実際の昆虫の動きに基づくもの)、動作するのに十分な時間がかかるため、ロボットが有効になるまでに確実に落下するものもあります。

チームが言うように、Rapid Motor Adaptationは、人間や他の動物がさまざまな状況に合わせて歩き方をすばやく、効果的に、無意識に変えることができるという考えから生まれました。

「あなたが歩くことを学び、初めてビーチに行くとしましょう。 足が沈み込み、足を引き抜くには、さらに力を加える必要があります。 奇妙な感じがしますが、数ステップで、硬い地面を歩くのと同じように自然に歩くことができます。 そこの秘密は何ですか?」 FacebookAIとカリフォルニア大学バークレー校に所属する主任研究員のジテンドラ・マリクは尋ねた。

確かに、これまでビーチに出会ったことがない場合でも、人生の後半で出会った場合でも、柔らかい路面を歩くことができる特別な「砂モード」には入っていません。 動きを変える方法は、外部環境を実際に理解していなくても自動的に行われます。

シミュレーション環境の視覚化。 もちろん、ロボットはこれを視覚的に認識しません。 画像クレジット: バークレーAIリサーチ、Facebook AIリサーチ、CMU

「何が起こっているのかというと、あなたの体は、体自体に対するそれらの状態の異なる結果を感知することによって、異なる体の状態に反応します」とマリクは説明しました—そしてRMAシステムは同じように機能します。 「私たちが新しい条件で歩くとき、0.5秒以下の非常に短い時間で、これらの条件が何であるかを推定するのに十分な測定を行い、歩行ポリシーを変更します。」

システムは完全にシミュレーションでトレーニングされ、ロボットの小さな脳(すべてがオンボードの制限された計算ユニットでローカルに実行される)が最小のエネルギーで前進運動を最大化し、すぐに観察して応答することで落下を回避することを学習した現実世界の仮想バージョンでトレーニングされましたその(仮想)ジョイント、加速度計、およびその他の物理センサーから入ってくるデータに。

RMAアプローチの完全な内部性を強調するために、Malikは、ロボットが視覚入力をまったく使用しないことに注意します。 しかし、視力のない人や動物はうまく歩くことができるのに、なぜロボットはいけないのでしょうか。 しかし、歩いている砂や岩の正確な摩擦係数などの「外部性」を推定することは不可能であるため、それ自体を注意深く監視しているだけです。

「私たちは砂については学びません。足が沈むことについて学びます」と、同じくバークレー出身の共著者であるAshishKumarは述べています。

最終的に、システムは2つの部分で構成されます。1つはロボットの歩行を実際に制御するメインの常時実行アルゴリズム、もう1つはロボットの内部読み取り値の変化を監視する並列実行の適応アルゴリズムです。 重要な変更が検出されると、それらを分析します—脚が実行している必要があります この、しかし彼らはやっている この、つまり状況は次のようになります この —そしてメインモデルにそれ自体を調整する方法を指示します。 それ以降、ロボットはこれらの新しい条件下でどのように前進するかという観点からのみ考え、特殊な歩行を効果的に即興で行います。

ロボットがさまざまなタフな表面を横切るときに落下しない映像。

画像クレジット: バークレーAIリサーチ、Facebook AIリサーチ、CMU

シミュレーションのトレーニングの後、ニュースリリースで説明されているように、現実の世界で見事に成功しました。

ロボットは、すべての試行で1回も失敗することなく、砂、泥、ハイキングトレイル、背の高い草、土の山の上を歩くことができました。 ロボットは、試行の70%で、ハイキングコースに沿って階段を降りることに成功しました。 トレーニング中に不安定な地面や沈む地面、邪魔な植生、階段を見たことがないにもかかわらず、80%の試験でセメントの山と小石の山をうまくナビゲートしました。 また、体重の100%に相当する12kgのペイロードで移動した場合、高い成功率で身長を維持しました。

これらの状況の多くの例は、こちらのビデオで見ることができます または(ごく簡単に)上記のgifで。

マリクはの研究にうなずいた ニューヨーク大学のカレン・アドルフ教授、その仕事は、歩く方法を学ぶ人間のプロセスがどれほど順応性があり、自由形式であるかを示しています。 チームの本能は、どんな状況にも対応できるロボットが必要な場合、さまざまなモードから選択するのではなく、最初から適応を学習する必要があるというものでした。

すべてのオブジェクトとインタラクションに徹底的にラベルを付けて文書化することで、よりスマートなコンピュータービジョンシステムを構築できないのと同じように(常にもっと多くなります)、10、100、さらには数千もの多様で複雑な物理世界にロボットを準備することはできません。砂利、泥、瓦礫、濡れた木などを歩くための特別なパラメータの例です。さらに言えば、前進運動の一般的な考え方以外は何も指定したくない場合があります。

「私たちは、それが脚のために持っているという考え、またはロボットの形態についての何かを事前にプログラムしていません」とクマールは言いました。

つまり、システムの基礎は、完全に訓練されたものではなく、最終的には4足歩行になりましたが、他の脚式ロボットだけでなく、AIとロボット工学のまったく異なる領域に適用できる可能性があります。

「ロボットの脚は手の指に似ています。 脚が環境と相互作用する方法、指が物体と相互作用する方法」とカーネギーメロン大学の共著者であるディーパックパタクは述べています。 「基本的な考え方は、どのロボットにも適用できます。」

さらに、マリクは、基本アルゴリズムと適応アルゴリズムの組み合わせが他のインテリジェントシステムでも機能する可能性があることを示唆しました。 スマートホームや地方自治体のシステムは既存のポリシーに依存する傾向がありますが、代わりにその場で適応した場合はどうなるでしょうか。

今のところ、チームは最初の調査結果を ロボット工学:科学とシステム 会議を行い、追跡調査を行う必要があることを認めます。 たとえば、即興の歩行の内部ライブラリを一種の「中期」記憶として構築したり、視覚を使用して新しいスタイルの移動を開始する必要性を予測したりします。 しかし、RMAアプローチは、ロボット工学における永続的な課題に対する有望な新しいアプローチのようです。



Source link

You may also like

Leave a Comment