** 実用的な技術の観点から見ると、ロボットと AI の多くの基本原理が同じであり、電気自動車の自然な延長とみなすこともできるため、テスラのような企業はロボットの製造において本質的な利点を持っています。第一世代の四輪ロボット**。 2年前、マスク氏がロボットの開発を提案したとき、「ビジネスを適切に行っていない」と多くの嘲笑を集めたが、今年初めの李汽車のビジョンは、最高のAIとロボット企業になることであった。世界最大の電気自動車会社ではありません。夢も広がりそうですね。
「理想は詰まっているが、現実はガリガリ」という言葉があるように、ロボットやAIの開発は加速していますが、現実的な技術的・商業的な課題はまだ多くあります。一般的なロボット工学の分野でも、マルチモーダル機能を組み合わせて身体性知能の開発を真に統合するために、GPT-4 のような技術または製品が必要であると言われています。現在の論文やいくつかのデモで示されているロボットと大型モデルの組み合わせは依然としてインタラクション問題の解決に重点を置いていますが、インタラクション問題を解決したロボットが汎用ロボットになれるわけではありません。 ロボット開発の観点から見ると、大規模なモデルは貢献しますが、基礎となる制御と実行への影響は限定的です。現在、学術コミュニティは AI 主導の手法を採用しており、基本的な制御実装として強化学習を使用することを一般的に望んでいますが、これは大規模なモデルとは直接関係しておらず、強化学習の制御手法は成熟しておらず、そのほとんどが強化学習です。まだ学術研究の段階です。
大型模型+人型ロボット、次のトレンドか?
最近では、スタンフォード大学の李飛飛教授のチームが提案した「身体化知能」から、最近では玉樹、志源などのブランドの「家庭光」に至るまで、大型モデルとロボットの組み合わせが非常に注目を集めています。先日開催された2023年世界ロボット会議では、人型ロボットがその場でさまざまなスキルを披露してSFを現実化し、さまざまな企業がロボット関連製品を現場に移動させてそのスキルを披露した。その後の統計によると、この会議には国内外のロボット企業160社が参加し、600台のロボットが参加しており、その中で人型ロボットが最も人気があったことが判明した。ボストンダイナミクスの有名な創設者であるマーク・ライバートと有名な日本のロボット工学者石黒宏は、この会議に出席するために数千マイルを旅しました。
人型ロボットが資本市場の新たな注目スポットになりつつあることは疑いの余地がありません。プライマリー市場ではBV Baidu Ventures、Jingwei、Hillhouse、Gaorong、Zhengeなどが第一線で積極的に研究を進めており、上半期はビッグモデルを話題にしていたベンチャーキャピタリストも今は汎用ロボットに関心を示している。流通市場では、人型ロボットのコンセプト株が数波にわたって誇大広告されてきた。 5月にはマスク氏の発言が直接の原因となり、A株ロボットコンセプト「Saimo Smart」が限界まで上昇し、「Fengli Smart」も6営業日以内に150%以上上昇し、深セン証券取引所の注目も集めた。 . 株価が大幅に上昇した理由や合理性を説明することが求められます。
テスラ プッシュ
今年のテスラ株主総会でマスク氏は、「人型ロボットのオプティマスは、動きと力の制御、そして環境認識を大幅に強化しており、この技術は急速に反復されている。** 「将来的には 100 億人、あるいはそれ以上に達する可能性があります。人間とロボットの比率を 2:1 と計算すると、人型ロボットの需要は電気自動車よりもはるかに大きい可能性があります。**」 この一言でマスク氏は自信を示した。 , 熱意と献身が人型ロボットトラックの火にすぐに火をつけ、その傾向は今日に至るまで激化しています。実用化の観点から見ると、産業チェーン全体の成熟と完成を促進するのもテスラかもしれない。
テスラの人型ロボット「オプティマス」は昨年、2022年の公式イベント「AIデー」でデビューし、自律歩行、向きを変える、止まる、手を振るなどの動作をその場で完成させた。 オプティマスのテクノロジーのほとんどは、マシン ビジョンなどのテスラ車のテクノロジーと一致しています。視覚データを処理し、行動の決定を下し、コミュニケーションをサポートする「脳」、そして最も重要なことに、チップはテスラ車と一致しています。テスラ車と同じFSDコンピューターやオートパイロット関連のニューラルネットワーク技術も搭載されており、最終価格は2万ドル(約14万4000元)を超えないと予想される。
ロボットの新しい方向性
ロボットは今や珍しいものではありません。人型ロボットがどこまでできるかは、タスクの汎用化能力にかかっています。これは多くの企業が取り組んでいる方向でもあります。以前に言及した Yushu や Zhiyuan などの「国産照明」についてはここでは繰り返しませんが、Yuequan Bionics など、他にも注目に値する新興企業があります。同社のロボット製品の器用さはすでにそれに匹敵します。人間の手の。同社が独自に開発した人間に似たバイオニックインテリジェント器用ハンドは、外部干渉下でも積極的な動き、屈曲、ひっくり返しなどの動作を調整して、保持した物体の落下を防ぐことができます。公式説明では、「つかむ、押すなどの基本的な動作に加え、箸を使って小さな物体を拾う、スキンケア製品を塗る、コーヒーをかき混ぜる、スワイプするなど、27 種類の複雑で細かい手の操作も実行できます」携帯電話、ロック解除ボタンなど。」器用な手は、非常に自由度の高い引張および圧縮ボディの駆動技術を採用しています。同時に、触覚ニューロフィードバックを備えた柔軟なセンサーが組み込まれています。
投資家の追求、大手テクノロジー企業の参入、新興企業や大学の革新的な研究に至るまで、人型ロボットはさまざまな方向に進歩し、新たな開発段階を迎えています。たとえば、大型モデルを統合し、それに脳を装備することは、人型ロボットの急増を促進するもう 1 つの重要な技術変数です。
先ほども述べたように、「身体化知能」とは「実際の身体を持ち、物理的な相互作用をサポートする知的体」であり、汎用ロボットの新たな開発経路に属するAIに身体を付加したものに相当します。資本はさらに薪を投入し、5~10年の大規模投資を経てさらに激しく燃え上がり、ついに汎用ロボットの実用化が実現するだろう。 ** 過去の長い間、ロボットの開発は、かつて同様に制限されていた AI と同様に、特定の種類の作業に限定されていました。大型モデルから徐々にAGIへ発展し、ロボットと組み合わせることで自然とロボットの応用範囲が広がります。 **
中国に比べて海外の進歩は一歩早く、大規模モデルの能力は言語から実行層までアップグレードされています。 7月には、リー・フェイフェイのチームのロボットが引き出しを引いたり、ボトルのキャップを外したり、リンゴの重さを量ったりできるようになった。 Google DeepMind が月末に発売した Robotics Transformer 2 (RT-2) は、同じ方向で詳細な研究を継続しました。 RT-2 は、ネットワークとロボットのデータから学習し、この知識をロボット制御の一般的な命令に変換できる、まったく新しいビジョン + 言語 + アクション (VLA) モデルです。 RT-2 は、より優れた一般化を実証し、公開されたロボット データの意味論的および視覚的領域を超えて理解し、基本的な推論を実行することで新しい命令を解釈し、コマンドに応答することができました。
でこぼこ道になる運命にある
「理想は詰まっているが、現実はガリガリ」という言葉があるように、ロボットやAIの開発は加速していますが、現実的な技術的・商業的な課題はまだ多くあります。一般的なロボット工学の分野でも、マルチモーダル機能を組み合わせて身体性知能の開発を真に統合するために、GPT-4 のような技術または製品が必要であると言われています。現在の論文やいくつかのデモで示されているロボットと大型モデルの組み合わせは依然としてインタラクション問題の解決に重点を置いていますが、インタラクション問題を解決したロボットが汎用ロボットになれるわけではありません。 ロボット開発の観点から見ると、大規模なモデルは貢献しますが、基礎となる制御と実行への影響は限定的です。現在、学術コミュニティは AI 主導の手法を採用しており、基本的な制御実装として強化学習を使用することを一般的に望んでいますが、これは大規模なモデルとは直接関係しておらず、強化学習の制御手法は成熟しておらず、そのほとんどが強化学習です。まだ学術研究の段階です。
さらに、セキュリティを改善する必要があります。大型モデルの「AIの錯覚」には大きな影響はないかもしれないが、実際にロボットが実用化されると、精度や安全性の確保が求められ、技術の向上が求められる。テクノロジー、シナリオ、コスト、安全性、機会、課題が同時に到来しており、人型ロボットは未来に向けて重要な一歩を踏み出しています。