北京人形ロボットイノベーションセンターのデータ基地を実地調査し、対外的に高品質な実証データを数万時間以上提供している

robot
概要作成中

人工知能が「感知知能」から「具身知能」へと飛躍する重要な時期において、高品質なデータは人型ロボット産業の発展を促進する戦略資源となっています。最近、証券時報の記者は北京人形ロボット革新センターの具身知能ロボットデータ・訓練基地一期を現地取材しました。

このデータ基地の建築面積は約5000平方メートルで、家庭、スーパーマーケット、オフィス、工業、医薬、健康管理などの分野の30以上の典型的なシナリオをカバーし、約200平方メートルの専門的な光学動作キャプチャ場を備えています。データ基地には国内で最も多様な構成のロボット120台以上があり、ヘッドバンド型やクランプ爪型の収集装置、動作キャプチャ用衣服、手袋、遠隔操作コクピットなどの専門装備を備え、実機遠隔操作、オープン環境での収集、動作キャプチャ収集などの全スタック型データ収集能力を持っています。また、標準化されたプロジェクト管理体系を確立し、データ収集、注釈付け、品質検査などの一連の規範を策定し、全工程の品質を管理可能にしています。

北京人形ロボット革新センターの関係者は、証券時報の記者に対し、「この基地の一期はわずか半年で完成し、国内で最もシナリオのカバー範囲が広く、ロボットの構成が最も多様で、データ生産能力と品質が最も高い専門的なデータ収集プラットフォームの一つとなった」と述べました。

現在、北京人形ロボット革新センターはRobomind具身知能データセットを公開・オープンソース化しており、ダウンロード回数は200万回を超えています。また、データ基地から外部市場に高品質な実データを提供した時間は数万時間を超え、データのダウンロード量と供給能力は業界トップです。

この関係者は、「このデータ基地のサービス対象には複数のトップクラスの具身知能企業や研究機関が含まれ、物流、スーパーマーケット、オフィス、家庭など多くのシナリオに適用されている」と述べました。汎用ロボットプラットフォーム『具身天工』がさまざまなシナリオで実用化されるにつれ、この基地は「世界初の100万時間高品質データ」の目標に向かって全速力で進んでおり、人型ロボットが実験室から産業界へと進出するためのデータ基盤を堅固にしています。

人型ロボットが本当に多くの産業に浸透するには、数百、数千の「精密修正」データだけでは不十分で、膨大で多様かつ高品質な「原料」データが必要です。その中でも実機データはロボットの知能が仮想から現実へと移行するための不可欠な道であり、正確に力覚反応や触覚情報、環境干渉などの再現が難しい詳細を再現できるため、「物理直感」と呼ばれる重要な情報は、実機から収集される多模態データを用いて訓練される必要があります。さらに重要なのは、実環境での完全なタスクの閉ループであり、「掴む・操作する・置く」の単純な軌跡には複雑な環境下での人間の潜在的な意思決定が大量に含まれており、そのデータの価値は他のタイプのデータよりもはるかに高いです。

しかし、収集の観点から見ると、実機データの収集には依然として多くの課題があります。シナリオの断片化、ロボットの「方言」の不一致、データ品質のばらつきなどです。

業界の痛点を洞察した北京人形ロボット革新センターは、専門的なデータ収集基地の前瞻的な配置を進めています。これにより、散在するシナリオを集中再現し、多様なロボットを統一的に調整し、収集・注釈付け・品質検査の全工程を標準化します。

以前、北京人形ロボット革新センターは国内初の具身知能データセットの業界標準「人工知能具身知能データ収集規範」を牽引して制定し、標準化・専門化された収集プロセス規範を策定しました。データ基地はすでに複数のトップ企業や研究機関に対し、数万時間を超える高品質データを提供し、全体の合格率は95%以上を維持しています。

ここでは、毎時間のデータが厳格に管理され、「出荷合格率」95%以上を確保しています。また、異なる構成のロボットが並行して収集できるため、大規模に高品質なデータを生産し、アルゴリズムチームの「データ不足」の悩みを解消しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン