川崎重工ら、製造現場の視触覚データを統合した「VTLA」基盤モデル向けデータセット構築事業をNEDOに採択

川崎重工業大阪大学ファナックFingerVision安川電機の5者は、7月2日、「製造現場視触覚データ収集によるVTLA基盤モデルに向けたデータセットの構築」プロジェクトが、経済産業省・NEDOの「ポスト5G情報通信システム基盤強化研究開発事業/データエコシステムの構築等に関する研究開発(GENIAC)」に採択されたと発表した。プロジェクトは2026年8月から2027年7月までの1年間を予定し、製造現場で取得する視覚(Vision)、触覚(Tactile)、言語(Language)、動作(Action)を統合するVTLA(Vision-Tactile-Language-Action)モデルと、それに適したデータセットの設計・収集・蓄積を行う。

本プロジェクトは、ロボットメーカー3社と大学、触覚センシングやIT分野の企業が連携し、現場での複雑かつ繊細な手先作業の再現・自動化を目指す点が特徴である。データ仕様や収集基盤を共通化することで、複数メーカー・複数デバイスに適用可能なデータエコシステムの早期形成を狙う。

■プロジェクトの目的と背景

日本の製造業は、熟練作業者の減少や多品種少量生産への対応など、現場の高度化が求められている。一方で、触覚や力覚といった非視覚情報を含めた作業をAI・ロボットで自動化するためには、多感覚データを統合した学習基盤が不可欠である。本プロジェクトは、こうした課題に対処し、国内製造業の競争力強化につなげることを目的とする。

■参画体制
共同参画企業・機関は以下の通りである。
• 川崎重工業(主導企業の一つ)
• 国立大学法人大阪大学(原田研究室)
• ファナック
• 株式会社FingerVision
• 安川電機

また、実施期間中はABEJA、産業技術総合研究所(産総研)、名古屋大学などの企業・研究機関とも連携し、基盤技術の高度化を図る。

■主要な取り組み
• データ仕様・収集基盤の共通化:ロボットメーカー3社が共同でデータ仕様を定め、各種ロボットやセンシングデバイスで利用可能なデータセットを構築する。
• 短期間での開発と早期のエコシステム形成:技術進化のスピードを踏まえ、1年という短期間で設計・収集を進め、迅速にデータの利活用を開始する計画である。
• 触覚分野の知見活用:触覚センシングに関するスタートアップや大学と連携し、VTLAモデルの実証を行う。

■期待される効果
• 高度作業の自動化促進:視覚・触覚・言語・動作を統合したモデルにより、複雑で繊細な手先作業のロボット化が可能になると期待される。
• データエコシステムの拡張:共通基盤で蓄積したデータを起点に、産業横断的なデータエコシステムの拡大と新たな価値創出を促進する。
• 労働力不足対策への貢献:ロボット導入の加速を通じて、労働人口減少という社会課題の解決に寄与する。

■実施スケジュール
プロジェクトは2026年8月に開始し、2027年7月までの1年間の実施を予定している。期間中はデータ収集、データ基盤の共通化、VTLA基盤モデルの開発と実証、及び関連機関との共同研究を推進する。

■現場で想定するデータと用途
本プロジェクトで収集するデータは、製造ラインや組立工程などの現場における次の要素を想定している。
• 視覚(カメラ映像、深度情報など)
• 触覚(触圧、変形、接触状態などセンサーデータ)
• 言語(作業指示、手順説明、音声ログ等のテキスト・音声データ)
• 動作(ロボットの動作ログ、力・トルクデータなど)
これらを統合して学習可能なデータセットとし、現場での自動化や作業支援に活用する計画である。

■産業的意義と今後の展開

ロボット業界が連携して共通基盤を整備することで、個別事業者の枠を超えたデータ利活用が可能になる。プロジェクト終了後も成果を基盤としたデータエコシステムの拡張を進め、ロボット産業全体の高度化と国内製造業の競争力強化に寄与する方針である。

ニュースリリース