ロボット開発のTelexistence(テレイグジスタンス、TX、東京・大田)は10日、米エヌビディアなどが推進するフィジカルAI(人工知能)の開発支援プログラムを通じて、コンビニエンスストアのレジで袋詰め作業などを担うヒト型ロボットを公開したと発表した。
米国時間の5月27日にデモンストレーション動画を公開しており、今回その内容と位置付けを改めて示した格好だ。公開されたロボットは、人間の介入なしに一連の作業をこなす自律型のヒューマノイドで、コンビニ店舗のバックヤードではなく、客の目に触れるレジ周辺での利用を想定している。
TXは、これまで遠隔操作型ロボットでコンビニの棚出しや品出しを自動化してきたが、今回はより人間の動きに近い形で、対面業務の一部を担うロボットの可能性を示した形となる。
デモ動画では、ロボットが左手でペットボトルとおにぎりをつかみ、右手に持った機械でバーコードを読み取った後、袋に詰める一連の動作を自律的に実行する様子が映し出されている。単純なピッキングではなく、商品形状の違いや向き、バーコード位置のばらつきに対応しながら、適切な順序で袋詰めする点がポイントだ。
コンビニのレジ業務は、単に商品をスキャンするだけでなく、温度帯の違いへの配慮や、袋のサイズ選択、客との簡単なコミュニケーションなど、暗黙知に支えられた作業が多いとされる。今回のデモは、その中でも比較的定型化しやすい「スキャンと袋詰め」の部分に焦点を当て、ロボットがどこまで自律的に対応できるかを示したものといえる。
TXが今回のロボットで中核技術として位置付けるのが、視覚情報や言語情報を行動に変換する「VLA(ビジョン・ランゲージ・アクション)モデル」だ。これは、カメラから得られる映像データと、作業指示やマニュアルなどの言語情報を統合し、ロボットの具体的な動きに落とし込むためのモデルである。
従来の産業用ロボットは、あらかじめ定義された座標や手順に従って動作することが多く、環境変化への柔軟な対応は得意ではなかった。VLAモデルを用いることで、ロボットは周囲の状況を視覚的に認識し、言語的なタスク指定を解釈しながら、その場で最適な行動シーケンスを生成することを目指している。
フィジカルAIという概念は、生成AIなどのソフトウェア領域で進んできたAIの高度化を、現実世界でモノを動かすロボットに結び付ける取り組みとして注目されている。エヌビディアはGPUや開発プラットフォームを通じて、ロボット向けの大規模モデル学習やシミュレーション環境の整備を進めており、TXはそのエコシステムの中で実機ロボットの開発を加速させている形だ。
今回のプログラムでは、クラウド上での学習環境や、ロボット制御向けのソフトウェアスタックが提供され、TXは自社のハードウェアと組み合わせることで、コンビニ業務に特化したフィジカルAIの検証を行ったとみられる。TXはプログラム終了後もエヌビディアなどとの協力関係を継続するとしており、今後も同様の枠組みで学習データの拡充やモデルの高度化を進める構えだ。
コンビニ業界では、人手不足と人件費の上昇が長期的な課題となっており、深夜帯や地方店舗を中心に、レジ要員の確保が難しくなっている。セルフレジやセミセルフレジの導入が進んだものの、袋詰めや年齢確認、支払いトラブル対応など、完全な無人化には至っていない領域が残る。
今回TXが示したようなヒト型ロボットが、レジ横で袋詰めを担えるようになれば、店舗スタッフは接客や品出し、調理など、より付加価値の高い業務に時間を振り向けやすくなる可能性がある。一方で、客がロボットによる袋詰めをどの程度受け入れるか、動作速度やミス率がどこまで人間に近づけるかといった点は、今後の実証で検証が必要となる。
TXは、これまでにも大手コンビニチェーンのバックヤードで、遠隔操作型ロボットによる棚出し作業の実証を進めてきた経緯がある。遠隔操作型は、人間のオペレーターがロボットを操作することで、柔軟な判断を保ちながら省人化を図れる一方、オペレーターの人件費や通信インフラのコストが課題となる。
今回の自律型ヒューマノイドは、こうした遠隔操作のノウハウを生かしつつ、よりAIによる自律性を高める方向へのシフトを示している。完全自律と遠隔支援を組み合わせたハイブリッド運用も想定され、通常は自律的に動作し、想定外の状況やトラブル時のみ人間が介入するような運用モデルが現実的とみられる。
TXは、今回のフィジカルAIプログラムを通じて得た知見を基に、2029年までの実用化を視野に入れているとされる。ここでいう実用化は、単発のデモや限定店舗での試験導入にとどまらず、複数店舗で継続運用できるレベルの信頼性とコストバランスを意味する。
コンビニ店舗は、立地条件や客層、取り扱い商品が多様であり、ロボット側には高い汎用性が求められる。TXは、VLAモデルに現場データを継続的に学習させることで、店舗ごとの違いや季節要因、キャンペーン時の特殊な商品構成などにも対応できるようにする狙いがあるとみられる。
技術面では、視覚認識の精度向上と、ヒューマノイドのハードウェア設計が鍵となる。ペットボトルやおにぎりといった比較的扱いやすい商品だけでなく、弁当や惣菜、柔らかいパン、割れやすい菓子など、多様な商品を適切な力加減で扱う必要があるためだ。
ロボットハンドのセンサーやアクチュエーターの性能に加え、VLAモデルが「どの商品をどの順番で、どの袋に入れるか」を判断するロジックも重要になる。エヌビディアのGPUを活用した大規模モデルの推論能力は、こうした複雑な判断をリアルタイムで行ううえで不可欠とされ、店舗内のエッジサーバーとクラウドを組み合わせた構成が検討されているとみられる。
社会的な観点では、ヒト型ロボットがコンビニのレジ周辺に立つ光景が、どの程度自然に受け入れられるかが焦点となる。日本では、既に清掃ロボットや案内ロボットが商業施設に導入されているが、レジという顧客接点の中心にロボットを配置する事例はまだ多くない。
ヒト型であることは、既存の店舗インフラを大きく変えずに導入できる利点がある一方、人間らしさの度合いによっては違和感を覚える利用者も出てくる可能性がある。TXは、ロボットの外観や動き、音声インターフェースの設計を通じて、店舗ブランドや客層に応じた「ちょうどよい存在感」を探ることになりそうだ。
コンビニ各社にとって、ロボット導入は単なる省力化策にとどまらず、店舗オペレーション全体の再設計を促す可能性がある。例えば、ロボットが袋詰めを前提とした商品配置やレジカウンターの形状に見直すことで、作業効率を高められる余地がある。
さらに、ロボットが取得する映像や動作ログを分析すれば、混雑時間帯のパターン把握や、客の購買行動の傾向分析など、新たなデータ活用の糸口にもなり得る。ただし、プライバシー保護やデータの取り扱いに関するルール整備が前提となり、店舗運営とIT部門、ロボットベンダーの連携が不可欠になる。
TXが掲げる2029年までの実用化スケジュールは、技術開発だけでなく、コスト構造や保守体制の構築も含めた総合的な課題解決を前提としている。ロボット1台あたりの導入費用と、想定される稼働時間、人件費削減効果を比較し、投資回収期間をどこまで短縮できるかが、チェーン全体での本格展開の判断材料となる。
加えて、故障時の対応やソフトウェアアップデート、現場スタッフへの教育など、運用フェーズの負荷をどう抑えるかも重要な検討事項だ。TXは、エヌビディアなどとの協力を通じて、ハードとソフトを一体で提供するプラットフォーム型のビジネスモデルを模索しているとみられ、コンビニ以外の小売業や物流現場への横展開も視野に入る。
フィジカルAIを活用したヒト型ロボットは、まだ実証段階にあるものの、労働力人口の減少が続く日本において、現場のオペレーションを維持するための一つの選択肢として現実味を帯びつつある。TXの今回の取り組みは、コンビニという日常生活に密着した場を舞台に、AIとロボット技術をどこまで実務レベルに落とし込めるかを問う試金石となる。
今後、実店舗でのパイロット導入や、利用者の反応を踏まえた改良が進めば、2029年というマイルストーンの妥当性もより具体的に見えてくるだろう。テレイグジスタンスがエヌビディアらと構築するフィジカルAIの開発基盤が、どこまで汎用性を持ち、他分野のロボット活用にも波及していくのか、業界内外の関心が高まりつつある。