Pokémon Go の 300億枚の写真が、配達ロボットに道案内を教えています

作者: Will Douglas Heaven

翻訳: 深潮 TechFlow

深潮ガイド: NianticはPokémon Goのプレイヤーが撮影した3億枚以上の都市写真を新たなビジネスに変えた。同社のAI子会社Niantic Spatialはこれらのデータを用いて、GPSをはるかに超えるセンチメートル単位の精度を持つ視覚位置推定システムを訓練した。最初の大口顧客は配膳ロボット企業Coco Roboticsだ。ピカチュウを捕まえるところからピザを配達するまで、これはクラウドソーシングデータの中でも最も意外な商用化の道の一つかもしれない。

全文は以下の通り:

Pokémon Goは世界初の現象的ARゲームだ。2016年にGoogleの子会社Nianticがリリースし、ポケモンIPを基盤に拡張現実の要素を重ねたこのゲームは瞬く間に世界中に広まった。シカゴからオスロ、江の島まで、プレイヤーたちは街頭に繰り出し、ブーディーやゼニガメ、あるいは(運が良ければ)超希少なガルーラの閃光鳥を捕まえようとした。それらは現実世界の上に浮かび、あと少しで届きそうだった。

簡単に言えば、膨大な人々がスマホを持ち、膨大な建物を撮影していることになる。「5億人が60日以内にこのアプリをインストールした」とNiantic SpatialのCTOブライアン・マクレンドンは語る。Niantic Spatialは昨年5月に分社化されたAI企業だ。ゲーム会社Scopely(同時期にNianticからPokémon Goを買収)が示すデータによると、このゲームは2024年も1億人以上のアクティブプレイヤーがおり、リリースから8年が経過している。

現在、Niantic Spatialはこの比類なきクラウドソーシングデータの宝庫—世界中の数億人のPokémon Goプレイヤーのスマホから収集された都市のランドマーク写真と超高精度の位置情報—を活用し、世界モデル(World Model)を構築している。これは現在のホットな技術分野であり、LLMの知能を実世界環境に固定することを目指している。

同社の最新製品は、建物やその他のランドマークの数枚のスナップショットだけで、地図上の位置を数センチメートル単位で正確に特定できるモデルだ。彼らはこれを使って、GPSが信頼できない場所でロボットのより正確なナビゲーションを支援したいと考えている。

この技術の大規模な初検証として、Niantic SpatialはCoco Roboticsと提携した。Cocoはアメリカやヨーロッパの複数都市に展開するラストワンマイルの配膳ロボットを開発するスタートアップだ。「みんなARは未来だと思っているし、AR眼鏡ももうすぐ来る」とマクレンドンは言う。「しかし実際には、ロボットの方が先にユーザーに受け入れられた。」

ピカチュウからピザ配達まで

Coco Roboticsはロサンゼルス、シカゴ、ジャージーシティ、マイアミ、ヘルシンキに約1000台の荷物箱サイズのロボットを展開している。最大8枚の巨大ピザや4袋の食料品を積める。CEOのザック・ラッシュによると、これらのロボットはこれまでに50万回以上の配送を完了し、さまざまな天候条件下で数百万マイルを走行してきた。

しかし、人間の配達員と競争するには、Cocoのロボット(歩道上を時速約5マイルで走行する)は十分に信頼性が必要だ。「私たちの最良のやり方は、あなたに伝えた時間に正確に到着させることだ」とラッシュは言う。つまり、迷子になってはいけない。

Cocoの課題はGPSに頼れないことだ。都市部では、電波が建物間で反射・干渉し、GPS信号は弱い。「高層ビルや地下通路、高架橋の密集地帯で配送を行うと、GPSはほとんど役に立たない」とラッシュは述べる。

「都市峡谷はGPSのパフォーマンスが最も悪い場所だ」とマクレンドンは言う。「スマホの青い点がしばしば50メートル漂い、別の街区や別の方向、道路の反対側に置き去りにされることもある。これがNiantic Spatialの解決すべき課題だ。」

過去数年、Niantic SpatialはPokémon GoとIngress(2013年にNianticがリリースしたもう一つのARゲーム)から得たデータを整理し、視覚位置推定システム(Visual Positioning System)を構築してきた。これは、見ているものから自分の位置を判断する技術だ。「ピカチュウを街中でリアルに走らせることと、Cocoのロボットが安全かつ正確に都市を横断することは、本質的に同じ問題だ」とNiantic SpatialのCEOジョン・ハンケは言う。

「視覚位置推定は新しい技術ではない」と、地図と地理空間分析の会社ESRIのコンラッド・ヴェンツェルは述べる。「しかし、外のカメラが多いほど、それはより良く使えるようになるのは明らかだ。」

Niantic Spatialは都市環境で撮影された3億枚の画像を用いてモデルを訓練した。これらの画像は特に「ホットスポット」周辺に密集している—Nianticのゲーム内でプレイヤーが訪れる重要地点、例えばポケモンバトルジムなどだ。「世界中に100万以上の地点があり、あなたの位置を正確に特定できる」とマクレンドンは言う。「私たちはあなたがどこにいるかを知っている。精度は数センチメートル以内だ。さらに重要なのは、あなたがどの方向を見ているかもわかることだ。」

結果として、これらの100万地点のそれぞれについて、Niantic Spatialはほぼ同じ場所から異なる角度、異なる時間、異なる天候条件で撮影された何千枚もの写真を持っている。各写真には詳細なメタデータも付与されている:スマホの正確な空間位置、向き、姿勢、動いているかどうか、速度、進行方向など。

このデータセットを用いて、モデルを訓練し、「見ているもの」から自分の位置を正確に予測させる—これにより、100万のホットスポット外や画像と位置情報が乏しい場所でも動作できる。

GPSに加え、Cocoのロボット(4つのカメラを搭載)は今やこのモデルを使って自分の位置や目的地を判断している。ロボットのカメラは臀部の高さに設置され、全方向を向いている。視野やPokémon Goプレイヤーのそれとは異なるが、ラッシュはデータの適応はそれほど難しくないと述べる。

競合他社も視覚位置推定システムを導入している。例えば、2014年にエストニアで設立されたロボット配送企業Starship Technologiesは、センサーを用いて周囲の環境の3Dマップを作成し、建物の縁や街灯の位置をマークしている。

しかし、ラッシュはNiantic Spatialの技術がCocoに優位性をもたらすと信じている。これにより、ロボットはレストランの外で正確に受取場所に停車し、人の邪魔にならず、顧客の玄関先に停車できると考えている。過去にはこれがしばしば問題となっていた。

ロボットのカンブリア爆発

Niantic Spatialが視覚位置推定システムを始めた当初の目的はARへの応用だったとハンケは語る。「AR眼鏡をかけているときに、仮想世界を見ている方向に固定したい場合、何らかの方法が必要だ。しかし今、私たちはロボット分野の大きなブレイクスルーを目の当たりにしている。」

一部のロボットは人間と空間を共有する必要がある。例えば建設現場や歩道だ。「ロボットが人間に迷惑をかけずにこれらの環境に溶け込むには、人間と似た空間理解能力が必要だ」とハンケは言う。「ロボットが押されたり衝突したりしたときに、正確に自分の位置を取り戻す手助けができる。」

Coco Roboticsとの提携は始まりに過ぎない。ハンケは、Niantic Spatialが構築しているのは「ライブマップ」(Living Map)と呼ばれる超高精度の仮想世界シミュレーションの第一段階だと述べる。現実世界の変化に応じて変化するこのマップは、Cocoや他の企業のロボットが世界中を走行することで、新たな地図データの供給源となり、デジタル世界のレプリカをより詳細にしていく。

ハンケとマクレンドンによれば、地図は単により詳細になるだけでなく、ますます多くの機械に利用されるようになっている。これにより、地図の用途も変わる。長年、人間の位置特定に役立ってきた地図は、今や機械にとっても重要なツールとなる。2Dから3D、さらには4D(デジタルツインのようなリアルタイムシミュレーション)へと進化してきた基本原理は変わらない:地図上の点は空間や時間の点に対応している。

しかし、機械向けの地図は、むしろ人間が当然と考える情報を満載したガイドブックのように進化する必要がある。Niantic SpatialやESRIのような企業は、地図に説明を付与し、機械に見えているものを伝え、各物体に属性を付与しようとしている。「この時代の課題は、機械にとって有用な世界の記述を構築することだ」とハンケは言う。「私たちが持つデータは、世界のつながりや仕組みを理解する上で良い出発点だ。」

現在、世界モデルは非常に注目されている。Niantic Spatialはこれを明確に理解している。LLMは何でも理解しているように見えるが、日常の環境と対話する際にはほとんど常識を持たない。世界モデルはこの問題を解決するためのものだ。Google DeepMindやWorld Labsのような企業は、仮想の幻想世界を即座に生成し、それをAIエージェントの訓練場として使うモデルを開発している。

Niantic Spatialは、異なる角度からこの問題にアプローチしている。地図を十分に極致まで作り込めば、最終的にはすべてを捉えられるとマクレンドンは言う。「まだそこには到達していないが、その方向を目指している。今は、現実世界の再構築に集中している。」

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン