概要
Google DeepMindは、指示を理解し、推論し、仮想環境で新しいスキルを自ら習得できるSIMA 2 AIエージェントを発表しました。人間レベルのタスク完了に近づいています。

テクノロジー企業GoogleのAI部門であるGoogle DeepMindは、スケーラブルな指示可能なマルチワールドエージェントの最新バージョンであるSIMA 2を発表しました。これは、より能力の高い汎用AIエージェントに向けた一歩を示しています。
ジェミニモデルの高度な推論能力に基づいて構築されたこのシステムは、仮想環境における基本的な指示に従うことを超えて、目標を解釈し、ユーザーと会話し、時間とともにパフォーマンスを向上させるインタラクティブなコンパニオンとして機能します。
最初のSIMAモデルは、統合されたゲームメカニクスではなく、画面入力を観察し、バーチャルコントロールで操作することによって、商業ビデオゲーム全体で数百の言語駆動のアクションを学習しました。
SIMA 2はこのアプローチを進め、Geminiをコアとして組み込むことで、エージェントが目標指向の推論を行い、意図した行動を説明し、ゲーム内でより複雑なタスクを実行できるようにしています。人間のデモとGemini生成の注釈の組み合わせでトレーニングされたこのエージェントは、複数の開発者とのパートナーシップを通じて、より広範なゲームセットでテストされています。このアップデートは、動的な3D環境内での知覚、推論、行動を組み合わせた具現化されたAIにとって重要なステップを示しています。
Geminiの統合により、SIMA 2は未知のコンテキストで一般化し、信頼性を持って操作する能力が強化されました。エージェントは、より詳細で微妙な指示を解釈し、これまで遭遇したことのないゲーム、たとえばバイキングをテーマにしたタイトルのASKAや、Minecraftの研究バージョンであるMineDojoにおいても、それらを成功裏に実行できるようになりました。
異なる環境で学習した概念を適用する能力—例えば、あるゲームから「マイニング」のアイデアを別のゲームの「ハーベスティング」に拡張すること—は、広範な一般化の重要な要素を形成し、そのパフォーマンスを人間のプレイヤーに近づけます。
これらの能力を評価するために、SIMA 2は、テキストや画像のプロンプトから新しい環境を生成するGenie 3によって作成された手続き的に生成された3D世界内でもテストされました。これらの不慣れな設定の中で、エージェントは依然として効果的にナビゲートし、指示を解釈し、ユーザーが定義した目標に向かって作業することができ、類似のシステムでは以前に観察されなかった適応性のレベルを示しました。
同社によると、SIMA 2の最も注目すべき発展の一つは、自らの性能を向上させる新たな能力です。トレーニング中、エージェントは、Geminiからのフィードバックと反復的な試行錯誤を組み合わせることで、ますます複雑なタスクを引き受けることができることを示しました。最初は人間のデモンストレーションから学んだ後、SIMA 2は、自律的なプレイを通じて新しいゲームで進歩を続け、追加の人間データを必要とせずに不慣れな環境でスキルを獲得します。この経験は、その後、より能力のあるAIエージェントのバージョンをトレーニングするために使用され、その同じ自己改善プロセスが、ジェニー生成環境内で成功裏に適用されており、さまざまな合成世界にわたる一般エージェントのトレーニングに向けた重要な進展を示しています。この継続的な洗練のサイクルは、エージェントが最小限の人間の指導で学ぶことを可能にするという長期的な目標を支援します。
SIMA 2の様々なゲーム環境での運用は、一般的な知能の重要なテストグラウンドを提供し、スキルを習得し、推論を練習し、自己主導的な行動を通じて継続的に学ぶことを可能にします。このシステムは、一般的でインタラクティブな具現化された知能への重要なステップを示していますが、明確な研究段階の限界を保持しています。このエージェントは、延長された推論や繰り返しの目標確認を必要とする複雑で長期的なタスクに苦しみ続けており、低遅延の相互作用が必要なため、メモリは短いままです。細かいアクションの精度や複雑な3Dシーンの視覚的理解も、分野全体でのより広範な課題として残っています。
このプロジェクトは、幅広い能力が多様なトレーニングデータと強力な推論能力によって支えられるアクション指向のAIアプローチの可能性を示しています。SIMA 2は、これらの要素が別々の専門システムに分離されるのではなく、単一の汎用エージェントに統合できることを示しており、ロボティクスにおける将来の応用に向けた有望な道筋を提供します。仮想環境で学んだ多くのスキル—ナビゲーション、ツール使用、共同作業の処理など—は、具現化されたAIの基本的な要素に変換されます。
SIMA 2は、インタラクティブで人間中心の研究エージェントとして設計されており、その開発には特に自己改善メカニズムに関する責任ある実践への明確な焦点が含まれています。チームはプロジェクト全体で責任あるイノベーションの専門家と協力しており、SIMA 2を限られた研究プレビューとしてリリースし、選ばれた学者やゲーム開発者に早期アクセスを提供しています。この段階的アプローチにより、技術とその潜在的影響がさらに探求される中で、継続的な監視、フィードバック、および学際的評価が可能になります。
5.77K 人気度
8.05K 人気度
11.71K 人気度
4.99K 人気度
125.97K 人気度
Google DeepMindがSIMA 2を発表:3Dバーチャルワールドでプレイ、推論、学習が可能なAIエージェント
概要
Google DeepMindは、指示を理解し、推論し、仮想環境で新しいスキルを自ら習得できるSIMA 2 AIエージェントを発表しました。人間レベルのタスク完了に近づいています。

テクノロジー企業GoogleのAI部門であるGoogle DeepMindは、スケーラブルな指示可能なマルチワールドエージェントの最新バージョンであるSIMA 2を発表しました。これは、より能力の高い汎用AIエージェントに向けた一歩を示しています。
ジェミニモデルの高度な推論能力に基づいて構築されたこのシステムは、仮想環境における基本的な指示に従うことを超えて、目標を解釈し、ユーザーと会話し、時間とともにパフォーマンスを向上させるインタラクティブなコンパニオンとして機能します。
最初のSIMAモデルは、統合されたゲームメカニクスではなく、画面入力を観察し、バーチャルコントロールで操作することによって、商業ビデオゲーム全体で数百の言語駆動のアクションを学習しました。
SIMA 2はこのアプローチを進め、Geminiをコアとして組み込むことで、エージェントが目標指向の推論を行い、意図した行動を説明し、ゲーム内でより複雑なタスクを実行できるようにしています。人間のデモとGemini生成の注釈の組み合わせでトレーニングされたこのエージェントは、複数の開発者とのパートナーシップを通じて、より広範なゲームセットでテストされています。このアップデートは、動的な3D環境内での知覚、推論、行動を組み合わせた具現化されたAIにとって重要なステップを示しています。
Geminiの統合により、SIMA 2は未知のコンテキストで一般化し、信頼性を持って操作する能力が強化されました。エージェントは、より詳細で微妙な指示を解釈し、これまで遭遇したことのないゲーム、たとえばバイキングをテーマにしたタイトルのASKAや、Minecraftの研究バージョンであるMineDojoにおいても、それらを成功裏に実行できるようになりました。
異なる環境で学習した概念を適用する能力—例えば、あるゲームから「マイニング」のアイデアを別のゲームの「ハーベスティング」に拡張すること—は、広範な一般化の重要な要素を形成し、そのパフォーマンスを人間のプレイヤーに近づけます。
これらの能力を評価するために、SIMA 2は、テキストや画像のプロンプトから新しい環境を生成するGenie 3によって作成された手続き的に生成された3D世界内でもテストされました。これらの不慣れな設定の中で、エージェントは依然として効果的にナビゲートし、指示を解釈し、ユーザーが定義した目標に向かって作業することができ、類似のシステムでは以前に観察されなかった適応性のレベルを示しました。
SIMA 2は一般化と自律学習における新しい能力で自己改善するAIを進化させます
同社によると、SIMA 2の最も注目すべき発展の一つは、自らの性能を向上させる新たな能力です。トレーニング中、エージェントは、Geminiからのフィードバックと反復的な試行錯誤を組み合わせることで、ますます複雑なタスクを引き受けることができることを示しました。最初は人間のデモンストレーションから学んだ後、SIMA 2は、自律的なプレイを通じて新しいゲームで進歩を続け、追加の人間データを必要とせずに不慣れな環境でスキルを獲得します。この経験は、その後、より能力のあるAIエージェントのバージョンをトレーニングするために使用され、その同じ自己改善プロセスが、ジェニー生成環境内で成功裏に適用されており、さまざまな合成世界にわたる一般エージェントのトレーニングに向けた重要な進展を示しています。この継続的な洗練のサイクルは、エージェントが最小限の人間の指導で学ぶことを可能にするという長期的な目標を支援します。
SIMA 2の様々なゲーム環境での運用は、一般的な知能の重要なテストグラウンドを提供し、スキルを習得し、推論を練習し、自己主導的な行動を通じて継続的に学ぶことを可能にします。このシステムは、一般的でインタラクティブな具現化された知能への重要なステップを示していますが、明確な研究段階の限界を保持しています。このエージェントは、延長された推論や繰り返しの目標確認を必要とする複雑で長期的なタスクに苦しみ続けており、低遅延の相互作用が必要なため、メモリは短いままです。細かいアクションの精度や複雑な3Dシーンの視覚的理解も、分野全体でのより広範な課題として残っています。
このプロジェクトは、幅広い能力が多様なトレーニングデータと強力な推論能力によって支えられるアクション指向のAIアプローチの可能性を示しています。SIMA 2は、これらの要素が別々の専門システムに分離されるのではなく、単一の汎用エージェントに統合できることを示しており、ロボティクスにおける将来の応用に向けた有望な道筋を提供します。仮想環境で学んだ多くのスキル—ナビゲーション、ツール使用、共同作業の処理など—は、具現化されたAIの基本的な要素に変換されます。
SIMA 2は、インタラクティブで人間中心の研究エージェントとして設計されており、その開発には特に自己改善メカニズムに関する責任ある実践への明確な焦点が含まれています。チームはプロジェクト全体で責任あるイノベーションの専門家と協力しており、SIMA 2を限られた研究プレビューとしてリリースし、選ばれた学者やゲーム開発者に早期アクセスを提供しています。この段階的アプローチにより、技術とその潜在的影響がさらに探求される中で、継続的な監視、フィードバック、および学際的評価が可能になります。