- Mavericks AI ニュース
- Posts
- Googleが3D世界内を動き回れるAIエージェント「SIMA 2」を発表!身体を有するAIの未来が見えてきた
Googleが3D世界内を動き回れるAIエージェント「SIMA 2」を発表!身体を有するAIの未来が見えてきた
他にも...ChatGPTの「グループチャット」機能が公開!人間同様に会話に参加してくれる
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

📚 目次
1. 直近のビッグニュースTop 3
① Google DeepMindがビデオゲームをプレイして3D世界を動き回れるAIエージェント「SIMA 2」を発表
② ChatGPTの「グループチャット」機能が公開!人間同様に会話に参加してくれる
③ Disney+でユーザーがAIコンテンツを生成できるようになるかもしれない
2. SNSで話題のAIツールをピックアップ!
① Google Mixboard
② Group Chats in ChatGPT
1. 直近のビッグニュースTop 3
① Google DeepMindがビデオゲームをプレイして3D世界を動き回れるAIエージェント「SIMA 2」を発表
「AGIへ向けた重要な一歩」という記述は、研究成果に対する自信の表れでしょう。
Google DeepMind社は現地時間11月13日、私たち人間と同じようにビデオゲームをプレイできる、汎用的なAIエージェント「SIMA 2」を発表しました。
このエージェントはマウスやキーボードを駆使して、ゲーム上で「小さな洞窟に入って、石炭を採掘する」といったタスクをこなすことができます。今はまだバーチャル3D空間での活動に限られていますが、将来的に現実世界へ移行することができれば、実世界で稼働する汎用ロボットの実現が見えてきます。
Google DeepMind社はこのようなエージェントの開発に以前から取り組んでおり、今年3月に初代SIMAを発表していました。その頃と比べると、Gemini 2.5 Flash-liteの活用により、複数ステップの推論が必要な複雑なタスクもこなせるようになっており、タスク成功率は人間との差を大きく縮める65%にまで到達しています。

Google DeepMindが用意した評価用データセットにおける、SIMA 1, SIMA 2のタスク成功率の比較
(Google DeepMind)
また、SIMA 2は「自己改善」の仕組みを持ち合わせており、これにより学習済みのゲームだけでなく、全く新しいゲームにも対応することができます。新しい環境に適応するためのタスクを作成するGeminiモデルと、報酬を算出するモデルが存在し、これらを使って生成された訓練データを用いることで、エージェントは自らの失敗から学び、性能を向上させることができます。

SIMA 2の自己改善の仕組みを表した図
(Google DeepMind)
今回の成果は、私たちがエージェントと聞いて真っ先に思い浮かべる、リサーチやコード実行などを行うAIではなく、私たちと同じように身体を有し、身体を通じて世界と相互作用しながら行動をとっていく「Embodied AI」の実現、ひいては汎用ロボットの実現に向けた重要な一歩だと述べられています。
OpenAIの動画生成AI「Sora 2」やGoogleの世界モデル「Genie 3」で見られたように、AIは現実に即した世界を創造する能力を急激に獲得しつつあります。これから数年はそれだけでなく、未知の世界を探索し、スキルを習得しながら、タスクを完遂する能力がどれだけ向上していくのかにも注目したいところです。
② ChatGPTの「グループチャット」機能が公開!人間同様に会話に参加してくれる
今年の流行語大賞に「チャッピー」がノミネートされるなど、日本国内ではChatGPTをはじめとしたチャットAIが多くの人にとって身近な存在になりつつありますが、OpenAIはこの流れにさらに拍車をかけたいようです。同社は現地時間11月13日、ChatGPTの「グループチャット」機能を公開しました。
LINEのグループトークのように、他のユーザーやChatGPTグループに招待し、そこでChatGPTを交えてメンバー間で会話することができます。
この機能でChatGPTは、毎回発言すべきか否かを自ら判断し、必要と判断した時のみメッセージを送信してくれます。またLINEのリアクション同様に、絵文字を使ってメッセージに反応してくれるなど、私たち人間と同じように振る舞ってくれます。

ChatGPTのグループチャット機能における会話の様子
通常モードのChatGPT同様、web検索や画像生成の機能も備えており、OpenAIは公式発表の中で、以下のようなユースケースを挙げています:
・友人との旅行計画(目的地の比較、旅程の作成、持ち物リストの作成)
・裏庭の設計や家に飾るアート作品探し(デザインのアイデア出し、好み・スタイルの具現化)
・全員の好みに合うレストラン探し(フレンドリーに議論しつつも、公平に意思決定)
現在ChatGPTが広く支持されている主な理由として、「有能だから」「優しいから」という2つが挙げられます。上記のユースケースは基本的にChatGPTの有能さを活かすものであり、回答の正確さが求められますが、私が使用した限りでは、ChatGPTの回答の質が低いことが多く、自分だけでなく他メンバーにもノイズとなるため気軽には使いにくいと感じました。
ただしこのグループチャット機能は、対象を一部地域に絞った初期リリースです。2023年11月にGPTsが発表されて以降、「私たちの仕事や日常生活をあたかも人間のようにサポートしてくれるAGIを構築したい」というOpenAIの方針自体は一貫しています。
画面遷移なしに気軽にやり取りしたり、タスクを依頼できる体験は心地良いだけに、今後どのようにUXが改善されていくのか、そしてユーザーによってどのようなユースケースが発掘されていくのか注目したいところです。
💡 ChatGPTのグループチャット機能は、日本国内で無料ユーザーを含めて利用可能です。詳しくは次のセクションをご覧ください。
③ Disney+でユーザーがAIコンテンツを生成できるようになるかもしれない
ウォルト・ディズニー社の株主向け決算説明会で、CEOボブ・アイガー氏がDisney+に関する重大な戦略を明らかにしました。ユーザーがAIを使ってディズニーをテーマにしたコンテンツを生成・共有できる機能を導入する計画を示唆したのです。
特に、ショート動画を生成・消費できるようになるかもしれないと述べられており、もし実現すれば歴史的転換点となるでしょう。

Disney +アプリのホーム画面(Disney+)
ディズニー社は今年6月、著作権で保護されたIPと酷似したキャラクターが生成できることを理由にMidjourney社を提訴するなど、表向きには生成AIによるIPキャラクターを含んだコンテンツ生成に厳しい態度を示してきました。しかしここに来て、公式プラットフォーム構築という形でAIとの共存を模索する姿勢を打ち出してきました。

Midjourneyは「アナ雪」「モンスターズ・インク」などに登場する著作権保護されたキャラクターとほぼ同一のキャラクターを生成できてしまう。
(Vergeに掲載された訴状より)
このような動きは既に音楽分野で見られており、Universal Music Groupが音楽生成AIプラットフォームUdioを訴訟後、一転して先月、戦略的合意の締結と新プラットフォームの共同開発を発表しました。
新プラットフォームでは、ユーザーはAIを使って有名な曲を改変したり、歌手の声を元に新しい曲を作ったり、複数アーティストのスタイルをマッシュアップしたりできるようになる一方、生成コンテンツのダウンロードは禁止され、プラットフォーム内部で生成と消費が完結する設計になっています。
9月末のOpenAIによるSora 2リリース、そしてそれに対する世間の反応を見ても、AIによる著作権物に紐づくコンテンツ生成を完全に抑止することはもはや困難でしょう。そして、この問題に対する最も効果的な対策が、このような公式AIプラットフォームの構築だと思われます。
ディズニー社の今回の計画に関する情報はまだ少ないですが、根本的な方針が揺るがない限りは、関係者や大衆の理解を得るために、念入りな調整が着々と進められていくでしょう。
2. SNSで話題のAIツールをピックアップ!
Google Mixboard (https://labs.google.com/mixboard/welcome)
Google Labsがリリースした、コンセプトボードツール。AIで画像生成・編集を行い、ホワイトボード上に自由に配置できる
コンセプトに合う画像を一括で生成したり、類似画像を生成したりといった、アイデア出しに必要なタスクがシンプルな操作でできる点が嬉しい
また、画像に赤ペンで書き込んで修正できる機能が直感的で使いやすいと話題に
実験的機能なので、現在は無料で利用可能。先週より日本でも利用可能に

Group Chats in ChatGPT (chatgpt.com)
LINEのグループトークのような形で、友達やChatGPTを招待してチャットできる新機能が登場
ChatGPTが出番を自己判断した上で、必要な時のみメッセージやリアクションを送ってくれる
web検索機能も有しており、例えば友人との旅行計画がおすすめ用途として紹介
現在は無料プランのユーザーも利用可能

さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは?一番ためになったのは? |
運営元の紹介
株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLang」をリリースし、現在13万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は40社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。
今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。
採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

【🔥重大発表】🐬NoLang 4.0をリリースしました!
新モードで音声・動画入力に対応。あらゆるコンテンツを動画化可能に!
100体以上の新アバター追加。リアルアバターも搭載されバリエーション格段豊かに!
そしてついにNoLang APIを公開します!
今だけ無料キャンペーン中。他にも新機能が沢山👇
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
3:03 AM • Jul 28, 2025