• Mavericks AI ニュース
  • Posts
  • Googleが最先端の世界モデル「Genie 3」を発表!動画生成AIの先に、マトリックスの世界が見えてきた

Googleが最先端の世界モデル「Genie 3」を発表!動画生成AIの先に、マトリックスの世界が見えてきた

他にも...ElevenLabsが動画に合った音楽を自動で生成する新機能を公開

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① Googleがリアルタイム対応の世界モデル「Genie 3」を発表!

日本時間8月5日、Google DeepMind社が、テキストから3D空間を生成できる世界モデル「Genie 3」を発表しました。「世界モデル」とは、映画マトリックスで描かれたようなシミュレーションゲーム空間を生成できるAIのことを指し、生成された3D空間内でPCキーボードを使って自由に移動することができます。

百聞は一見に如かずということで、是非以下のデモ動画をご覧ください。

昨年12月にリリースされた前身となる「Genie 2」と比べて、Genie 3は飛躍的な進化を遂げています。Genie 2は操作時間の上限が10-20秒で画質も360pと低かったのに対し、Genie 3では720pの高画質で数分間に渡って操作することが可能になりました。

さらにGenie 2とは異なりリアルタイム生成を実現しているほか、動画の途中で「天候を雨にして」「ドラゴンを出現させて」などとテキスト指示を与えることで、その後の展開を自由に分岐させることもできます

Genie 3とGoogleの他の動画生成AIモデルとの比較
Google DeepMind

Google DeepMind社によると、Genie 3は将来的にロボットを始めとして、現実世界で動作するAIエージェントの訓練・評価に利用できるとされています。このように汎用性高く「あらゆる世界を生成できる」モデルの開発はまだ研究フェーズであり、実用的なユースケースが出てくるのはまだまだ先だと考えられますが、AIがこの世界や物理法則を視覚的に理解するにあたっての大きな一歩であることは間違いないでしょう。

なおGenie 3に限らず、全世界的に見ても世界モデルの開発は活発化しており、例えばTencent社からは「Hunyuan 3D World Model」と呼ばれるオープンソースモデルがリリースされています。こちらはコンシューマー向けGPUでも動作可能な軽量モデルまで公開されており、AI動画制作のサポートツールとしても今後普及していくことが期待されます。

💡 Genie 3は現在一般公開されていませんが、公式サイトにて、動画の途中でテキスト指示を与えられる「Promtable world events」の擬似体験を行えます。

② ElevenLabsが動画に合った音楽を自動で生成する新機能を公開

「この動画にいい感じのBGMをつけて欲しい…」このようなタスクも、AIが満足な水準でこなせるようになってきました。

日本時間8月16日、音声生成AI企業のElevenLabsが、動画内容を解析して、動画に合う音楽を自動生成する「Video to Music」機能をリリースしました。是非以下のデモ動画を音声ONでご覧ください。

この機能の仕組みは非常にシンプルです:

(1) アップロードされた動画を解析して説明文を出力(説明文は必要に応じて編集可能)
(2) その説明文に適したサウンドトラックが動画に付与

処理も高速で、例えば6秒の動画であれば、わずか10秒程度で音声が生成されます。

実際に試してみた感想として、もちろん一つの動画に合うサウンドトラックは無数にあるため、思っていた通りの音楽がドンピシャで出てくることはほとんどありません。それでも、少なくとも動画に対して違和感のない音楽がほぼ毎回出てくることは確かであり、「とりあえず音声を足して動画をリッチにしたい」といった場面では有用だと感じました。

対応している動画の幅も広く、以下のようにアニメ映像にぴったりな雰囲気のサウンドトラックを生成することもできます。

Googleが今年5月にリリースしたVeo 3では、BGMだけでなく人の声も入った動画を一発で生成できますが、現状は1分100円ものコストがかかり、気軽には利用できません。それだけにこのような実用的な機能のリリースは、動画制作の効率化という観点で非常に価値あるアップデートと言えるでしょう。

💡 ElevenLabsのVideo to Music機能は、無料で試すことができます。詳しくは次のセクションをご覧ください。

③ 今ホットなAIコンパニオン。その需要は果たしてどれほどのものなのか

今年後半に入って、xAI社が音声対話できるAIガールフレンド「Ani」をリリースしたり、GPT-5よりも親近感のあるGPT-4oの復活を求める運動が勃発するなど、AIは単なる業務効率化ツールに留まらず、「アシスタント」や「コンパニオン」としての役割を果たすようになりつつあります。

ではその市場規模、成長率はどれほどのものなのでしょうか?モバイルアプリ分析会社Appfiguresが、AIコンパニオンアプリに関する興味深い分析結果を公開しています。

そもそもAIコンパニオンアプリとは、ユーザーが友人、恋人、彼氏・彼女、ファンタジーキャラクターなどのカスタムキャラクターと会話できるようなアプリを指します。代表例として、Character.AI、Replika、Chaiが名を連ねています。

AIコンパニオンアプリ市場は、2025年7月時点で8200万ドルの収益を生み出しており、昨年同期比64%の増加を見せています。ダウンロード数は6000万件に及び、ダウンロード当たりの収益で見ても2倍以上の増加を示して1.18ドルに達しています。

AIコンパニオンアプリの消費者支出と、ダウンロード当たりの消費者支出の推移。
Appfigures社による調査。
TechCrunch

参考として、同時期におけるChatGPTモバイルアプリの指標との比較を示します。収益とその成長率、ダウンロード数、ダウンロードあたり収益と、どれを取ってみてもまだChatGPT本体を食らうような勢いではないと言えます†。

Appfigures社により算出された、2025年1月〜7月におけるAIコンパニオンアプリ及びChatGPTの消費者支出(+前年比較)、ダウンロード数、ダウンロード当たりの消費者支出
(参考文献1:TechCrunch、参考文献2:TechCrunch

そしてやはり「AIガールフレンド」の需要はとりわけ高いようです。現在市場にあるアクティブなアプリのうち、17%がアプリ名に「girlfriend」を含んでおり、「boyfriend」や「fantasy」を含むのはそれぞれ4%に留まっています。「anime」「soulmate」「lover」といった用語を含むアプリはさらに少なくなります。

現在市場にあるアクティブなアプリの名前に、各単語がどれくらいの割合で含まれているかをまとめた表。Appfigures社による調査。
TechCrunch

ちなみに上記とは別の分析結果になりますが、Grokモバイルアプリのダウンロード数は、AIガールフレンド「Ani」で知られるコンパニオンモードがリリースされた翌日に40%増加したものの、収益は9%増に留まったようです。

このように収益化に向けては、まだ最新モデルリリースの方が重要なファクターであるようですが、この状況が今年末から来年にかけてどう変化していくか、引き続き動向を注視したいところです。

†あくまで「AIコンパニオン機能をメインで提供しているアプリ」についての分析結果であり、AIコンパニオンへの需要そのものはもっと大きく見積もられるべきでしょう。またAIコンパニオン市場はa16zが2024年のレポートにて言及するなど、元々大規模だと言われていたことから、成長率がChatGPTに劣ることは決して不思議でないと考えます。

2. SNSで話題のAIツールをピックアップ!

ElevenLabs Video to Music (https://elevenlabs.io/app/studio)

  • 音声AI ElevenLabsに新しく動画からサウンドトラックを生成できる新機能が登場

  • 内容を解析した上で、動画に合った音楽を生成してくれる。性能も高く、違和感のない音楽が高確率で出てくる

  • なお、Sunoのような音楽生成AI機能もリリースされているが、こちらは日本語性能がまだあまり高くない

  • 現在は無料で利用可能

  • Create.xyzとして知られたノーコードアプリ作成AIがリブランディングして新登場

  • バックエンド機能付きのwebアプリ、iOS / Androidアプリをテキスト指示だけで作れる

  • さらに課金なしに、ワンクリックでウェブやApp Storeへと公開できるのも魅力的

  • サインアップ時にクレジットが付与されるため、無料でも十分お試し可能

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在13万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は40社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちrまお是非チェックしてみてください!