• Mavericks AI ニュース
  • Posts
  • Googleが怒涛の発表。24時間年中無休のエージェント「Gemini Spark」に動画生成AI「Gemini Omni」まで目白押し!

Googleが怒涛の発表。24時間年中無休のエージェント「Gemini Spark」に動画生成AI「Gemini Omni」まで目白押し!

他にも...AIはエージェントからイノベーターへ。OpenAIモデルが80年来の数学の未解決問題を解決

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① Google I/O 2026の目玉はこれ。動画版Nano Bananaの「Gemini Omni」リリース!

米国時間5月19日、Google社が毎年恒例の開発者会議「Google I/O 2026」を開催しました。各種AI製品のアップデートが目白押しの中、個人的に最も印象に残ったのが、動画モデル「Gemini Omni」です。まずは是非、ユーザーの生成動画をまとめた以下の投稿をご覧ください。

Gemini Omniは、動画生成・動画編集それぞれに革新性を持つモデルです。一言で表すなら「動画版Nano Banana」と呼ぶのがぴったりでしょう。

まず動画生成AIとしてのGemini Omniが得意とするのは、テキストを含んだ動画生成です。以下のようなスライドや図解のアニメーション化はもちろん、広告でよく見かけるようなスタイリッシュなテキストアニメーションやカメラワークまで、適切に組み立ててくれます。

そしてNano Bananaが用語解説の図解をシンプルなプロンプトから生み出せたように、Gemini Omniも自身が持つ現実世界の知識を活用して動画を作り上げることができます。単なる「Text to Video」「Image to Video」の枠を超えて、ユーザーが本当に求めている動画に一発で辿り着けるのが魅力です。

もうひとつの強みが、動画編集タスクの性能の高さです。スタイル変換、物体の置換・削除テロップ入れといった編集操作を、過去最高レベルの精度でこなしてくれます。

このように、こなせるタスクの幅で言えば「動画版Nano Banana」という呼び名がピッタリですが、残念ながら精度や実用性の面では、本家Nano Bananaにはまだ及ばないのが実情です。日本語テキストの文字崩れは少なくなく、「春夏秋冬が移り変わるようにスタイル変換して」といった複雑な指示が通らない場面もしばしばありました。また、映画やアニメに代表されるクリエイティブな動画生成用途では、ByteDance社が今年2月に発表したSeedance 2.0の方が表現力・正確性ともに優れているという声がほとんどです。

加えて、Gemini OmniのAPI料金も現時点では公開されていません。Seedance 2.0では1秒の動画生成に約50円かかるなど、最先端の動画生成AIのコストはまだまだ下がっていないのが現状であり、コストを気にせず動画生成AIを利用できる時代の到来は、まだ先になりそうです。

💡 Gemini Omniは無料でも試すことができます。詳しくは次のセクションをご覧ください。

② 24時間年中無休で働くパーソナルAIエージェント「Gemini Spark」も発表!

今年のGoogle I/Oでもうひとつキャッチーだったのが、24時間年中無休のパーソナルAIエージェント「Gemini Sparkです。

年初にバイラルを巻き起こした「OpenClaw」のGoogle版とでも言うべきもので、Google Cloud上で動作します。米国の一部ユーザー向けに、ベータ版として公開が始まっています。

Gemini Sparkが他のAIエージェントと一線を画すのは、「24時間いつでも稼働可能」な点です。ChatGPTやClaude Codeを通常利用する時とは違って、ユーザーがPCを閉じている時であっても、自律的に稼働を始め、日毎・月毎のルーティンタスクを定期実行でこなしてくれます。

さらにGoogle製品との連携も強力です。Gmailをチェックして重要な通知を教えてもらったり、Google Meetの議事録を確認してクライアントへのメールドラフトを作ってもらったりと、まさに「パーソナルな秘書」のように働いてくれます

もっとも、AIエージェントに限らず、この手のボットはセットアップに多少なりとも手間がかかる上、通知が必要以上に多いとかえって迷惑になりがちです。生産性向上を本当に達成するには、自発的に定期実行フローを提案したり、ユーザーの要望を受けて常識的かつ柔軟に通知頻度を調整してくれるような機能が、さらに必要だと考えられます。

なお今回のGoogle I/Oでは、新しい会話型の検索機能「Ask YouTube」も興味深く感じました。例えば「子どもに自転車の乗り方を教えたい」と頼むと、YouTube動画を検索した上で、ワンクリックで該当箇所に飛べるよう、タイムスタンプ付きで引用しながら回答してくれる仕組みです。

他にも新モデル「Gemini 3.5 Flash」、AIエージェントアプリ「Antigravity 2.0」など様々な発表がなされましたが、全体を通じて、目新しい発表はGemini Omniを除いてほとんどなかったというのが個人的な所感です。

昨年のGoogle I/Oでは「Powerful」「Personal」「Proactive」という3本柱が掲げられていました。それぞれに多少の進歩こそ見られたものの、根本からの体験変革には至っていません。GoogleのAIサービスが一種の安定期に入りつつあることを示唆する機会となったのではないでしょうか。

昨年のGoogle I/Oで掲げられた3本の柱(過去のニュースレター

💡 Gemini Spark、Ask YouTubeはどちらも、米国にてロールアウトが開始されています。

③ AIはエージェントからイノベーターへ。OpenAIモデルが80年来の数学の未解決問題を解決

Anthropic社が今年4月に発表したClaude Mythos」は、セキュリティ特化型でない汎用モデルでありながら、世界的なソフトウェアを対象に、数十年間見過ごされてきた脆弱性をいくつも掘り出してみせました。現在も日々新たな脆弱性の発見が続いており、日本経済新聞で連日のように取り上げられるなど、金融業界を中心にニュース欄を騒がせ続けています。

AIが「世界最高レベルのセキュリティ研究者」と少しも劣らない学術能力を持っているなら、その実力は他分野でも顕現するはず。そんな仮説に強い裏付けを与える発表が、OpenAI社から飛び出しました。

同社の汎用AIモデルが、1946年にポール・エルデシュ氏が提起した離散幾何学の未解決問題「平面単位距離問題」について、一般的な予想を覆す証明を自律的に発見したというのです。

問題そのものは、高校生でも理解できるほどシンプルな形をしています。それでいて、数学者たちが80年に渡って取り組み続けてきた著名な難問でもありました。

これまでもOpenAIやGoogleのAIモデルが、国際数学オリンピックで金メダル相当のスコアを叩き出すことはありました。ただしそれらは、高々数時間で解けるよう人間が設計した問題です。

一方で今回対象となったのは、80年もの間、誰も解けなかった本物の未踏領域であり、OpenAI社によれば「数学の一分野の中核をなす著名な未解決問題が、AIによって自律的に解決された初めての事例」です。

また解法が独創的だったことも、数学者たちを驚かせました。

代数的数論という全く異なる数学分野からのアイデアを離散幾何学の証明に持ち込んでおり、「数学分野におけるノーベル賞」とも称されるフィールズ賞を受賞した元ケンブリッジ大学教授、ティモシー・ガワーズ氏は「独創的で巧妙なアイデア」と評しています。

元ケンブリッジ大学教授、ティモシー・ガワーズ氏は「私の意見では、この論文は現在のAIモデルが人間の数学者の単なるヘルパーにとどまらないことを示しています。彼らは独創的で巧妙なアイデアを持ち、それを形にできるのです。」と述べた
OpenAI

OpenAI社は過去にAGIへの道筋を、「チャットボット → リーズナー(推論者) → エージェント → イノベーター → オーガナイゼーション」の5段階で定めました。その中でもレベル4にあたる、新しいアイデアを自ら思いつき、未到達の領域を開拓できる「イノベーター」段階に、いよいよ手をかけつつあることが示唆されたのではないでしょうか。

2. SNSで話題のAIツールをピックアップ!

  • Google Labsが提供している画像・映像制作ツール

  • Googleが新たに発表した動画生成・編集AI「Gemini Omni」を無料でも数回試せる

  • さらに画像生成AI「Nano Banana 2」を無料で利用可能。一括で最大4枚並列で生成できる点も嬉しい

  • なおGoogle AIの有料プランに入っていれば、GeminiアプリからもOmniモデルを1日3回利用可能

  • TikTokを運営するByteDance社傘下の動画生成・編集AIツール

  • クリエイティブな動画生成AIでは現状最高性能との呼び声高い「Seedance 2.0」を試すことができる

  • エージェントモードを使用して、動画内容をAIと一緒に考えていくこともできる

  • ただし利用するためには、クレジットカードを登録して7日間の無料トライアルに登録する必要があることに注意

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!