- Mavericks AI ニュース
- Posts
- Geminiが音楽生成AI搭載で、真のマルチモーダルモデルに進化を遂げた!さらに新モデルGemini 3.1 Proもリリース
Geminiが音楽生成AI搭載で、真のマルチモーダルモデルに進化を遂げた!さらに新モデルGemini 3.1 Proもリリース
他にも...Anthropicが「Claude Code Security」を発表。セキュリティ株が次々急落
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

📚 目次
1. 直近のビッグニュースTop 3
① ついにGeminiに音楽生成AIが搭載!マルチモーダルを活かしてSuno, Udioとは別路線へ
② Googleが「Gemini 3.1 Pro」をリリース!Geminiらしさを残して順当進化
③ Anthropicが「Claude Code Security」を発表。セキュリティ株が次々急落
2. SNSで話題のAIツールをピックアップ!
① Gemini, Lyria 3
② Suno
1. 直近のビッグニュースTop 3
① ついにGeminiに音楽生成AIが搭載!マルチモーダルを活かしてSuno, Udioとは別路線へ
昨年末から激しい変化を見せていた音楽生成AI分野に、ついにGoogleが参入してきました。
米国時間2月18日、GoogleがAIアシスタントGeminiに音楽生成AI「Lyria 3」を搭載しました。最大30秒のボーカル付きの楽曲を生成可能であり、画像生成AI「Nano Banana」でカバー画像も自動生成してくれるというキャッチーな機能も含めて話題を呼んでいます。
音楽生成AIツールとしてはSunoやUdioが有名ですが、Lyria 3はこれらとどのように違うのでしょうか?
最大の違いはターゲット層です。SunoやUdioが主にプロ向けの機能を拡充しているのに対し、Lyria 3は、Geminiのマルチモーダル性を活かしたライト層向けのツールとして提供されています。
実際、使い方は非常に簡単です。いつものようにGeminiを開き、あらかじめ用意された16の音楽ジャンルの中から好きなものを選んだら、あとはプロンプトを入力するだけです。また画像や動画も入力可能な点もユニークで、公式発表では、旅行で撮影した思い出の写真に合う音楽を作成するなど、日常使いできるAIであることが強調されています。

Lyria 3の操作画面。16の音楽ジャンルの中から好きなものを選んでプロンプトを入力するだけで簡単に音楽を生成できる。
音楽AI分野で特筆すべきこととして、著作権の取り扱いについて非常にセンシティブな点が挙げられます。現在は一部和解したものの、2024年6月には、米三大レーベル(Sony Music、UMG、Warner)が音楽生成AI 2トップのSunoとUdioを著作権侵害で提訴しました。それだけに各社が参入を見送っていた領域であり、実はビッグテックが自社開発のモデルをもとに、ボーカル付きの楽曲生成サービスを提供したのは、私が知る限り今回が初めてです。
Lyria 3は、音楽生成AIとしての性能はSunoやUdioに劣るという声が多いです。特に楽曲の自由度が低く同じような音楽になりがちで、AIモデルとしての性能にはまだ改善の余地が大きいでしょう。
もちろんSunoやUdioも手をこまねいているわけではなく、それぞれかつて「敵」同士であったレーベルと業務提携を行い、正当な形でアーティストの楽曲をもとにした音楽が生成できるプラットフォームの公開に向けた準備を進めています。各社からの更なる発表に注目したいところです。
💡 Lyria 3はGeminiアプリで無料で試すことが可能です。詳しくは次のセクションをご覧ください。
② Googleが「Gemini 3.1 Pro」をリリース!Geminiらしさを残して順当進化
昨年11月にリリースされたGoogle社のAIモデル Gemini 3.0 Pro は、「AIっぽくないデザイン」を生成できるようになったことで、デザイン分野におけるゲームチェンジャーとなりました。
それから3ヶ月。米国時間2月19日に、Google社が後継モデル「Gemini 3.1 Pro」をプレビュー版としてリリースしました。前モデルでは実現できなかったような新たなユースケースはまだ発掘されていないものの、着実な知能の向上を感じさせるアップデートです。
中でも最も印象的だったのは、SVGアニメーション作成性能の向上です。是非以下の前モデルとの比較動画をご覧ください。
SVGとは、プログラムで書かれたベクター画像・動画のことを指します。Geminiはもともとデザイン能力に長けたAIモデルであり、webサイトやスライド画像の生成において抜群の表現力を有していましたが、今回新たにSVGという表現手段を獲得した形です。
またGeminiにはOpenAI社やAnthropic社のモデルと比較して、検索機能を使いこなすのが得意ではない、コーディング実務において使いにくいといった特有の弱点を持つことが知られていましたが、こうした弱点に関しても一定軽減されているようです。実際、Artificial Analysis社による評価でハルシネーション率が減少したことが話題になりました。

存在しない「NoLang 5.0」についてGemini 3.0 Pro, Gemini 3.1 Proに尋ねた結果。このケースではGemini 3.1 Proのみが正しく回答できている。
もっとも、Geminiは良くも悪くも「Geminiらしさ」を保っており、他社モデルと比べて苦手領域の評価を覆すには至っていない印象です。OpenAI社は検索と推論、Anthropic社はコーディング、そしてGoogle社はデザインと柔軟性。各社がそれぞれの得意領域を磨きながら鍔迫り合いを続ける構図は、まだまだ続きそうです。
💡 Gemini 3.1 ProはGeminiアプリ、Google AI Studioなどで無料で試すことが可能です。詳しくは次のセクションをご覧ください。
③ Anthropicが「Claude Code Security」を発表。セキュリティ株が次々急落
米国時間2月20日、Anthropic社がコードベース全体の脆弱性をスキャンし、人間のレビュー用に修正パッチを提案するツール「Claude Code Security」を発表しました。従来のルールベースによる静的解析に留まらず、AIエージェントの自律性を活かして人間のセキュリティ研究者のようにコードを読み、複雑な脆弱性までも検出可能な点が画期的です。
セキュリティ分野におけるAIのポテンシャルは凄まじく、Anthropic社はClaude Opus 4.6を活用し、数十年にわたり専門家のレビューをすり抜けてきた500件以上高深刻度の脆弱性を、オープンソースのコードベースにおいて発見したと報告しています。
今年に入ってから、Claude Codeやそれを非開発者向けにアレンジしたCoworkにおいて、各種ソフトウェアを代替するような機能が追加されることにより、ソフトウェア株が下落する現象が相次いでいます。今回も例外ではなく、JFrog社の株価が約25%急落したほか、Cloudflare社、Okta社といった大手企業も大きな影響を受けています。

Claude Code Securityの発表を受けて、JFrog社の株価は1日で25%下落した
もっとも今回の市場の反応は短絡的であると言わざるを得ず、むしろセキュリティ企業にとって追い風になる可能性も十分にあります。
第一に、Claude Code Securityのようなコード検査AIが保証できる安全は、セキュリティの全体像から見れば氷山の一角にすぎません。実際に対処できるのはコードの脆弱性に限られており、運用面のセキュリティやアイデンティティ管理(例:2段階認証)といった領域は無数に残されています。
第二に、AIの性能向上は守備側だけでなく攻撃側も「スキル強化」と「スケール」の2点から強化するという構造的な問題があります。
この脅威はすでに現実のものとなっており、国内では昨年、中高生が生成AIを使ったプログラムで楽天モバイルの回線を1,000件以上不正契約したとして逮捕されました。また国家規模の攻撃においても、Anthropic社は中国の国家支援グループがClaude Codeを利用して世界約30組織を標的にし、戦術的操作の80〜90%をAIに自律実行させていたと報告しています。AIはサイバー攻撃の敷居を大幅に引き下げると共に、熟練したハッカーによる攻撃規模を拡大させているのです。
AIエージェントの能力は、少なくないスタートアップがコードの80〜90%がAIで生成されていると発信する水準にまで到達しました。そのような「転換点」を迎えている今年は特に、サイバー攻撃のリスクが顕在化していくのではないでしょうか。
💡 Claude Code Securityは現在、Enterprise, Teamプランなどユーザーを対象に、限定リサーチプレビュー版として提供が開始されています。
2. SNSで話題のAIツールをピックアップ!
Gemini, Lyria 3 (https://gemini.google.com/)
Geminiに音楽生成AI「Lyria 3」と新モデル「Gemini 3.1 Pro」が搭載
Lyria 3は「ツール → Create music」で呼び出せる。テキスト・画像・動画を入力できるマルチモーダルモデルで、公式提供されているプロンプトガイドを参照するのがおすすめ
Gemini 3.1 Proは、テキストボックス右下で「Pro」を選択することで利用可能。あるいはGoogle AI Studioでも利用できる
どちらも無料でも試すことが可能。ただしGemini 3.1 Proはやや挙動が不安定であることに注意

Suno (https://suno.com)
現在、最も人気が高いと言われる音楽生成AIツール
Google Lyria 3と異なり、歌詞・音楽のスタイル・歌い手の性別等を細かく指定できる
さらに既に作成した音楽を参照させ、歌手・スタイルを固定して音楽を生成できる「Persona」機能もある
SimpleモードではなくCustomモードを選択し、作りたい曲のテーマを考えたら、歌詞、スタイルをそれぞれChatGPTに考えさせて音楽生成するのがおすすめ

さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは?一番ためになったのは? |
運営元の紹介
株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLang」をリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。
今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。
採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://
