- Mavericks AI ニュース
- Posts
- Googleが怒涛の追い上げ。オープンソースAIエージェント「Gemini CLI」を公開
Googleが怒涛の追い上げ。オープンソースAIエージェント「Gemini CLI」を公開
他にも...AnthropicがMCPサーバーを誰でもドラッグ&ドロップでインストールできる新しい仕組みを公開

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

📚 目次
1. 直近のビッグニュースTop 3
① GoogleがオープンソースAIエージェント「Gemini CLI」を公開!
② AnthropicがMCPサーバーを誰でもドラッグ&ドロップでインストールできる新しい仕組みを公開
③ Google Labsが試着AI「Doppl」をリリース。似合っているかが動画で分かる
2. SNSで話題のAIツールをピックアップ!
① Gemini CLI
② HeyGen Avatar IV
1. 直近のビッグニュースTop 3
① GoogleがオープンソースAIエージェントを「Gemini CLI」を公開!
Googleがターミナルから直接AIエージェントを利用できる「Gemini CLI」をオープンソースで公開しました。一言でまとめるならば「Google検索が標準装備されたClaude Code」という位置付けになるでしょう。
このようなツールの最も主要な用途はもちろんコーディングですが、それ以外の用途でも幅広く活用可能であり、是非とも概要を押さえておきましょう。
Introducing Gemini CLI, a light and powerful open-source AI agent that brings Gemini directly into your terminal. >_
Write code, debug, and automate tasks with Gemini 2.5 Pro with industry-leading high usage limits at no cost.
— Google AI Developers (@googleaidevs)
1:13 PM • Jun 25, 2025
Gemini CLIをはじめとするCLIツール最大の特徴は、「AIがPC内のあらゆるファイルを読み書きできる」ことにあります。Geminiは画像の読み取りにも対応していることから、例えばPCに保存された画像のファイル名を分かりやすく書き換えてもらったり、散らばった領収書画像を月ごと、用途ごとに自動で分類させたりすることが可能です。

Gemini CLIにて画像ファイル名の自動変換を実行した様子。ターミナルから自然言語で指示を出すだけで、画像内容を読み取って適切に変換してくれていることがわかる。
さらにGemini CLIはMCPに対応していることから、様々な外部ツールを呼び出すことができます。例えば、画像生成・動画生成AIでメディアを作成して自作のウェブサイトに挿入したり、ローカルファイルとNotionのファイルを同時に参照させてプロジェクト概要をまとめたファイルを作成したりといったタスクも遂行できます。
競合のClaude Codeがプレビュー版としてリリースされたのは今年2月のことですが、Gemini CLIの本格的な開発が始まったのは、GitHubに最初のコミットがなされた今年4月であり、開発期間はわずか数ヶ月間と推察されます。そして制限なしで利用するために月100ドルを支払う必要があるClaude Codeとは対照的に、Gemini CLIは現在、無料で一日1000リクエストまで利用可能となっており、実質無制限で使用できます。

MCPの図解。Claude, CursorといったアプリとSlack, Gmailといったツールを連携する際に準拠すべき規格であることから、「USB Type-C」のようなものと説明される
(引用元)
しかしながら、まだ荒削りな点も多いのが現状です。指示への理解度が低く、必要以上に逆質問してきて気が利かないなど、Claude Codeと比較すると使い心地は劣っていると感じます。またウェブ検索機能を使用した際、参考文献のURLを確認することもできませんでした。
総じて、Claude Codeを性能や利便性で上回っていると感じられる場面はほとんどありませんでしたが、今後の改善に期待したいところです。
誰でも安心して使えるよう自由度が制限されているウェブサービスとは異なり、CLIツールの利用には高いリテラシーが求められます。例えば、ファイルを削除する「rmコマンド」を誤ってAIに使わせてしまうと、削除されたファイルは二度と復元できません。
それでもプリミティブな操作を自由に行えることの価値は高く、さらにこの1年でAIのエージェント能力が飛躍的に向上し、安心してAIに作業を委任できる土台が整ってきています。AI・PC双方に精通した玄人向けのツールとして、今後も着実に普及していくでしょう。
💡 Gemini CLIは、Mac, Windows, Linuxの主要なOSにて無料で試すことが可能です。詳しくは次のセクションをご覧ください。
② AnthropicがMCPサーバーを誰でもドラッグ&ドロップでインストールできる新しい仕組みを公開
Anthropic社が、MCPサーバーを誰でも簡単にインストールできる画期的な仕組みを発表しました。6月27日にリリースされた「Claude Desktop Extensions」により、MCPサーバーを.dxtという専用の拡張子を持つファイルとして扱うことが可能となります。その結果例えばClaude Desktopアプリでは、dxtファイルをドラッグ&ドロップするだけで瞬時にMCPの機能をインストールできるようになります。
Local MCP servers can now be installed with one click on Claude Desktop.
Desktop Extensions (.dxt files) package your server, handle dependencies, and provide secure configuration.
— Anthropic (@AnthropicAI)
4:27 PM • Jun 26, 2025
これによりLLMと外部ツールの連携が一層手軽になり、NotionとLLMの連携や、LLMからSlackへの通知機能などを、プログラミング経験のないユーザーでもGUIで簡単に実現できるようになります。
元々MCPは、LLMの外部ツール連携における「標準規格」を確立した点が革新的でした。従来LLMをツールと連携させるためには、各ツール提供元のAPIドキュメントを詳細に読み込み、プログラムを一から実装する必要がありました。しかしMCPの登場により、JSONファイルを数行編集するだけで連携が完了するようになったのです。
このような利便性が開発者コミュニティから高く評価され、昨年12月のリリース以降、MCPは瞬く間に普及しました。今月に入ってもGoogleによるGemini CLIでの採用や、ChatGPTでの一部利用開始など、AI業界におけるデファクトスタンダードとしての地位を確固たるものにしています。
ところで、ChatGPTの登場から2年半が経過しAIが人々の生活に急速に浸透し続けているにも関わらず、AIツールへの課金に対する抵抗感は世界的に根強いのが実情です。米Menlo Venturesの消費者向けAI動向調査によれば、約20億人がAIを利用している一方で、総消費額は120億ドルにとどまり、実際にAIツールに課金しているユーザーは全体のわずか約3%に留まっています。

(左)約18億人の消費者ユーザーがAIを利用しており、うち6億人は毎日利用
(真ん中)消費者ユーザーによるAIツール費用総額は120億ドルに留まり、うち81%がChatGPTをはじめとする汎用的なAIアシスタント
(右)AIツールに課金しているユーザーは全体の3%
(Menlo Ventures)
しかし同時に、AIツールで提供される機能が高度化した結果、Genspark(リサーチ)、Luma AI(動画生成)、Cursor(コーディング)など、かつては無料プランでも十分に利用できていたツールがあ、今では課金なしにはほとんどの機能を試せなくなっています。
技術進歩によるコスト低下を考慮しても、今後エージェント化の流れが加速してタスクが大規模になっていくことで、タスクあたりの利用単価はさらに上昇していくでしょう。
このような状況を踏まえると、AIを積極的に活用するユーザーとそうでないユーザーとの間での格差が拡大していくことが懸念されます。そして今回のAnthropic社の発表のような、AI利用の障壁を下げる取り組みは、今後一層意義を増していくのではないでしょうか。
③ Google Labsが試着AI「Doppl」をリリース。似合っているかが動画で分かる
Googleが実験的AIプロダクトのリリース場であるGoogle Labsを通じて、試着AIサービス「Doppl」をiOS・Androidアプリとして米国向けにリリースしました。ユーザーが自分の全身写真と好きな服の写真をアップロードするだけで、バーチャル試着を体験することができ、手元にない服でも、自分にどの程度合うかを画像で確認できます。
自分の体型が反映されるのはもちろん、生成された画像を動画化し、動いた時の見え方まで事前にチェックでき、いよいよ試着AIが実用レベルに達してきた印象です。是非以下のデモ動画をご覧ください。
🚨 NEW LABS EXPERIMENT 🚨
Introducing Doppl, a new mobile app that lets you upload a photo or screenshot of an outfit and then creates a video of you wearing the clothes to help you find your ✨aesthetic ✨
Available on iOS and Android in the US to users 18+, download the
— Google Labs (@GoogleLabs)
5:15 PM • Jun 26, 2025
ユーザーによる使用報告を見ると、現在は実験版ということもあり、髪がバッサリ切られてしまうといった不具合も見受けられますが、全体としてはかなり忠実に再現されている印象で、Google検索などの自社サービスに正式に統合される日が待ち遠しいです。
このDopplのリリースは、Googleが先月の年次会議Google I/Oで発表したAIネイティブな検索機能「AI Mode」の大幅アップデートに向けた布石と言えるでしょう。実際AI Modeには試着機能に加えて、ショッピング体験をサポートする以下のような機能が搭載される予定です:
・「5月にオレゴン州ポートランドへ行くのに適したバッグが欲しい」と伝えると、雨天や長距離移動に適したバッグの条件を同時に複数検索し、防水性に優れたポケットが使いやすいバッグをレコメンド
・気に入った商品があったがすぐに購入できない時、支払い金額を設定するだけで自動で価格の追跡が設定。基準が満たされたら通知が届き、その場でワンクリックで購入完了

今後Google検索のAI Modeにて、商品の希望購入価格を設定することで、値下げにより基準が満たされた時に通知が届き、その場でワンクリックで購入が完了する機能が導入される予定
(Google)
このようにGoogleは、検索体験をAIで強化しつつ、検索の先にある購入・予約といった決済行為に至るまでAIを活用することで、ユーザーを囲い込む戦略を着実に進めています。
先週OpenAIがAIチップ供給の多角化を図るためにGoogle TPUの使用を開始したとThe Informationが報じましたが、Googleは現在、モバイル端末Android、AIチップTPU、クラウドコンピューティングサービスGCP、検索エンジンGoogle、webブラウザChrome、さらにはGoogle Workspaceを中心に様々なアプリケーションまで保有しています。今後もあらゆる領域にAIを組み込んでいくことで、競争優位性を一層高めていくことでしょう。
💡 Dopplは現在米国のみで利用可能であり、日本でのリリース時期については明らかにされていません。
2. SNSで話題のAIツールをピックアップ!
Gemini CLI (https://cloud.google.com/blog/ja/topics/developers-practitioners/introducing-gemini-cli/)
GoogleがリリースしたターミナルからAIエージェントを操作できるツール
Claude Codeと提供されている機能はほとんど同じだが、web検索機能が標準搭載されている点がアドバンテージ
現在無料で、1日あたりなんと1000リクエストを送信可能。実質無制限で利用できる
さらにWindowsで原則利用不可のClaude Codeと異なり、Mac, Linux, Windowsの主要なOS全てで利用できる点も嬉しい

HeyGen Avatar IV (https://www.heygen.com/)
有名なAIアバター動画生成ツールHeyGenの最新機能
顔写真を1枚アップロードするだけで、スクリプトや音声に合わせて人物が喋る動画を作れるが、写真から生成されたとは思えないほどリアルだと随所で話題に
アバターにやってほしいジェスチャーまで自然言語で指定できる点も画期的
ホーム画面から「Try Avatar IV」を選択して無料でも試すことが可能

さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは?一番ためになったのは? |
運営元の紹介
株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLang」をリリースし、現在13万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は40社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。
今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。
採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

【🔥重大発表】🐬NoLang 3.0をリリースしました!
縦型ショート動画を直接生成・編集可能に。今だけ無料で試せます!
さらに編集機能が一新され、制作できる動画の幅が大きく広がりました!
他にも、「どんなPDFも1分要約」「話題の画像生成AI Imagen3」など注目機能が盛り沢山。詳しくは👇
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
12:52 AM • Mar 17, 2025