• Mavericks AI ニュース
  • Posts
  • AI搭載ブラウザが常識を覆した!GensparkがAIエージェントをワンクリックで呼び出せる新ブラウザをリリース

AI搭載ブラウザが常識を覆した!GensparkがAIエージェントをワンクリックで呼び出せる新ブラウザをリリース

他にも...OpenAIが新モデルo3 proをリリース!

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① AIエージェントをワンクリックで呼び出せる次世代ブラウザ「Genspark AI Browser」がリリース

Genspark開発元のMainFunc社が、ChromiumベースのAIブラウザ「Genspark AI Browser」をリリースしました。以下のような単純ではあるものの、手動でやると手間のかかる作業をワンクリックで完了できる点が画期的です。

・webページに埋め込まれた画像やグラフについて質問

・YouTubeで紹介されている文献を一括ダウンロード

・ECサイトで見つけた商品がより安価に販売されていないか、web全体を調査

是非以下のデモ動画にて、実際に動作する様子をご覧ください!

Gensparkは以前からスライド生成、画像・文献の収集、詳細な検索、画像生成など多岐にわたるタスクを実行できる汎用AIエージェントとして開発されており、複数のツールを行き来することなくオールインワンツールとして活用できることが大きな強みでした。

Gensparkで利用可能な機能一覧。「チャット」「画像・動画生成」といった基本ツールから「スライド生成」「webコンテンツ収集」「ディープリサーチ」といったAgentツールまで展開されており、さらに上位の概念として、あらゆるタスクをこなしてくれる「Super Agent」が存在する。
Genspark公式ページよりClaude Sonnet 4で作成。

それゆえ、冒頭で紹介したタスクは従来でも、ブラウザから得た情報をGensparkに貼り付けることで遂行可能でしたが、「ツールを使うために画面を移動するのが面倒」という問題は残存していました。

Genspark AI Browserではこの課題を解決すべく、Amazonでは商品比較や口コミ分析、YouTubeでは動画要約やスライド生成といったように、各サイトに最適化されたボタンが搭載されており、ワンクリックでそれらの機能を呼び出すことができます。このようなシームレスな体験は、ブラウザや拡張機能の形態でなければ実現が困難であり、極めて将来性の高い取り組みと言えるでしょう。

Genspark AI BrowserでApple WWDC 2025のYouTube動画からスライドを生成している様子。「Auto Generate Slides」というボタンからワンクリックで実現できてしまう点が画期的である。

さらに注目すべきは、GensparkではAIエージェントを並列実行することが可能であり、一つのタスクの完了を待たずに次々と別のタスクを依頼できる点です。

何十、何百ものタスクを同時並行で処理できるというのは人間にはないAIエージェント独自の強みである一方、これまでこの特性を活かしたプロダクトはほとんど、DevinやOpenAI Codexなど、タスクが正確に定義しやすいコーディング領域に限られていました。

そんな中登場したGenspark AI Browserは、背景情報をワンクリックで与えて簡単にタスク定義できることから、並列処理と非常に親和性が高いです。

AIエージェントに「タスク定義が容易」かつ「単純だが手間のかかる」作業を任せつつ、人間はそれ以外のより創造的なタスクに集中するというワークフローは、来年にかけてコーディング領域に留まらず、より幅広い業務効率化領域で徐々に普及していくのではないでしょうか。

💡 Genspark AI Browserはクレジット制限がかなり厳しく設定されていますが、Mac OSにて無料で利用できます。詳しくは次のセクションをご覧ください。

② OpenAIがついに「o3 pro」をリリース!さらにo3の料金が2ヶ月で80%引き下げ

OpenAI社が日本時間6月11日、o3モデルより長時間の推論を行うよう設計された最先端AIモデルo3 pro」をChatGPTおよびAPIにてリリースしました。数学、科学、コーディングの各ベンチマークにおいてo3を上回る性能を示しており、さらに人手による評価では、ライティングを含む幅広いタスクでo3を凌駕していることから、ベンチマーク的に優れたモデルであることは間違いありません。

OpenAIによるo3 proの評価結果。人手評価でもベンチマークスコアでもo3を上回っている。
OpenAI

また第三者によるベンチマーク評価海外の有識者からは、長いコンテキストを正確に処理する能力が特に高いという声も上がっています。

しかし個人的には、毎日ChatGPTを利用している身であっても「o3 proがo3を上回るような難しいタスクを見つけてくること自体が難しい」というのが率直な感想です。AIにタスク内容を一回で完璧に説明することは困難であり、一つのタスク内で何度もやり取りしたい場面が多いことを踏まえると、o3の何倍もの推論時間を要するo3 proが有用なケースは極めて希少でしょう。

一方でより衝撃的だったのは、o3のAPI料金が80%引き下げられたというニュースです。トークン単価ではGPT-4oを下回る価格となり、長時間の推論によるトークン数増加を考慮したタスク実行時に実際にかかる料金でも、Claude 4 Sonnetの3倍程度と十分実用的な価格まで引き下げられました。

(上)o3及び競合モデルのトークン単価の比較。
(下)o3及び競合モデルのあるベンチマークに含まれる全てのタスクを検証した時にかかったコストの比較。こちらの方が実際かかる費用に即している。
Artificial Analysis

Anthropic CEOのAmodei氏やSemiAnalysisによれば、同等性能のLLMを推論させるために必要なコストは毎年約1/4〜1/10程度で低下するとされていますが、今回o3のAPI料金はリリース後わずか2ヶ月で1/5の料金になっています。今後もこのペースで料金が引き下げられていくことは非現実的ですが、少なくとも最先端の推論モデルに関しても、これまで通り急速なスピードで利用コストが引き下げられていくトレンドが続くようです。

そして現在のAIエージェントツールの躍進を支えているのは、AIモデルの推論・判断能力の向上であるだけに、o3のような最高性能の推論モデルがツールに組み込まれていくことで、どのような画期的な体験が新たに生まれるのか注目したいところです。

💡 o3 proは現在、ChatGPTのPro, Teamsプランユーザー向けに提供されているほか、APIからも利用可能です。

③ Metaが史上2番目の2兆円規模で急成長スタートアップScale AIに出資。その狙いとは?

MetaがAIスタートアップのScale AI社に対し143億ドル(約2兆円)を投じ、同社株式の49%を取得することで合意に達したとThe Informationが報じました。この金額は、同社が2014年にWhatsApp社買収に費やした190億ドルに次ぐ規模であり、Meta社史上2番目の大型ディールとなります。

Scale AI社は2016年創業のスタートアップで、AIモデルの訓練に必要な大規模データセットのラベリングサービスを提供する企業です。「データは新時代の石油」と称されるように、AIモデル開発では質の高い学習データを用意することが性能の向上に直結することもあり、同社はMetaだけでなく、Google、OpenAI、Microsoftを含むビッグテック各社を顧客として急成長を遂げていました。

物体認識タスクにおけるデータラベリングの例。人物一人一人、車一台一台をボックスで囲み、そのボックスの頂点の座標を正解データとする。(Scale AI

今回の買収により、Scale AI社CEOのAlexandr Wang氏はMetaの最高幹部となり、新設される「スーパーインテリジェンス(超知能)」を研究するAIラボを率いることになると報じられています。さらに他の従業員もMetaに迎え入れられる計画であることから、実質的なアクハイアの側面が強いと見られています。

Scale AI CEOのAlexandr Wang氏
Index Ventures

この大型買収の背景には、Meta社の現在の立ち位置に対する危機感があると考えられます。同社は今年4月にオープンモデル「Llama 4」を公開したものの性能を疑問視する声が多く、DeepSeekをはじめとする競合オープンモデルの方が広く普及している現状です。高品質なデータセットを扱うScale AI社の技術と人材を取り込むことで、この状況の打開を図る狙いがあるでしょう。

一方で、これまで中立的な立場でAIモデル開発企業にラベリングデータを提供してきたScale AI社がMeta社の傘下に入ったことによる業界への衝撃は大きく、早速GoogleがScale AI社との提携を解消する予定だとロイターが報じています

これまでMicrosoftがInflection社を、AmazonがAdept社を、GoogleがCharacter.AI社を傘下に置くなど、人材競争の激しいAIモデル開発業界ではアクハイアが横行していましたが、今回の取引はそれ以上の余波をもたらす可能性がありそうです。

2. SNSで話題のAIツールをピックアップ!

Genspark AI Browser (https://www.genspark.ai/browser)

  • Gensparkの機能をwebページから呼び出せる次世代AIブラウザ

  • 「YouTube動画をプレゼン資料に変換」「ECサイトで見つけた商品がより安価に販売されていないか、web全体を調査」といったタスクをワンクリックで簡単に実行できる

  • Mac OSにて提供が開始されており、無料でも試すことが可能。ただし無料プランだとクレジット制限が厳しい。

  • Windows版も近日公開予定とされている

  • 先週リリースされたElevenLabsの最新AI音声合成モデル「Eleven v3」が日本語に正式対応

  • [happy], [laughing]といった音声タグを追加して感情を制御したり、表現を追加したりできる機能が日本語でも利用可能に公式ガイドに利用できる音声タグが記されている

  • 音声タグは英語だけでなく日本語でも記述できる。また右のタブの「Voice」の検索ボックスにて「japanese」と検索すれば、日本人話者も選べる

  • サインアップなしに何回か試せるほか、ログインすれば無料でも十分な回数試すことができる

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

といったプロダクトをリリースしてまいりました。

またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!