• Mavericks AI ニュース
  • Posts
  • ChatGPTに渾身の新機能!CanvaからSpotifyまで、どんなアプリも呼び出せる「Apps in ChatGPT」リリース

ChatGPTに渾身の新機能!CanvaからSpotifyまで、どんなアプリも呼び出せる「Apps in ChatGPT」リリース

他にも...OpenAI版Dify、Google版Difyが立て続けに日本でリリース!

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① ChatGPTがCanvaやSpotifyと連携可能に!OpenAIが「Apps in ChatGPT」リリース

米国時間10月6日、OpenAI社が年次の開発者向けイベント「OpenAI DevDay 2025」を開催しました。今年も興味深い発表が盛り沢山でしたが、その中でもまず注目したいのが、ChatGPTを各種アプリと連携させられる新機能「Apps in ChatGPTです。

この機能により、すでにCanvaでのスライド作成、Booking.comでの宿泊探し、Spotifyでのプレイリスト作成などを、ChatGPT内から直接行えるようになっています。

今後も対応する公式アプリを増やしていくと予告されているほか、開発者向けに提供される「Apps SDK」を使えば、どんなアプリでもChatGPTと連携させることが可能になります。

さて、似たような仕組みとして「Model Context Protocol (MCP)」があり、ChatGPTも一部対応していますが、MCPとこの機能は何が違うのでしょうか?

実は、Apps SDKはMCPの拡張になっており、LLMとのアプリ連携自体には、MCPの仕組みを用いています。一方でApps SDKではそれに加えて、ChatGPT上での「結果の表示方法」までカスタマイズできる点が大きな違いです。

Apps SDKを用いて作れるUI画面の例
OpenAI

これまでMCPでLLMとアプリを連携しても、結果はわざわざアプリに飛ばないと確認できないことが多く、ChatGPT上で実用的なMCPはせいぜい情報収集用のものくらいでした。一方でApps SDKを使えば、ウィジェットを実装してChatGPTの回答に埋め込むことができ、ChatGPT上で講義動画を再生したり、生成スライドの中身をその場で確認したりできるようになります。

ChatGPT上でのCanvaによるスライド作成

私が試した限りでは、web検索とアプリ連携の併用ができないなど、現状は制約が多く実用的なユースケースは少ないですが、LLMのエージェント能力が向上すれば、このような制約は徐々に取っ払われていくでしょう。

今回の発表は、2年前のDevDayで発表された、カスタマイズされたChatGPT(GPTs)が集まるマーケットプレイス「GPT Store」の不成功を受けての再挑戦と捉えられます。実際、ChatGPTアプリを検索できる機能やChatGPT内での即時決済に応じた収益化の仕組みをローンチ予定であることも発表されました

わたしたちはもともとチャットボットをつくるつもりはありませんでした。そもそもは『スーパーアシスタント』をつくろうとしていたのですが、少し寄り道してしまったのです。

当時と比べてAIのエージェント能力は飛躍的に向上し、Apps SDKによって人間とのインターフェースを改善する準備も整いました。ChatGPTを基盤としたエコシステムが今後どれほど発達していくのか、注目したいところです。

💡 Apps in ChatGPTは、Free, Go, Plus, Proユーザー向けに提供が開始されていまが、Canvaなど一部アプリとの連携には、言語を英語に設定する必要があります。筆者は、ChatGPTとCanvaの言語設定を両方英語にすることで、動作することを確認しました。

② OpenAI版Dify、Google版Difyが立て続けに日本でリリース!

高市早苗氏がDifyを活用して「AIサナエ」を公開し注目を集めたことが記憶に新しいですが、先日開催されたDevDayでは、「OpenAI版Dify」とも言える「Agent Builder」もリリースされました。

GUIでブロックを繋いでいくだけでAIワークフローをノーコード / ローコードで構築できるツールであり、独自フローを持ったチャットボットも簡単に作成できます。

ただし、「Agent Builder」という名前こそついているものの、実際に作成できるのは広範なタスクをよしなにこなしてくれる「狭義のエージェント」ではなく、原始的な「ワークフロー型エージェント」であることに注意が必要です。条件分岐や例外ケースの処理などを全て事前に人手で定義してワークフローに書き起こす必要があり、複雑な処理を必要としないプロトタイプ作成が主要なユースケースとなるでしょう。

またこのツールは、Difyやn8nといった既存のワークフローツールをそのまま置き換えるようには設計されていません。OpenAIが以前から提供していた開発者向けの「Agents SDK」を用いたエージェント作成をGUIでも行えるようにしたものであり、MCPこそ使えるものの、外部ツールとの連携にはまだ難があります。SlackやNotionなど外部ツールとの連携が必要な場面では、テンプレートやインテグレーションの豊富な既存ツールの方が実用的と言えます。

AIワークフローツール「n8n」で利用可能なインテグレーションの例。スプレッドシート、Slack、Notionといったツールを簡単にワークフローに取り込める。

それでもAgent BuilderがOpenAI製のモデルやSDKを使った開発の敷居を下げ、効率化する役割を果たせることは確かです。前節取り上げたApps SDKではカバーできない、ChatGPTとは全く異なるUIや複雑なロジックが必要な場面でも、「OpenAI製モデルを利用した開発」を普及させることで、プラットフォーマーとしての立場を確立していきたい狙いがあるのではないでしょうか。

このリリースに続く形で、日本時間10月8日には、Googleからも類似のワークフローツール「Opal」が日本を含む15カ国にてリリースされました。外部ツール連携や実装の自由度こそ限られているものの、Agent BuilderやDifyと比べてさらに敷居は低く、非開発者をターゲットとしている点が特徴的です。

現在、アプリケーションレイヤーにおいては、ほとんどの領域で「Winner Takes All」とはなっておらず、明確な勝者がいない状況が続いています。AIワークフローツールに関しても、ユーザー層や用途ごとに分化が進みつつあると言えるでしょう。

💡 OpenAI Builderにおいては、OpenAIアカウントがあれば無料でワークフローを構築できますが、実行にはAPI料金が発生します。Google Opalは、現在一部機能を除いて無料で利用可能です。詳しくは次のセクションをご覧ください。

③ GoogleがPC操作に特化した新モデル「Gemini 2.5 Computer Use」を公開

Google社が、画面情報のみを元にPC操作できる新モデル「Gemini 2.5 Computer Use」をリリースしました。このモデルは、スクロール、クリック、文字入力などを駆使しながら、私たち人間と同じようにPCを操作することができます。以下のデモ動画では、雑多に配置された付箋を3つのカテゴリに仕分けしていく様子をご覧いただけます。

ベンチマーク評価においても、性能・速度の双方で既存モデルを上回っており、現状トップレベルのモデルであることは間違いないでしょう。

Gemini 2.5 Computer Useと競合モデルのベンチマーク性能比較。精度、レイテンシの両面で、他モデルよりも優れた結果となっている
Google

一方で残念ながら、この領域でAIはまだ「研究開発レベル」の段階にあり、実用的というには程遠いと言わざるを得ません。

例えば「Amazonで充電ケーブルを見つけてきて、一番上にある口コミの内容を教えてもらう」といったシンプルなタスクが、現状安定して解けるタスクの限界であり、さらに3-5分もの時間を要してしまいます。冒頭のデモ動画も3倍速で再生されているのが実情です。

OpenAIが今年1月に発表したPC操作エージェント「Operator」と比較しても、致命的なミスこそ減っている印象ですが、使い心地が根本から改善されたとは言い難いです。

Gemini 2.5 Computer Useでも、商品リストの上に表示された広告バナーを見て、商品が正常に表示されていないと判断したのかリロードをしてしまう、といった画面情報読み取りミスが発生することがある。

AIのPC操作能力の進化における律速となっているのが、「画像認識性能」です。ノイズが載っていないwebページ内のテキストや状態すら、依然としてよく読み間違えてしまいます。

一方でwebブラウザ操作に絞れば、AIは既に実用レベルの性能を達成できるケースがあります。実際、AIにwebページの画面情報だけでなく、HTML情報も与えているManusやGensparkといったAIエージェントでは、レストランの予約航空券の検索といった複雑なタスクもこなすことができます。

アプリを跨いだ操作など、webブラウザ以外への適用はできない特化型のアプローチにはなりますが、思考力・判断力といったエージェント能力自体はまだまだ指数関数的に向上しており、まずはこちらのアプローチでの普及が期待されます。

💡 Gemini 2.5 Pro Useは、次のセクションで紹介するBrowser Agent Arenaにて、他のモデルとの性能差を比較しつつ試すことができます。

2. SNSで話題のAIツールをピックアップ!

  • Googleが先週日本を含む15カ国にてリリースした、AIワークフローツール

  • Difyやn8nといったツールよりもさらに敷居が低く、一切のコーディングなしにAI処理を記述できる。AIワークフローツール初心者の方に特におすすめ

  • 公式テンプレートを選択してから「Remix」を押下し、内容を編集しながら仕様を理解していくと良い

  • 現在はβ版であり、一部機能を除いて無料で利用可能

Browser Agent Arena  (https://arena.browserbase.com/)

  • 先週Googleがリリースした「Gemini 2.5 Computer Use」と他のAIモデルのPC操作性能を比較できるwebサイト

  • 「amazonで2L × 6本の水を探して商品情報詳細を教えて」などと指示すると、AIモデルが画面情報だけを見てPCを操作する様子を確認できる

  • まずは簡単なタスクから試してみるのがおすすめ

  • 現在は無料で利用可能

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

難易度は適切でしたか?

(補足があれば、選択肢クリック後のコメント欄にご記入ください)

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在13万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は40社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!