• Mavericks AI ニュース
  • Posts
  • Claudeがパワポを直接生成可能に!実用レベルに達したAIスライド生成について詳しく解説

Claudeがパワポを直接生成可能に!実用レベルに達したAIスライド生成について詳しく解説

TikTok運営元が、あの「Nano Banana」に匹敵する画像編集AIをリリース!

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① TikTok運営元が、あのNano Bananaに匹敵する画像編集AIをリリース!

昨月末にGoogleがリリースした「Nano Banana」の画像編集能力は凄まじく、これまで専用の学習なしには困難だった多くの画像編集タスクが、画像アップロードとテキスト指示だけで実行できるようになりました。

そして早速、そのNano Bananaに匹敵する画像編集能力を持つAIモデル「Seedream 4.0」がTikTok運営元のByteDance社よりリリースされ、大きな話題を呼んでいます。以下の投稿から、その能力の高さを確認することができます。

特に注目したいのが、日本語の生成に強い点です。YouTubeサムネイルの生成においては、ほとんど文字化けしてしまうNano Bananaと異なり、日本語をかなり正確に描画できています。さすがは中国発のモデルです。

2枚の画像とテキスト指示を与えて、日本語でYouTubeのサムネイルを作成させた結果の比較。
Nano Bananaがほとんど文字化けしているのに対し、Seedream 4.0はかなり正確に日本語を描画できている。

テキスト生成の品質は他の用途でも安定しており、例えばイラスト調でも一定の精度でレシピの手順書を生成することができています。

ByteDance社によるベンチマーク評価でも、画像生成・編集タスク双方において、Nano BananaやGPT-Image-1と同等かそれ以上のスコアを達成しており、現在最高峰のモデルであることは間違いないでしょう。

ByteDance社によるSeedream 4.0及び競合モデルの画像編集タスクのベンチマーク評価。ここでは示していないが、画像生成タスクでも、Nano Banana (Gemini-2.5) やGPT-Image-1と同等かそれ以上のスコアを達成している
ByteDance

一方で、元画像のキャラクターやスタイルに極めて忠実に画像編集するNano Bananaと比べると、元画像に対する一貫性では劣っているという声が多く見られ、私自身も同様に感じています。ただしユースケースによっては、大胆に改変してほしい場面もあるため、タスクに応じて使い分けるべきでしょう。

コスト面でも優秀で、$0.039/枚のNano Bananaよりさらに安い$0.03/枚で画像を生成・編集できる上、コストそのままで4Kの高画質画像も生成できます。開発元のByteDance社は、当時最高水準の性能を持つ動画生成AI「Seedance 1.0」をリリースしたことでも知られており、同社が今後画像・動画生成AIモデルの開発においてどれだけの存在感を示していくのか、注目が集まります。

💡 Seedream 4.0は期間限定でLovartと呼ばれるデザインツールで無料で試すことができます。詳しくは次のセクションをご覧ください。

② Claudeがパワポを直接生成できるように!AIスライド生成はますます実用的に

Claudeと言えばこれまで、高いデザイン能力を有する上、HTMLコードを生成して結果をその場で確認できる「Artifacts」機能が利用できるため、図解やスライドを生成できるAIとして大きな注目を集めてきました。

そんな中、Anthropic社がClaudeに新機能を追加し、PowerPointをはじめとして、スプレッドシート、PDFといったドキュメントを直接生成できるようになりました。

元々ClaudeはHTMLスライドを生成することができましたが、これをPowerPointにレイアウト崩れなしに変換することは、技術的に困難でした。スライドはすぐに生成できるが、編集に手間がかかる状況が続いていたのです。

今回の新機能ではそのような心配はなく、PowerPointがレイアウト崩れなしで直接出力されます。

ただし万事解決とは至らず、残念ながらデザイン面ではHTMLスライドと比較すると見劣りしてしまいます。編集のしやすさとデザイン性はトレードオフの関係にあるのが実情であり、これは既に実装されているChatGPTによるPowerPoint作成機能にも共通する課題です。

Claudeにより生成されたPowerPoint例。HTMLで生成できるスライドと比較すると、デザインの水準は数段落ちてしまう。

それでもAIによるスライド作成は半年前と比べると実用性が劇的に向上しています。これまでAIスライド作成では、必要以上に情報量の多い、スライドというよりは図解寄りのデザインが生成されがちでしたが、GensparkやManusといった専用AIツールでは「スライドテンプレート」が豊富に用意されており、これらを活用して、デザイン・情報量の双方において完成度の高いスライドに仕上げることが可能になりました。

Gensparkが提供しているテンプレート例。スライド内容に合わせて、テンプレートに含まれているスライドの中から適切なものをピックアップして、テキストや画像を当てはめてくれる。

また生成スライドの編集機能に関しても大幅な改善が見られ、例えばGensparkでは、生成したHTMLスライドを専用のエディターで編集することができます。文字や画像の差し替えはもちろん、各オブジェクトの位置も調整可能であることから、簡単な修正であればGenspark内ですべて完結させられる点が非常に便利です。

ただし依然として、テキストボックスやオブジェクトのサイズが変更できないなど、編集には多くの制約が存在します。この「編集のしやすさ」と「デザイン性」のジレンマが今後どのようなペースで改善されていくのか、引き続き注視していきたいところです。

💡 Claudeファイル出力の新機能はMax, Team, Enterpriseプランのユーザーに向けて公開済みです。Proプランユーザーも数週間以内に利用できるようになるとされています。

③ Google検索にAI機能が本格導入!検索の概念が大きく変わりつつある

Googleが9月9日、AI検索機能「AIモード」の日本語での提供を開始しました。これまでのGoogle検索画面に新たに「AIモード」というタブが追加され、ワンクリックで利用可能です。Perplexityのような形で、検索クエリに対する回答をコンパクトにまとめて表示してくれます。

Google AIモードの出力結果。100点満点の回答とは言えないが、基本的に内容は正しい。

実際に使用してみた感想として、「速さと精度の両立」において非常に優れていると感じました。複雑な質問であっても基本的に2秒以内に回答が開始され、待ち時間によるストレスはほとんど感じません。それでいて時には100件近くのウェブサイトを探索し、精度もChatGPT 5に匹敵する水準だと感じます。

もちろん高速な分、回答の薄さが目立つケースもあり、確実な答えが必要な場面ではthinkingモードをONにしたChatGPTの方が信頼できますが、サクッとAIに質問したい場面では十分実用的です。

このAIモードは既に米国で5月に展開が開始され、6月末に正式リリースされていますが、検索業界への影響はどの程度なのでしょうか

webトラフィック分析で知られるSemrush社の調査によれば、米国のデスクトップデバイスにおけるGoogle検索セッションでのAIモード利用率は、7月初旬時点で1%強に留まっています

米国のデスクトップデバイスにおけるGoogle検索セッションでのAIモードの利用率の推移。正式リリースが6月末である事に注意。
Semrush

また興味深いことに、AIモードのセッションで(原則出典リンクをクリックして)外部webサイトに遷移した割合もわずか6-8%に留まっています。通常のGoogle検索では40%近い遷移率を誇ることから、この差は極めて大きいです。ユーザーがAIの回答で満足してしまうか、あるいは回答が不十分で参考文献を確認する気になれないケースが多いということになります。

上記2点を踏まえると、AIモードからのwebサイトへの「流入数」はGoogle検索全体の0.5%未満と推定されます。

Google検索(AI概要あり)、Google検索(AI概要なし)、Google AIモードの3機能における「ゼロクリック率」の比較。ここでいう「ゼロクリック」とは、検索結果が表示された後に「出典リンク等をクリックして外部webサイトに遷移する」行為がなされないことを指す。
Semrush

AI検索全体で見ても、Similarwebが7月に発表した分析結果によれば、AIプラットフォームからのwebサイトへのリファラル流入は、Google検索からのリファラル流入の0.6%程度に過ぎません。マクロな視点では、まだ影響は限定的と言えるでしょう。

一方で成長率に注目すると、AIリファラルは2024年7月前年比で357%増加しています。今はまだ黎明期ながら、近い将来に無視できない規模に達する可能性は十分にあると結論付けられるでしょう。

💡 Google AIモードはどなたでもPCやスマホで利用可能です。詳しくは次のセクションをご覧ください。

2. SNSで話題のAIツールをピックアップ!

  • 画像・動画・3D生成モデルを利用して、直感的にデザイン作業を行えるAIツール

  • 現在画像生成・編集機能が無料で開放されているようで、Seedream 4.0も試すことができる

  • まずは右のチャットタブを使って、ChatGPTと同様にテキスト指示を与えたり、画像をアップロードして画像生成・編集するのがおすすめ

  • 公式からは9/20までSeedream 4.0が無料かつ無制限に利用可能とされており、不安定な時間帯もあるが、しっかり生成できることを確認

Google AI Mode (https://www.google.com/)

  • GoogleのAI検索機能がついに日本で正式リリース

  • Google検索結果が表示された後に、検索欄直下の「AIモード」タブを選択することで試すことができる

  • 「質問が具体的なほど、回答の精度が上がります」とされており、単語ではなく文章で質問を入力するのがおすすめ

  • PC、モバイル問わず、誰でも無料で利用可能

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在13万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は40社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちrまお是非チェックしてみてください!