• Mavericks AI ニュース
  • Posts
  • 動画編集版Nano Banana登場。Klingが世界初の統合型マルチモーダル動画AI「Kling O1」リリ-ス

動画編集版Nano Banana登場。Klingが世界初の統合型マルチモーダル動画AI「Kling O1」リリ-ス

他にも...LovartがAI図解を修正できる、新たな画像編集機能をリリース!

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① 痒い所に手が届く。LovartがAI図解を修正できる、新たな画像編集機能をリリース!

Googleが先月リリースしたNano Banana Proは、スライドや図解画像を驚くほど高い品質で生成できるようになった一方、文字が崩れてしまうなど、「あと一歩」のところで失敗してしまうケースがしばしばあります

そんな中、デザインAIツールLovartが、「フォントやデザインを崩さずに」画像内のテキストを編集できる新機能をリリースしました。実際の使用シーンを見ていただくのが手っ取り早いでしょう。是非以下の動画をご覧ください。

Lovartは先月頭の時点で、画像を解析してレイヤー分けすることで、編集可能な形に変換できる機能をリリースしていました。今回の新機能と組み合わせることで、画像内のオブジェクトの位置・サイズ、そしてテキストを、デザインを保ったままPowerPoint感覚で自由に編集できるようになりました。

Lovartによるデザインを保ったままのテキスト編集

オブジェクトの重複が多く、どうレイヤー分けすべきかの判断が難しいケースでは未だ失敗することもありますが、背景がシンプルな場合、実用的な精度でレイヤー分けや修正が行えます。

そして編集技術だけでなく、画像生成の表現力の高さにも改めて注目が集まっています。実はNano Banana Proはビジネス用途で使われる標準的なスライドフォーマットの多くを表現することができますコンサルティングファーム行政機関を連想させる情報密度の高いデザインから、下記のような簡潔さに重点を置いたスタイリッシュなデザインまで再現可能です。

一方で、求めるデザインやスライド構成を的確に言語化するのは、誰にとっても容易ではありません。こうしたギャップを埋めるような、ユーザー理解に基づく高度なパーソナライゼーション技術の登場が待たれるところです。

💡 上記で紹介したLovartの機能は無料で試すことが可能です。詳しくは次のセクションをご覧ください。

② 「世界初の統合型マルチモーダル動画モデル」Kling O1がリリース!

今年8月にGoogleがNano Bananaをリリースして以降、AIによる画像編集が一気に普及していますが、動画編集における「Nano Bananaムーブメント」もすぐそこまで来ているようです。

中国発の動画生成AIツールKlingが、「世界初の統合型マルチモーダル動画モデル」と謳い、新モデル「Kling O1」をリリースしました。まずは是非、以下のデモ動画にて生成例をご覧ください。

Kling O1の機能はシンプルで、テキスト指示に画像や動画をメンションして含めることができるというものです。これにより、局所的な修正、動画全体のスタイル変更といった動画編集、さらには深いストーリー理解に基づいた新規カットの作成まで、広範な作業を直感的に行えるようになっています。

具体的には、以下のような指示が可能です。

・「動画A」から通行人を消して
・「動画B」内の猫のキャラクターを「画像X」のキャラクターに置き換えて
・「動画C」の続きのシーンを描いて。また、昼を夕方に変更して

Kling O1の使用例。画像や動画をメンションで指定して、指示から動画を作れる

動画生成AIモデルそのものとしての性能はOpenAIのSora 2に劣るため、「動画編集版Nano Banana」と呼ぶにはまだ時期尚早に思えますが、大きな転換点がすぐそこまで来ていることを感じさせる発表でした。

これまでの動画生成AIは「text to video」「image to video」「video to video」といった形で、入力形式ごとに別々のインターフェースが設けられることが一般的でした。

しかしこれからはKling O1のように複数の入力モダリティが一つのモデルに統合され、動画生成・編集AIといった区分は徐々に消滅していくでしょう。さらにゆくゆくはLLM・画像生成AIといった出力形式の差分も吸収され、完全統合型のマルチモーダルAIへと発展していくのではないでしょうか。

💡 Kling O1を使用するためには、有料プランへの加入が必須です。

③ ChatGPTのボイスモードがアップデート!今後の音声対話AIの行先は?

先月のChatGPTのアップデートにより、ChatGPTと音声対話できる「ボイスモード」が、画面遷移なしに、普段のチャット画面から直接利用可能になりました。

AIの回答がリアルタイムに表示されていくため、会話途中にやり取りを遡れるほか、画像や地図も表示してくれるなど、使いやすさが着実に向上しています。

一方で、今年目覚ましい進化を遂げたAIエージェントや動画生成AIと比較すると、音声対話AIは昨年9月のOpenAIによる「ボイスモード」リリース以降、大きなインパクトを残せていません。一体なぜでしょうか?

2025年、AIが特に進化したのは情報を「探す」能力と「伝える」能力の2つでした。

「探す」能力に関しては、OpenAIのDeepResearch、GPT-5、あるいはNotebookLMの登場が象徴的です。LLMが思考能力を獲得したことで、web文献や社内ドキュメントの中から、参照すべき文献にかなりの高確率で辿り着けるようになりました。

「伝える」能力も大きく向上しています。GensparkやGeminiのスライド生成、Nano Banana Proの図解生成を見れば分かる通り、単に情報を箇条書きで出力するだけでなく、それを分かりやすいデザインにまとめることが可能になってきました。他にも、Google検索のAI版「Google AI Mode」では、回答に応じて最適なUIを動的に生成する試みが進んでいます。

しかしその一方で、エージェント化の進展により1タスクあたりの処理時間が長くなっており、音声対話のようなリアルタイム性が重要な場面では、性能向上を実感しにくくなっています。ChatGPTのボイスモードは依然としてGPT-4oベースのモデルを使用しているようで、Geminiの音声対話機能もしばらく大きなアップデートがありません。

とはいえ、LLMは毎年1/4〜1/10というハイペースでコストダウンしており、処理速度の改善も続いています。今までとは一線を画す性能を持つ音声対話AIが、そろそろ登場する頃ではないでしょうか。

💡 上記で紹介したChatGPTの新しい音声モードは、全てのユーザーが利用可能です。

2. SNSで話題のAIツールをピックアップ!

  • 画像生成・動画生成AIを搭載した、デザイン制作支援ツール

  • 生成またはアップロードした画像をPowerPointライクなレイヤー分けされた形に変換できる

  • さらに、新たにテキストを「フォントやデザインを保ったまま」編集可能になり、より便利に

  • 現在は無料で一日100クレジットが付与されるため、主要機能を十分試すことが可能

  • 最新AI音声合成モデル「Eleven v3」の日本語性能の高さが話題に

  • [happy], [laughing]といった音声タグを追加して感情を制御したり、表現を追加したりできる

  • さらにVoice Design機能を使えば、「しゃがれた中年男性教師の声」といったプロンプトを入れて自分だけの声を作ることも可能

  • サインアップなしに何回か試せるほか、ログインすれば無料でも十分な回数試すことができる

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!