• Mavericks AI ニュース
  • Posts
  • エージェント動画制作がついに実用的に!Claude Codeでモーショングラフィックス制作を可能にする新ツール登場

エージェント動画制作がついに実用的に!Claude Codeでモーショングラフィックス制作を可能にする新ツール登場

他にも...AIがあなたを深く理解する秘書に。Geminiに「Personal Intelligence」が搭載!

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① 今までの動画生成AIとは一味違う。Remotionでモーショングラフィックス制作可能に!

GoogleやMicrosoftがデモ発表で披露するような、カッコいいアニメーション付きの動画。AIで制作できるようになる日は、思ったより近いかもしれません。

動画制作フレームワークRemotionが、「Skills」と呼ばれるAIエージェント向けの手順書を公開しました。以下の公式プロモーション動画は、この手順書をAIエージェント「Claude Code」に読み込ませた上で、自然言語による対話だけで作成されています。非常に印象的な動画でしたので、是非ご覧ください。

どうしてこのような動画がAIで制作できるようになったのでしょうか?順を追って紐解いていきましょう。

従来、上記動画を人手で制作するためには、After Effectsなどの高度な動画編集ツールを使い、タイムライン上でオブジェクトを1つ1つ調整していく必要がありました。

この作業を自動化すべく、2021年2月にリリースされたのがRemotionです。Remotionは動画制作をプログラムで行うための機能を備えており、シーン割りやオブジェクトの挙動(配置、出現タイミング、アニメーションなど)をコードで指定することができます。これにより、Remotionを学んだ開発者であれば、プログラミングを通して動画を作れるようになりました。

そしてこのRemotionのAI向け手順書がSkillsとして公開されたことにより、AIへの自然言語の指示だけで動画を制作できるようになりました。動画はプログラムから生成されるため、Sora等の動画生成AIとは異なり、テキストやオブジェクトの位置、アニメーションなどを正確に制御・編集することができます。

実際に試してみた感想としては、2024年6月のClaude 3.5 Sonnetによるスライド生成機能リリース時に近い印象を抱きました。一からそれっぽい動画を作ることは得意であり、動画の展開もかなり正確に指定できます。しかし生成できる動画の自由度は決して高くなく、どうしても「Remotionで作った感のある動画」に落ち着いてしまうのが現状です。

また、動画にマッチする画像や音声などの素材を揃えるのは依然として大変であり、それらを動画に綺麗に組み込む能力もまだ発展途上にあります。それでも冒頭でご覧いただいたような、素材を必要としないアニメーション動画に関しては、今後AI生成がどんどん実用的になっていくのではないでしょうか。

② AIがあなたを深く理解する秘書に。Geminiに「Personal Intelligence」が搭載!

Google社が米国ユーザーを対象に、パーソナライズ機能「Personal Intelligence」をGeminiに導入開始したと発表しました。昨年の開発者会議でも予告されていた目玉機能ですが、実際に私たちユーザーはどのような恩恵を受けられるのでしょうか?

この機能を一文で言い表すならば、「状況を逐一説明しなくても、GeminiがGoogleフォトやGmailといったGoogleアプリから情報を取得して、文脈を補完してくれる」というものです。以下の例のように、自分の興味や直近の予定について余計な説明の手間が省けるのが嬉しいポイントです。

Googleを元に作成)

別の例では、「タイヤを買い替えなきゃいけないんだけど、どれがおすすめ?」と尋ねると、GeminiがGoogleフォトから、普段乗っている車、現在使用しているタイヤ、さらにはよく行く旅行先まで特定し、それら情報をもとに適したタイヤを提案してくれています。

Google

このようなパーソナライゼーション機能は、単に作業を楽にするだけでなく、誰でもAIを使いこなせるようにする可能性を秘めています。プロンプトに十分な情報が含まれていなくても、私たちのGoogleアプリでの行動履歴から、適切に状況や意図を汲み取ってくれるからです。

また発表の中でGoogle社は、プライバシーを重視していることを強調しています。アプリごとに接続有無を設定できるほか、Gmailの受信トレイやGoogleフォトのライブラリを直接的には学習しないことを明言しています。

Google Workspace、Googleフォト、YouTube、Google検索といったサービスに対して、個別に連携するかどうかを指定できる
Google

この機能に対するユーザーの声はSNS上でまだ少なく、実用性は不明です。一方で確度が高く言えるのは、少なくともコーディング分野では、このようなパーソナライゼーションはすでに付加価値を生み出し始めているということです。

実際コーディングに関する質問をする際は、ChatGPTに直接質問するよりも、Cursorなどのエディター上で、該当プロジェクトを開いてから質問した方が良い回答を得られる場合が多いです。関連するファイルを深く探索して、より正確に状況を把握してくれるからです。

現在の生成AIモデルのコスト・処理速度を鑑みると、GeminiがGoogleアプリ内の情報を同程度に深く探索することは難しいでしょう。しかしLLMをはじめとしてモデルの小型化・高速化は進む一方であり、パーソナライゼーション機能がコーディング以外の領域でも実用的になるのは時間の問題に思えます。

💡 Personal Intelligence機能は、現在米国の一部ユーザ向けに公開されています。

③ GoogleがAIエージェント時代の買い物体験を見据えた共通規格「UCP」を発表

米国時間1月11日、Google社がエージェンティックコマース時代に向けた共通規格「UCP(Universal Commerce Protocol)」を発表しました。

これまでのオンラインショッピングでは、Amazonや楽天のタブを複数開いて商品を比較検討し、購入先が決まったらサイトごとに住所やクレジットカード情報を入力して決済を行う必要がありました。

一方でこの規格が導入されれば、GeminiをはじめとするAIと対話しながら情報を収集していき、商品が決まったらタブを切り替えることなく、そのまま決済まで完了できるようになります。Google Walletに保存されている支払い情報や配送先が使用されるため、情報入力も極めてスムーズです。

Geminiと対話しながら、提示された商品に対して、アプリ内で決済まで行える。口コミの数などの情報が提供されているのも嬉しい
Google

この規格はShopify社やWalmart社などと共同開発されており、Visa社やStripe社といった決済業者を含めた20社以上から支持を受けています。

UCPを支持している企業一覧
Google

さらに「Business Agent」という新たな仕組みも発表されました。事業者が自社や商品に関する質問に回答するチャットAIアプリを作成できるというもので、ウェルカムメッセージや会話のきっかけとなるプロンプト、ブランドカラーなどをカスタマイズできます。登録した商品データに加えて会社のWebサイトを自動で参照してくれるほか、ゆくゆくはビジネスデータに基づいた学習機能も提供予定とのことです。

Business Agentのカスタマイズ画面
Google

このようなAIアプリ内で完結する購買体験は、来たるエージェンティックコマース時代のデファクトスタンダードになっていくようです。実際OpenAI社は遡ること昨年9月、AIエージェントと事業者が購入を完了するためのやり取りを標準化したプロトコルACP(Agentic Commerce Protocol)を発表しています。

一方で、このような体験の普及には、ユーザーの嗜好やニーズを深く理解した上での提案を可能にする、高度なパーソナライゼーション機能が不可欠に思えます。技術の進展とセットで注目していきたいところです。

💡 商品直接購入の機能は、米国にてMonosやShopifyなど一部店舗から開始され、数ヶ月以内にグローバルへの展開も予定されています。「Business Agent」に関しても、米国の一部の小売店から順次展開されていく予定です。

2. SNSで話題のAIツールをピックアップ!

Google スプレッドシート (https://docs.google.com/spreadsheets/)

  • Googleスプレッドシート内のGeminiが進化し、ついにAIがセルの内容を読み取って編集してくれるように!

  • 例えば、「2020年以降のセルは青色にして」といった形で自然言語から関数を作成・適用することが可能

  • さらに「AI関数」も公開されており、AIで要約・分類した結果を出力する関数も作れる

  • 利用にはGoogle AI Proプランへの加入が必要。初月は無料で試すことができる

  • 今話題のAIエージェントに与える手順書「Skills」を検索できるプラットフォーム

  • GitHubのスター数が表示されており、人気のSkillsを簡単に把握できる点が嬉しい

  • さらにGoogleログインするだけでAI検索を行え、日本語でもSkillsを探せる

  • 全機能が無料で提供されている

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!