- Mavericks AI ニュース
- Posts
- 満を辞してChatGPTに検索機能が実装!情報収集の形は今後どう変わっていくのか?、NoLangの縦型動画ダウンロードに関するアップデート情報など
満を辞してChatGPTに検索機能が実装!情報収集の形は今後どう変わっていくのか?、NoLangの縦型動画ダウンロードに関するアップデート情報など
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!
今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、🐬NoLangの縦型動画ダウンロードに関するアップデート情報について解説します!
📚 目次
1. 直近のビッグニュースTop 3
① 満を辞してChatGPTに検索機能が実装!情報収集の形は今後どう変わっていくのか?
② RunwayのCamera Motion機能が大幅進化。極めて正確にカメラを動かせるように!
③ Sunoが気に入ったAI歌手の曲を量産できる新機能「Personas」をリリース
2. SNSで話題のAIツールをピックアップ!
① Recraft
② Leonardo AI
1. 直近のビッグニュースTop 3
① 満を辞してChatGPTに検索機能が実装!情報収集の形は今後どう変わっていくのか?
OpenAIより「ChatGPT Search」がリリースされ、ChatGPTのweb検索機能が大幅にアップデートされました。応答速度が大きく改善されている上、検索モードのON/OFFも簡単で、テキストボックス直下にあるアイコンをワンクリックするだけで行えます。検索結果も見やすくなっており、サイドバーからGoogle検索のようなフォーマットで出典を確認できるようになったほか、トピックによっては地図等のウィジェットが表示されるようになりました。
ChatGPT Searchに渋谷で1000円以下のおすすめのランチを聞いた結果。結果は見やすいが、よくよく見ると一番目に表示されたお店の説明が「ローストビーフにサラダと日替わりスープがついて540円」と大きく誤っている。(本来は写真の通り回転寿司チェーン店である)
ChatGPT Searchの基本的な仕組みは、Perplexity, Genspark, FeloといったAI検索エンジンツールと同様で、web検索結果の上位何件かをLLMに与えて回答させているにすぎないと思われます。しかし、ChatGPT Searchによって提供される価値は、将来的にはこれらツールとは似て非なるものになっていくと考えられます。
PerplexityなどのAI検索エンジンは、私たちがこれまで行ってきた検索作業を効率化するものであり、「web検索→結果を1ページずつ確認→欲しかった情報に辿り着く」というプロセスを、「AIに聞くだけで即座に答えを得る」といったプロセスに置き換えます。
ただし、我々が既に「ググる」作業にすっかり慣れてしまっていることに踏まえると、Googleの生成AI機能「AI Overview」が進化して、検索結果とAIの回答が同時に確認できるようになるのが結局のところベストだと考えるのが自然でしょう。
一方でChatGPT Searchでは、ChatGPTとの対話をメインに据えて、必要な時だけweb検索を実行させるといった使い方ができ、こなせるタスクはプランニング・アイデア出し・壁打ちと多岐に渡ります。このような使い方をしても現在の性能ではそこまで有用ではありませんが、今後ChatGPTの聞く力・思考能力・エージェント能力が一定水準に到達すれば、一気に実用性が増していくでしょう。
ChatGPT Searchを活用した九州旅行の企画。写真付きで観光地を紹介してくれるのは非常に嬉しいが、ユーザーへの質問が不十分なまま、早々に計画案を提示してしまうためまだまだ使い辛い。
また冒頭に載せたスクリーンショットの説明からも分かる通り、ChatGPT Searchはハルシネーションが多く、日常使いするにはまだまだ精度が不十分です。OpenAIは公式ブログにて、「ショッピングや旅行といった分野を中心に改善を行いつつ、o1シリーズの推論能力を活用できるよう取り組んでいく」と述べています。今後生成AIとの対話をベースとした、「検索」とは異なる新しい情報収集の形が示されていくのか、注目したいところです。
💡ChatGPT Searchは現在、ChatGPTのPlus及びTeamユーザーに向けて公開されています。
② RunwayのCamera Motion機能が大幅進化。極めて正確にカメラを動かせるように!
直近数ヶ月間に渡って、動画生成AI企業のRunway社が立て続けに新機能を発表しており、AI業界の注目を集め続けています。先週は新たに「Advanced Camera Motion」という画期的な機能を発表しました。静止画をベースに、指定したカメラワーク(平行移動・回転・ズーム)で動画化できるようになり、生成動画の一貫性は極めて高く仕上がっています。是非以下のデモ動画にて品質の高さを確かめてみてください。
Advanced Camera Control is now available for Gen-3 Alpha Turbo. Choose both the direction and intensity of how you move through your scenes for even more intention in every shot.
(1/8)
— Runway (@runwayml)
2:52 PM • Nov 1, 2024
これまでもRunwayや他の動画生成AIツールにおいて、カメラワークを制御する機能はありましたが、被写体が変形するなど破綻が生じたり、思うように動きが制御できないケースが多々ありました。しかし今回の機能ではそのような問題が大幅に改善されており、破綻はほとんどなく制御性も格段に向上しています(Xに投稿された生成動画まとめ)。
さらに注目すべきは、テキストプロンプトによる高度な制御が可能な点です。例えば「無人の草原を映し出す」といったプロンプトでカメラの移動先の風景を指定したり、「女性が笑う」といった形で被写体の動きも同時に制御することができます(Runway公式)。
Runway CEOのValenzuela氏が「Who said 3D?」と投稿したように、冒頭のデモ動画を観てあたかも3D空間が生成されているように感じた方も多いのではないでしょうか。Runwayは大きな野望として、昨年11月に「世界モデル」というAIシステムを構築することを目指すと発表しています。
LLMが次の単語を予測し続けて文章生成していくように、世界モデルでは次にどんな出来事が起きるかを予測し続けて動画生成、あるいは音声などのモダリティを加えて「世界」生成をしていきます(過去のニュースレターも参照)。
これを実現するためには、まずは「3次元空間で物体が物理法則に従ってどのように動いていくか」をAIモデルに理解させる必要があります。今回発表された機能による生成動画を見るに、AIは動画生成を通して、部分的な空間把握能力を有しつつあると言えます。来年にかけて、世界モデルの実現はより現実味を帯びてくるでしょう。
💡 RunwayのAdvanced Camera Motionは、無料ユーザーを含めた全ユーザーに公開されています。ただし11月3日現在は利用者過多のため、一時的に有料ユーザーのみが利用可能となっています。
③ Sunoが気に入ったAI歌手の曲を量産できる新機能「Personas」をリリース
音楽生成AI分野における先駆者のSuno社が、音楽生成AIの可能性を更に大きく広げようとしています。新たに発表されたPersonas機能によって、気に入ったAI歌手を登録して、その歌手の曲を量産できるようになりました。下記の公式投稿では、同一の女性AIボーカルによる歌声を聴くことができますが、極めて一貫性が高いことが分かります。
We’re excited to introduce Personas 🎤 Personas let you save the essence of a song - vocals, style, vibe - and reimagine it across your creations. Want to bring your favorite vocals or style into a new song? Here’s how:
1⃣ Find a song you love, click Create then Make a Persona… x.com/i/web/status/1…
— Suno (@suno_ai_)
9:26 PM • Oct 31, 2024
これまでSunoをはじめとした音楽生成AIツールには歌手を指定する機能がなかったため、もし気に入った歌手に出会えても、その歌手に違う曲を歌ってもらうことは困難でした。今回のアップデートによりこの問題が解消され、アルバムを作成して、AI歌手としてデビューさせることも現実的になってきました。
著作権上の問題や濫用のリスクを考慮してか、Sunoにアップロードした音声に対してPersonas機能は使用できません。とはいえ今回の機能発表は、技術的にはAIで歌手をコピーし、オリジナルの曲を歌わせることが可能になりつつあることを示唆しています。
RVCなどのボイスチェンジャー技術を使えば、ある音声を別の人の音声へと自然に変換することができ、それらを活用したAIカバー曲などは世の中に広く出回っていますが、これを行うためには参照される音声が必要です。しかし近いうちに、歌手の声質に加え、発音、歌い癖などもコピーして、オリジナル曲を簡単に作れてしまう日が来ると思われます。
もちろんPersonas機能にも制限はあり、歌声の他に音楽のスタイル・雰囲気もある程度引き継がれるため、全く別ジャンルの曲を歌ってもらうことは困難です。しかし今年に入って音楽生成AIの性能が飛躍的に向上したことを踏まえると(以前のニュースレター)、こういった問題も近い将来解決されていくと期待されます。
💡 SunoのPersonas機能は、Pro, Premierプランの有料ユーザーに向けて公開されています。
2. SNSで話題のAIツールをピックアップ!
Recraft (https://www.recraft.ai/)
彗星の如く現れ、画像生成AI比較プラットフォーム「Image Arena」にてFlux, Midjourneyを抑え一位を獲得した注目の画像生成・編集AIツール
高画質化、背景除去、異なるアスペクト比のバリエーション生成などデザインに必要な機能がオールインワンで搭載されている
特に、画像を複数枚アップロードしてそれらと同一スタイルの画像を生成できる機能が強力
無料でも50回画像を生成可能。さらに他のユーザーからの招待リンク経由で登録すれば、さらに100回画像を生成できる
Leonardo AI (leonardo.ai)
無料で使用可能な画像生成AIツール。先日Canvaに買収され、今年8月時点でユーザー数は1900万人以上
画像生成時に事前指定できるスタイルが豊富なことが強みであり、「Concept Art → Game Concept」といった形で二階層で指定できるのも嬉しい
無料で1日6回(24枚)以上の画像を生成可能
同じく無料で使用可能なGoogleのImageFXよりも品質はやや落ちるが、基本的に生成拒否されないため使いやすい
3. 🐬NoLangの縦型動画ダウンロードに関するアップデート情報をご紹介!
先週に引き続きNoLangのアップデート情報についてお伝えします。今回ご紹介するのは、縦型動画のダウンロードに関するアップデート情報です。いずれも小さめのアップデートですが、今後これらとは別に、縦型動画機能がより使いやすくなる大幅なアップデートを予定しています。是非NoLangの進化にご期待ください!
(1) 対話形式の動画を縦型動画としてダウンロードできるように
対話形式の動画を、TikTokやInstagramに最適な縦型動画としてダウンロードできるようになりました!ただし、現時点ではアバター機能との併用はできないため、縦型でダウンロードする際はアバターをOFFにする必要があります。
対話形式の解説動画をショート動画として活用したい方は、是非お試しください!
(2) 英語版でも縦型動画ダウンロードに対応
英語で生成した動画についても、モバイル向けの縦型形式でダウンロードできるようになりました!グローバルに情報発信をされている方や、海外向けにショート動画を配信されている方は、是非ご活用ください。
解説は以上となります。以前のニュースレターにてNoLang2.0についての詳細な解説を行っているので、NoLangを使いこなしたい方は、是非こちらもご覧ください!
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、
どんなWebページでも3秒で解説動画に変換する「🐬NoLang」
ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)」
生成AIアップスケーラー「🥩カクダイV1」
といったプロダクトをリリースしてまいりました。
またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!
🐬NoLangとPerplexityを組み合わせれば、最新トレンドに関する解説動画も簡単に生成できます!
「ゆっくり解説」も「ショート動画」も、リサーチから生成まで一瞬で完了!
Perplexityのいいところは、引用文献も閲覧できること。怪しいな...と思ったらすぐに確認、修正まで可能です!
続く >> x.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
6:08 AM • Jul 11, 2024