- Mavericks AI ニュース
- Posts
- 記念すべき日本初の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」が公開!NoLangで消費クレジットのログを確認できるようになりましたなど
記念すべき日本初の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」が公開!NoLangで消費クレジットのログを確認できるようになりましたなど
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!
今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、🐬NoLangに新たに導入されたクレジット消費履歴の確認機能について解説します!
📚 目次
1. 直近のビッグニュースTop 3
① noteがGoogleとの資本業務提携を発表。Geminiを搭載して創作支援を強化
② 日本初の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」が公開!
③ ChatGPTに「Scheduled Tasks」機能が搭載。AIエージェントへの進化の布石か
1. 直近のビッグニュースTop 3
① noteがGoogleとの資本業務提携を発表。Geminiを搭載して創作支援を強化
noteが先週、Googleとの資本業務提携を発表し、約5億円の資金調達を実施しました。この資金調達に伴い、Googleはnoteの発行済み株式の約6%を取得することになります。日本の上場企業がGoogleから資金調達を受けるのは、今回が初めてとなります。
今回の業務提携の狙いはどこにあるのでしょうか?noteの2024年11月期決算説明資料によれば、生成AI技術を活用した新サービスの開発や事業領域の拡大を目的としており、特にGoogleのLLM「Gemini」を活用して創作支援を強化していくことを掲げています。
クリエイター向けには、記事の編集画面からGeminiを直接呼び出し、文章のスタイル調整などを行える機能を提供予定のほか、企業向けサービスの拡充も視野に入れており、炎上防止やコンテンツ分類、レコメンドといった機能を強化し、外部企業への提供を目指すとしています。
noteはGoogleと資本業務提携を行った上で、Geminiを活用して創作支援を強化しようとしている
(note 2024年11月期決算説明資料)
個人的には、noteに投稿されるようなブログ記事には「メッセージ」とそれを根拠づける「情報」が不可欠であり、現時点ではこれらの要素は、人間が自発的に構築・収集しないと高品質な成果物にはならないと考えています。
一方でそれらを整った「記事に落とし込む」過程では、AIが大きな役割を果たすことができます。特に工程の終盤における、細かい表現の修正や誤字脱字の訂正では、既に申し分のない性能を発揮してくれます。
現段階では、AIがもたらす工数削減効果はまだまだ限定的かもしれませんが、今後数年にかけてメッセージの洗練化から、情報収集、さらには構成の最適化まで、多くのタスクでAIがほとんどの人間の能力を凌駕するようになるはずです。
このようにAIによる創作支援の可能性が広がる中、Googleとの提携によってnoteがどのような進化を遂げていくのか、その展開から目が離せません。
② 日本初の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」が公開!
「AIひろゆき」「AIピカソ」で知られるAIdeaLab社が、日本初となる日本語動画生成AI基盤モデル「AIdeaLab VideoJP」をオープンソースとして公開しました。経済産業省とNEDOが推進する国内の生成AI開発力強化プロジェクト「GENIAC」の成果をもとに開発されています。
日本初の日本語対応の動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能なライセンスで公開しました!
経済産業省とNEDOが推進するGENIACに採択されて、大規模なGPUリソースを使い、開発をさせていただきました。… x.com/i/web/status/1…
— トミー (@tommy19970714)
8:28 AM • Jan 15, 2025
特筆すべきは、このモデルが著作権に配慮したクリーンなデータのみを用いて一から学習を行っている点です。CC-BY-4.0やCC-0ライセンスといった、許諾が得られている動画データのみを使用しています。国内では特に、AIモデルの学習データに対する世間からの目が厳しいだけに、このような著作権に配慮した開発アプローチには大きな意義があると言えるでしょう。
一方で、現時点での性能は海外の最先端モデルと比べて見劣りすることは否めません。RTX4060Tiなどの一般的なGPUでも動作する軽量モデルとして設計されているとはいえ、生成できる動画は長さ2秒、解像度256x256に留まります。Runwayなど最新の動画生成AIが5〜10秒、720〜1080pの高解像度動画を生成できることと比較すると、性能面で大きな開きがあると言わざるを得ないでしょう。
この性能差の主な要因として、計算資源、学習データ量の圧倒的な差が挙げられます。例えば先週紹介したNVIDIA社の動画生成AI「Cosmos」が2000万時間もの動画データで学習されているのに対し、AIdeaLab VideoJPの学習データは1200時間に過ぎません。
また、「クリーンなデータのみを使用して動画生成AIモデルを学習させる」こと自体極めて難しい挑戦です。今回のモデルでは、Pixabayなどから入手された無料の動画データのみを学習に使用しているのに対し、ほとんどの最先端の動画生成AIモデルは、許諾なしに大量の高品質な動画を学習していることが確実視されています。例えばRunway社はYouTube, Netflix, Disneyといったプラットフォームで配信されている動画を無断で学習に使用していると報じられています。
先週中国のスタートアップによって、わずか1億円でGPT-4レベルのLLM「DeepSeek-V3」が開発されたことをお伝えしましたが、これはGPTの出力を学習データとして活用できたからこそ実現した成果であると考えられます。クリーンなデータのみにこだわる場合、このようなアプローチを取ることができず、開発における制約は非常に大きくなってしまいます。
このように技術的な制約は大きいものの、今回の取り組みを契機として、国内企業による新たな基盤モデル開発の機運が高まることを期待したいところです。
💡 AIdeaLabs VideoJPは、計算環境がなくてもHuggingFaceから無料で試すことができます(URL)。ただしし執筆時点では、プロンプトはあらかじめ選定されたものから選ぶ形になります。
③ ChatGPTに「Scheduled Tasks」機能が搭載。AIエージェントへの進化の布石か
OpenAIがChatGPTのアップデートを実施し、新たにタスクを事前スケジュールできる「Scheduled Tasks」をリリースしました。LINEの「リマインくん」を進化させたような機能で、実行して欲しいタスクと終了時刻を指定すると、指示通りにタスクを完遂した上で、通知とメールの送信で結果を知らせてくれます。
定期実行することもでき、毎日朝に最新の時事ニュースを取得して教えてもらう、コーディング面接に向けて1日1題問題を出してもらう、といった使い方がなされています。
Less than 48 hours ago, OpenAI dropped ChatGPT with Scheduled Tasks.
And people can't stop building creative automation task to have AI agents work while they sleep.
10 wild examples:
1. Daily stock market analysis
— Min Choi (@minchoi)
2:46 PM • Jan 16, 2025
現状ユースケースは限定的ですが、この機能はChatGPTのAIエージェントへの進化の布石として捉えるべきでしょう。実際、今回の機能によって以下のようなタスクを新たに任せられるようになっています:
1. 時間的制約のあるタスク
例:株式市場が開く朝9時過ぎに検索機能を使って情報収集をする
2. 人手によるサポート・承認が必要なタスク
例:APIキーを要するアプリを作る際、APIキーの取得をお願いするメールを人間に送る
「人間が時間のかかるタスクをAIに与えて実行は任せる」というAIエージェントの使い方が今後主流になっていくのであれば、このようなスケジューリング・通知機能は不可欠です。ChatGPTに搭載された「Scheduled Tasks」機能は、そうした未来への重要な一歩と言えるでしょう。
💡 Scheduled Tasks機能は現在ベータ版として、ChatGPTのPlus, Pro, Teamsユーザーに向けて公開されています。最終的には全ユーザーに向けて公開予定とも述べられています。
2. SNSで話題のAIツールをピックアップ!
Napkin AI (https://www.napkin.ai/)
テキストから分かりやすいポンチ絵を瞬時に生成してくれるサービス。今回のアップデートによって生成可能な図解のバリエーションが大幅に増加
複数の図解方法から選択→その後複数のスタイルから選択といった形で自分の気に入った絵を選べるのが魅力的
絵はPNG, SVG, PDF形式でエクスポート可能な上、文字・色等を生成後に変更することも可能
現在はベータ版であり、無料で全機能を利用可能
KREA AI (https://www.krea.ai/)
多彩な機能を持つAIデザインツール。先週新たにアップロードした画像を3Dオブジェクトに変換する機能が登場
背景画像を用意→追加で画像をアップロードし3D化→背景に載せたオブジェクトの向きを調整→画像変換というアプローチを取ることで、制御性の高い画像生成フローを体感できる
画像生成AIモデルとしてFluxを用いることができ、他にも高画質化など多数の機能が提供されている
3Dオブジェクト変換機能は無料でも体験可能
3. 🐬NoLangで消費クレジットのログを確認できるようになりました!
今回は、NoLangを日常的にご活用いただいているユーザーの皆様に、新機能のご案内です。新たにマイページにて、動画生成・動画編集・ダウンロードなど、各操作の履歴と消費クレジットを確認できるようになりました!
各操作について、実施日時と消費クレジット数、そして成功/失敗のステータスが一目で分かります。操作に失敗した場合は、クレジットは消費されず、消費クレジット数「0」として記録されますのでご安心ください。そして、いつどの操作にどれだけのクレジットを使用したのか、履歴として確認できますので、ぜひご活用ください!
これからもNoLangは、ユーザーの皆様により良い体験を提供できるよう、機能の拡充を続けてまいります。今後のアップデートにもご期待ください!
解説は以上となります。以前のニュースレターにてNoLang2.5についての解説を行っているので、NoLangを使いこなしたい方は、是非こちらもご覧ください!
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、
どんなWebページでも3秒で解説動画に変換する「🐬NoLang」
ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)」
生成AIアップスケーラー「🥩カクダイV1」
といったプロダクトをリリースしてまいりました。
またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!
🐬NoLangとPerplexityを組み合わせれば、最新トレンドに関する解説動画も簡単に生成できます!
「ゆっくり解説」も「ショート動画」も、リサーチから生成まで一瞬で完了!
Perplexityのいいところは、引用文献も閲覧できること。怪しいな...と思ったらすぐに確認、修正まで可能です!
続く >> x.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
6:08 AM • Jul 11, 2024