- Mavericks AI ニュース
- Posts
- Sora2越えの動画生成AIが早くも来た!TikTok運営元がアクションシーンをシネマ品質で生成できる「Seedance 2.0」を発表
Sora2越えの動画生成AIが早くも来た!TikTok運営元がアクションシーンをシネマ品質で生成できる「Seedance 2.0」を発表
他にも...AIキャラクター企業「Shizuku AI」が米大手VC a16zから日本関連企業として初出資!
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!
【📢お知らせ】来週2/23(月・祝)に「バイブコーディングの限界」「AI時代に求められる能力・知識」「今後のキャリア形成」をテーマに、私を含め🐬NoLang運営メンバーが登壇します!詳細につきましては、以下をご覧ください。

1. 直近のビッグニュースTop 3
① TikTok運営元ByteDanceがSora2越えの動画生成AI「Seedance 2.0」を発表!
TikTokの運営元であるByteDance社が、音声付きの動画生成AIモデル「Seedance 2.0」をベータ版としてリリースしました。X上では昨年9月のSora 2リリース以来となる大きなバイラルが巻き起こっており、Seedance 2.0で生成されたいくつもの動画が100万回再生を突破しています。
プロンプトへの忠実性の高さが広く評価されているほか、高速な動きとカメラワークが入り混じるアクションシーンの生成に関しては、ビジュアル・音声の両面で目を見張るほどの品質です。是非以下の動画を音声ONでご覧ください。
また動画の品質が高まっただけでなく、制作時における指示の出し方も格段に直感的になっています。このモデルでは画像9枚、動画3本、音声3本を参照素材として入力でき、「『画像A』を背景に、『画像B』の俳優を『動画C』のモーションに合わせてアクションさせて」といった形で、複数の素材を組み合わせた柔軟な指示が可能です。
一方で残念なことに、今回のバイラルはSora 2リリース時と同様、少なくとも公開直後の段階では著作権保護を目的としたガードレールが一切敷かれていませんでした。実際にSNS上では、Seedance 2.0で作成された「高市首相 v.s. ウルトラマン」「もしワンピースのルフィがxxxしたら?」といった動画が氾濫しており、こうした事態を受けて2月13日、小野田AI戦略担当相が閣議後記者会見にて、政府として調査に乗り出す考えを示す事態となりました。
Sora 2の公開から半年経たずして実現された今回のリリースが意味するのは、AIモデル開発技術のコモディティ化です。LLMや画像生成AIにおいては既に、Claude 4.5 OpusやNano Banana Proなど、OpenAI社の最上位モデルを一部凌駕するモデルが登場していましたが、動画生成AIにおいても、OpenAI社の技術的優位は僅かであることが決定的になりました。
そして、権利侵害の恐れがありながらも人気を集めてしまうAI生成コンテンツは急速にインターネットを席巻しており、生成そのものを禁止することはもはや現実的ではありません。クリエイターとオーディエンスの双方が安心してAIコンテンツと向き合えるプラットフォームの整備が急務ではないでしょうか。
💡 Seedance 2.0は、現在一部地域・ユーザーに対してのみ公開されており、2月24日に正式公開が予定されています。生成できる動画の長さは15秒です。
② AIキャラクター企業「Shizuku AI」が米大手VC a16zから日本関連企業として初出資!
米大手ベンチャーキャピタルa16z(アンドリーセン・ホロウィッツ)が、日本発のAIキャラクター開発企業「Shizuku AI」に対し、7500万ドル(約120億円)の評価額で出資を行ったと発表しました。a16zによる日本関連の投資はこれが初めてであり、創業からわずか半年の企業がこれほどの評価を得たことは大変興味深いです。
なぜShizuku AIはここまで高く評価されたのでしょうか?

(a16z)
a16zはブログの中で、Shizuku AI CEOの小平暁雄氏が、「世界トップレベルの技術力」「AIキャラクターの構築・運用経験」、そして日本で培ってきた「キャラクター文化に対する直感」という3つの要素を兼ね備えた稀有な人材であることを、出資の理由として挙げています。
小平氏は2024年12月に、1秒間に最大約100枚の画像を生成できるAI技術「Stream Diffusion」を発表し、世界的に大きな注目を集めました。一方でその傍ら、GPT-4登場以前の2023年1月から、AI VTuber「Shizuku」の運営・開発を手がけてきた人物でもあります。ShizukuはYouTube上でライブ配信を行っており、音声合成はもちろん、視聴者への回答もAIによってリアルタイムに生成されています。

【しずくV2.0 初配信】ただいま、ご主人様!【AI VTuber】
(YouTube)
AI VTuberとしては、英語圏でYouTube登録者数80万人を超える「ネウロ様」が人気を集めていますが、「VTuber生みの国」である日本からはまだ同等の規模を持つIPは誕生しておらず、Shizukuはその先駆者の一人と言える存在です。
そしてもう1つ注目すべきは、a16z社がAI VTuberを含む「AIコンパニオン」領域を特に重要視している点です。「AIコンパニオン」とは、タスクをこなすための道具に過ぎない「AIアシスタント」とは異なり、ユーザーの生活に自然に溶け込む存在として振る舞うAIを指します。
この領域の代表的なサービスとしては、イーロン・マスクやマリオなどのキャラクターを模したAIチャットボットと会話できる「Character.AI」や、xAI社のGrokで提供されているAIガールフレンド「Ani」が挙げられます。そしてa16z社の報告によれば、2024年時点でCharacter.AIにおけるユーザーの平均滞在時間は1日あたりなんと2時間にも及んでおり、ヘビーユーザーを生み出すポテンシャルの高さが注目を集めているのです。

2024年のAIモバイルアプリTop 50に選ばれたアプリのカテゴリ別に、ユーザーの一月あたりの平均セッション数を集計したグラフ。Companionカテゴリが突出していることが分かる
(a16z)
もっともa16z社が指摘している通り、現在の技術では「魅力的で主体性のある会話」を生み出すことが難しく、AIがリードする会話がつまらないという根本的な課題が残っています。これに対しShizuku AIでは、ファンコミュニティがAI VTuberの活動を主導する仕組みを構築することで、この課題の解決を図るとされています。「技術」と「文化」の両面から勝負できる日本発の企業が、巨額の資金調達を足がかりにどのようなポジションを確立していくのか、注目が集まります。
③ OpenAIが超高速コーディングAIモデル「GPT-5.3 Codex Spark」を公開!
米国時間2月12日、OpenAI社が超高速コーディングAIモデル「GPT-5.3 Codex Spark」の研究プレビューを公開しました。今年1月に提携を発表していたCerebras社のAIチップを活用しつつ、モデルを小型化することで、毎秒1,000トークン以上という圧倒的な生成速度を実現しています。
以下の公式投稿では、Codex Sparkがスネークゲームと呼ばれる有名ゲームを10秒もかからずに実装する様子が収められています。普段コーディングをしない方でも、直感的にモデル高速化の恩恵を理解できる動画になっているかと思います。是非ご覧ください。
この新モデルは、30秒〜数分の時間をかけてじっくりとタスクをこなす従来モデルを置き換えるものではなく、あくまでも補完的な役割を担うようです。
実際Codex Sparkは、「長期的な推論と実行を担うモード」と「リアルタイム共同作業モード」を備えたCodexに向けた第一歩と位置付けられています。将来的にはChatGPT GPT-5のように、タスク・サブタスクごとに処理モデルを切り替えることで、性能と速度を両立したAIエージェントの提供を目指していると考えられます。
今回の高速化に貢献したCerebras社は、2024年8月にNVIDIA GPUより20倍高速なLLM推論サービスを公開して話題になったスタートアップです。同社はNVIDIA GPUよりも遥かに巨大なAIチップを開発しており、メモリへの読み書き速度(メモリ帯域幅)のボトルネックを解消することで高速化を実現しています。

CerebrasのAIチップ「WSE-3」とNVIDIAの「H100」チップのサイズ比較
(Cerebras)
Codex Sparkは「超高速モデル群の第一弾」と位置付けられており、現時点ではテキスト入力にしか対応していませんが、今後マルチモーダル入力への対応や、より大規模なモデルへの高速化技術の適用も予定されています。
私個人としては、ChatGPTの高速モデルへの切り替え機能は回答精度が下がるデメリットが大きいと感じており、「GPT-5.2 Thinking」を常に使用しています。Codex Sparkのような高速モデルが今後、実タスクでどこまで生産性向上に寄与してくれるのか、引き続き動向を注視したいところです。
💡 現在GPT-5.3 Codex Sparkは、ChatGPTのProプランユーザー向けに、Codexを通して提供されています。
2. SNSで話題のAIツールをピックアップ!
VoiceOS (https://www.voiceos.com/)
音声入力用のAI文字起こしツール。Aqua Voice等のサービス同様、単に文字起こしするだけでなく、フィラーを消したり、文体を調整するなどして整形してくれる
さらにLLMに音声で指示を出せる「Ask mode」が搭載されており、例えば「行けないって返信して、リスケ提案して」と喋るだけで、メール文を作成できる
Y Combinatorに採択されており、日本出身のKai Brokering氏が共同創業者を務める
無料枠があり、Googleログインだけで試すことが可能

Dictation mode
Claude (https://claude.ai/)
これまで有料プランでしか使用できなかった、4つの新機能を無料プランでも利用可能になり、試しやすくなった
特に注目したいのは「ファイル作成機能」。PowerPoint・ExcelファイルをClaudeに直接作成してもらうことが可能に。OpenAIやGeminiと比べても、総合的な資料作成スキルで上回っている印象
他にも、コネクタによる外部アプリ連携、カスタムSkillの作成、会話履歴の自動圧縮機能が開放

さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは?一番ためになったのは? |
運営元の紹介
株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLang」をリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。
今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。
採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://
