• Mavericks AI ニュース
  • Posts
  • OpenAIがまさかの過去最大額で買収。Cursorの先を見据えるAIエディターWindSurf開発元と合意報道

OpenAIがまさかの過去最大額で買収。Cursorの先を見据えるAIエディターWindSurf開発元と合意報道

HeyGenがたった1枚の顔写真から、リアルなリップシンク動画を生成する機能をリリース

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① HeyGenがたった1枚の顔写真から、リアルなリップシンク動画を生成する機能をリリース

アバター動画生成AIで知られるHeyGen社が、1枚の顔写真からリップシンク動画を生成できる機能を大幅にアップデートし、「Avatar IV」としてリリースしました。これまでのリップシンクAIにありがちだった歯の破綻やぎこちなさは大きく低減されており、以下のデモ動画から、特殊なアングルからの顔写真に対しても、非常にリアルに喋らせられることが分かります。

この新機能はすでに全ユーザーに向けて公開されており、既に「Hedra」やByteDance社の「Dreamina (OmniHuman-1)」といった競合ツールとの比較もなされています(例1例2)。これらの結果から、既存ツールと比べても同程度かそれ以上の品質であると評価できるでしょう。

またリアルな写真だけでなく、イラストなど幅広いタイプの画像に対しても適用できます。

一方で、上記投稿を見てもわかる通り、未だ顔・首以外のパーツの動きが不自然であるケースが多く、全身画像を自然に動かすことは困難です。また音声から感情を汲み取る力も高くなく、棒読みで喋ったとしても、かなり大袈裟な動きになってしまう点も現状の限界であり、まだまだ技術的な伸びしろがあると言えるでしょう。

なお実在の人物をクローンするという観点では、HeyGenの主機能である3Dアバター機能の方が遥かに品質が高いのが現状です。数分の喋っている動画をアップロードして、5分程度待つだけで簡単にアバターを作成できます。

このアバター生成AI技術は既に高い完成度を誇り、恐らくほとんどの人に対して「AIとはバレず」にInstagramで10万フォロワーを獲得できたという事例も出てきています。この技術は今後私たちの知らないうちに、日常生活に浸透していくのかもしれません。

💡 HeyGen Avatar IVは全ユーザーに向けてリリースされており、無料でも試すことができます。詳しくは次のセクションをご覧ください。

② OpenAIがコーディング支援AI企業Windsurfを過去最大額で買収か

BloomBergが、OpenAI社がコーディング支援AIツールを開発するWindsurf社を約30億ドル(約4300億円)で買収することに合意したと報じました。この買収が成立すれば、OpenAIにとって過去最大規模の買収案件となります。

同社の主力製品「WindSurf」は、昨年11月にリリースされたばかりの統合開発環境(IDE)です。IDEとは平たく言えば「コーディングのための作業環境」であり、本格的なプログラミングにおいては不可欠なツールでしょう。VSCodeやCursorといった既存のIDEと異なり、AIエージェントによる作業の確認・承認が簡単であるなど、AIエージェント特化型のIDEであったことから、開発者コミュニティから大きな注目を集めていました。†

WindSurfの操作画面。右側のチャットにてAIエージェントとやり取りが行え、自然言語で指示をしながらコーディングを進めることができる。

Windsurf社はMIT卒業生を中心に2021年に創業されました。ピボットを経て、Midjourneyの登場直後、ChatGPT公開直前の2022年10月にコード生成AIツール「Codeium Beta」をリリースし、それ以降はコーディング支援AIツールの開発に注力してきました。

OpenAIの買収先の本命はWindSurf社ではなく、Cursorの運営元であるAnysphere社だったとも言われています。Cursorの年間経常収益(ARR)は史上最速で1億ドルに到達し、会社としての時価総額は1兆円を超えるなど、Anyspere社は驚異的な成長を遂げている企業であり、OpenAIの投資先企業でもありました。それだけに魅力的な買収候補であったと考えられますが、TechCrunchCNBCの報道によれば、OpenAIはCursorに接触したものの、初期の買収交渉から撤退したとされています。

WindSurf社の買収の意図については、海外の有識者の間でも「モデル提供だけでは差別化が難しくなる。OpenAIはアプリ層で積極的に買収するしかない」「超ハイレベルなチームだからに思える」など様々な憶測が飛び交っています。今後のOpenAI社、WindSurf社からの発表内容に注目したいところです。

† Cursorも直近はAIエージェント機能を大幅に強化するなど、エージェントを意識したUI・UXになりつつありますが、WindSurfはリリース時からAIエージェント特化型のIDEを目指していた点で大きな違いがありました。

③ 音楽生成AI SunoがV4.5をリリース。オープンな音楽生成AIも登場し始めている

日本時間5月2日、音楽生成AIツールSunoが最新モデル「V4.5」へのアップデートを発表しました。V4が備えていた音質の高さ・クリアさを継承しつつも、対応するジャンルが大幅に拡張され、複数ジャンルの組み合わせがより自然に融合できるようになったことが強調されています。是非、以下の投稿を音声ONでご覧ください。

日本語ではどの水準の曲が制作できるのか、V4と比較してどのように性能が向上したかについては、以下の動画について詳しく検証されています。

また今年に入って、商用サービスだけでなく、品質こそ劣るもののオープンな音楽生成AIモデルも複数登場しています。中でも5月6日にApache-2.0ライセンスで公開された「ACE-Step」は特に注目に値します。

ボーカルの品質が一定水準でありながら、楽器音も聴き取ることができ、品質面では他のオープンモデルよりも一段階優れている印象です。モデルは軽量で、RTX 4090 GPUを使用した場合、わずか15秒で1曲生成することができるようです。日本語の読み上げこそまだ失敗することが多いですが、開発元には中国のStepFun社に加え、日本語対応の歌声合成ソフト「ACE Studio」の名もあり、今後の性能改善も十分望めます。

ただし、オープンモデルであってもそうでなくでも、音声生成AIには学習データの不透明さの問題がつきまといます。ACE-Stepはオープンソースを標榜しながらも学習データセットについての説明はなく、開発メンバーが今後の公開予定もないと明言しています。また、Sunoに関しても昨年6月に全米レコード協会から著作権侵害で提訴された結果、裁判文書内で著作権楽曲での学習を認めています。Sunoはフェアユースの範囲内で合法だと主張しており、この裁判の行方は今後の音楽生成AI業界に大きな影響を与えるでしょう。

💡 Suno V4.5は現在、Pro, Premierの有料プランユーザーに向けてのみ公開されています。

2. SNSで話題のAIツールをピックアップ!

  • 最も有名なAIアバター動画生成ツールのうちの一つ

  • 先日新たに、顔写真を1枚アップロードするだけで、スクリプトや音声に合わせて人物が喋る動画を作れる機能が「Avatar IV」として大幅リニューアル

  • 無料でも自分をクローンしたAIアバターの動画作成やAvatar IVが試せる

  • Avatar IVはホーム画面から「Photo to Video with Avatar IV」を選択して利用可能

  • 最も有名な音楽生成AIツールのうちの一つ。先週、最新モデルV4.5が利用可能に。

  • さらに先日より無料ユーザーでもV4.0を数回試せるように。V4.0も十分品質が高く、それ以前のモデルとは一線を画す性能であり、試す価値あり

  • SimpleモードではなくCustomモードを選択し、作りたい曲のテーマを考えたら、歌詞、スタイルをそれぞれChatGPTに考えさせて音楽生成するのがおすすめ

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

といったプロダクトをリリースしてまいりました。

またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!