2024年の生成AI予測、ニューヨークタイムズがOpenAIとMSを提訴など

新年明けましておめでとうございます。sayhi2.ai Newsletterの配信が開始されて1ヶ月弱。より有益な情報を発信できるよう努めてまいります!

今回は、インパクトの大きかったニュースや注目ツールの紹介に加え、 2024年の生成AIの動向予測をお伝えしていきます!

📚 目次

1. 直近のビッグニュースTop 3
ニューヨークタイムズがOpenAIとMicrosoftを提訴
感情や声の特徴をコピーする音声AIがオープンソースとして発表
GPTStoreが来週リリース予定

2. SNSで話題のAIツールをピックアップ!
Tripo
DomoAI

3. 2024年の生成AI業界の動向を占う

4. 最近、資金調達を行なった注目企業・ツール
Delphi

1. 直近のビッグニュースTop 3

① ニューヨークタイムズがOpenAIとMicrosoftを提訴

ニューヨークタイムズは12月27日、同紙の著作権で保護された記事を無許可でAIの学習に使用したとして提訴。AIの学習を巡って大手報道機関が開発企業を訴えるのは今回が初めてとのことです。

タイムズ紙の記事内容をほぼそのまま出力できることが強力な例証として示されており、少なくとも事実であることは間違いないでしょう。

他社の動向として、BBC、CNNはOpenAI社による記事取得をブロックしています。ドイツ大手アクセルシュプリンガーはOpenAI社と契約を結び、AIの訓練へのデータ提供を開始しています。

現状、ChatGPTは暗記を不得意としているため、報道との親和性は低いように思えます。報道機関や開発企業がどのようにこの状況を打破し、生成AIを有効活用していくのか、目が離せません。

② 感情や声の特徴をコピーする音声AIがオープンソースとして発表

オープンモデルの開発を精力的に進めるMyShellが、録音から話者の声を複製し、別の文章を喋らせることができる音声AI「OpenVoice」をオープンソースとして公開しました。こちらのデモをご覧いただくと、どのような技術かよく理解できるかと思います。

Metaも同様の技術「Seamless」をオープンソースとして発表しています。こちらには、僅か2秒の遅延でリアルタイム翻訳を行える「翻訳こんにゃく」のようなAIモデルも含まれています。リアル「翻訳こんにゃく」が、そう遠くない未来に誕生してしまうかもしれません。

音声のコピー機能を自分で試してみたいという方には、SeamlessExpressiveのデモがおすすめです。自分の喋る姿を自撮りして送信すると、自分が他の言語で喋る動画が生成され、そのBefore/Afterを字幕付きで楽しむことができます。

③ GPTStoreが来週リリース予定

OpenAI社は1月4日、Apple Storeの「GPTs」版である「GPT Store」が来週公開予定だと発表しました。

GPTsはカスタマイズされたChatGPTのことを指します。プログラミングの知識がなくても、自然言語で作成できることが特徴です。Excelの関数やマクロを作成する実用的なGPTsもあれば、対話形式で脱出ゲームをプレイできるといった独創的なGPTsもあります。

「GPT Store」はGPTsを共有・販売できるマーケットプレイスです。先日のDev Dayにて、OpenAI社は、人気度の高いGPTsの制作者が収益を上げられるような仕組みを導入すると述べており、リリースが待たれます。

なお sayhi2.ai は、今年から新たにGPTsの掲載を開始し、18000を超える数のGPTsが追加されています。興味を持たれた方は、是非チェックしてみてください!

2. SNSで話題のAIツールをピックアップ!

SNSで話題になっているAIツールの中から、特におすすめできるものをピックアップしました。後ほど見返すかもしれないという方は sayhi2.ai でブックマークしておきましょう!

※ログイン後、左上の画像内、右上の赤いボタンを押すことで、ブックマークが可能

  • テキストや画像から3Dオブジェクトを生成できるツール

  • 15秒程度で粗いモデルが4つ生成。そこから気に入ったモデルを選択すると、精製が始まり、5分程度で高品質な3Dオブジェクトが得られる。

  • UXが考え抜かれており、待ち時間を苦にさせない配慮や、ユーザーがイメージ通りの成果物を得られるようにするための工夫が一級品

  • 無料かつ、サインアップするだけで即使用可能。現時点では使用制限なし

  • 他の3Dオブジェクト生成ツールとの比較を見たい方はこちら。現状最高レベルであることがよく分かります

  • 動画生成AIツール。動画を別のスタイルに変換する機能が非常に強力で、現状最高レベル。例えば、実写のダンス動画をアニメ風、ピクセルアートに変換できる

  • 3-10秒の動画を生成可能

  • 待ち時間を含め、3秒の動画生成に5分、10秒の動画生成に10分程度かかる

  • Discord上で、無料で使用可能

3. 2024年の生成AI業界の動向を占う

PwC海外大手VCNvidiaに至るまで、あらゆる業界のトップ企業が「2024年の生成AI予測」を発表しています。その中でも特に「Forbesによる10の予測」は説得力に富むものでした。

Forbesは特に、オープンモデルの躍進に否定的です。Stable Diffusionをはじめとした高性能な生成AIモデルをいくつも公開してきたStability AI社は倒産し、クローズドモデルとオープンモデルの性能差は縮まらないと予測しています。

その理由として、モデルの開発費用が、能力の向上に比例して膨れ上がっていく点と、オープンモデル開発に未だ明確な収益モデルがない点を挙げています。実際後者に関しては、Stablity AI社はこのままだと、10月に調達した資金を半年程度で使い果たすと言われています。

Stablity AI社は先日、一部のモデルを商用利用する権利を得られる、月額課金制メンバーシップの運用を開始しました。個人的には、収益確保の抜本的な打開策にはならないのではと懸念していますが、モデルのオープン化と収益性を両立した新たなロールモデルが誕生するのか、注目が集まります。

各予測の詳細については、こちらの投稿にまとめてあります。

4. 最近、資金調達を行なった注目企業・ツール

最後に、最近資金調達を行なった注目の企業・ツールを見ていきましょう!

Delphi | 資金調達額: $2.7M (9月7日)

Delphiは、デジタルクローニングプラットフォームを構築している、非常に野心的なスタートアップです。ユーザーが出演する動画やポッドキャスト、執筆した記事などをDelphiにアップロードすると、ユーザー自身と同じように話し、考え、行動するクローンを作成することができます。

作成したクローンは、API経由で様々なアプリケーションに埋め込むことができ、

  • 自己紹介ページに載せて、質問対応する

  • XやInstagramで、SNS投稿を行う

  • SlackやDiscordで返信する

といったユースケースがあるようです。他にも、専門知識を学習したクローンを他の人々に貸し出し、収益化を行うことも可能だと謳っています。

更にクローンの活動中に得られたデータを通して、

  • クローンに対してどんな質問がよく来るのか

  • クローンはどんな質問に答えられなかったか

を収集し、自分自身を磨いていくといった活用法も考えられます。

まもなく、無料プランが開放されるようで、一足先の未来の疑似体験をどのような形で提供してくれるのか、非常に楽しみです。

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

私たちは sayhi2.ai というサイトを運営しています。5000以上のAIツールを掲載しており、様々なAIツールを調査、深掘りすることができます。

さらに、本年より18000以上のGPTsの掲載を開始しました。ぜひご覧ください!

  • 文章や目的を入力するだけでツールを探せる

  • 実際にツールを試さずとも、チャットボットが答えてくれる

  • 厳選された5,000以上のAIツールから欲しいツールを見つけられる

  • 独自のスコアリングアルゴリズムによるAIプロダクトの人気度の推定

またXでは、AIツールや関連するニュース・トレンドに関して、一段踏み込んだ考察を交えながら日々情報発信しています。是非こちらもフォローしてみてください!