• Mavericks AI ニュース
  • Posts
  • AIの研究者がノーベル物理学賞・化学賞をまさかの連続受賞、NoLangのInstagramアカウントを開設しました!など

AIの研究者がノーベル物理学賞・化学賞をまさかの連続受賞、NoLangのInstagramアカウントを開設しました!など

NoLang運営チームよりお届けしている、Mavericks AI ニュース(旧Newsletter From Mavericks)をご覧いただきありがとうございます!

今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、新たに開設した🐬NoLangのInstagramアカウントについてご紹介します!

1. 直近のビッグニュースTop 3

① HeyGenがあらゆる画角・ポーズ・背景のAIアバター動画を生成できる機能をリリース!

HeyGenなどのアバター動画生成AIツールを使えば、自分が喋っている動画をアップロードするだけで、自身のクローンAIを作成して自由に喋らせることができます。しかしこのようなツールでは、基本的に上半身のみが映る動画しか生成できず、活用の幅は限られていました

そんな中、HeyGenがこの問題を解決する新機能「Unlimited Looks」を発表しました。あらゆるカメラアングル、ポーズ、背景、服装で撮影した動画をもとにAIアバター動画を生成でき、それらをシームレスに繋げることもできます。特にカメラのない方向に目線を向けたり、片手にiPadを抱えたりしてアバターが喋る動画はAI生成と思えない品質で、技術のさらなる進歩を感じます。是非以下の投稿をご覧ください。

ショート用の縦型動画も生成でき、公式からは「車の中から」「歩いて自撮りしながら」など様々なシチュエーションでの生成例が紹介されています。これまで、AIアバター動画はアバターの動きやカメラアングルがワンパターンであることが課題でしたが、今回の機能登場によって、大きく改善されたと言えるでしょう。

こちらのX投稿で解説されている通り、上記のような動画を作るためには、シチュエーションごとに2分の動画をアップロードする必要があります。すなわち、特定のカメラアングル、ポーズ、背景、服装、髪型で2分間の動画を撮影すると、以降は同じ条件でのみ無制限に動画を生成できます。

さらにHeyGenは、先月バージョンが3.0へとアップデートされており、スクリプトの内容にマッチするように声のトーンと顔の表情を自然に生成できるようにもなっています。デモ動画を見るに、「冷静」「シリアス」といったトーンの違いがしっかり反映されているほか、歌唱することもできます。こちらはHeyGenが用意しているごく一部の上半身アバターのみで利用可能となっていますが、今後はより広く利用できるようになるでしょう。

また喜ばしいことに、AIアバターの動画生成にかかるコストもようやく下がってきました。HeyGenは今年8月に料金改定を行い、一本5分以下の動画であれば、月29ドルで無制限に生成できるようになりました(HeyGen料金ページ)。一方でいざ実利用しようとすると、日本語の音声合成・ボイスクローンの精度が高くないことが違和感を生みがちです。高い品質を求めるのであれば、他のサービスで合成した音声を割り当てるのが望ましいでしょう。

② AIの研究者がノーベル物理学賞・化学賞をまさかの連続受賞

「世界で最も権威のある賞」ノーベル賞の受賞者発表が行われ、物理学賞、化学賞と2日連続でAI関連の受賞となり、大きな話題を呼びました。ノーベル物理学賞では「人工ニューラルネットワークによる機械学習を可能にした基礎的発見と発明に対する業績」に対して、ジョン・ホップフィールド氏とジェフェリー・ヒントン氏が受賞しました。

特にヒントン氏は「AIのゴットファーザー」として知られ、2000年代から始まっている第三次AIブームの立役者です。2006年にAutoEncoderの発明を含む深層学習に関わる研究論文を2本発表し、同コミュニティの研究者らに衝撃を与えたほか、2012年には画像認識コンペティションにてCNNと呼ばれるモデルアーキテクチャを使用して、前年と比べて10%以上高い、他チームを大きく引き離す正解率で優勝しました。この成功を受けて、学術界はもちろん産業界からもAIへの関心が高まり、AIの技術検証、現場への導入が一気に進む形となりました。

2020年過ぎから、深層学習を用いて解くことのできるタスクに限りがあることが広く知られるようになり、第3次AIブームは収束していくかと思われましたが、2022年にChatGPTが登場したことを皮切りに「生成AIブーム」が勃発して現在に至ります。このような歴史を経て現在に至るまで、AI技術は社会へ多大な影響をもたらしており、その中でAI発展に深く関わったホップフィールド氏とヒントン氏の功績が改めて高く評価されることとなりました。

またノーベル化学賞では、2020年に発表されたアミノ酸配列からタンパク質の立体構造を予測する「AlphaFold2」開発の功績を受けて、Google DeepMindの研究者らが受賞しました。タンパク質の立体構造予測は「生物学における50年来の難題」であり(DeepMind)、AlphaFoldシリーズ登場以前は、「1個のタンパク質の立体構造を解き明かすだけで論文が1本書けた」と言います(日経クロステック)。

この難問に対しDeepMindの研究者らは、生物学者らにより解明されたタンパク質の構造を数十年にわたって収集した国際的なデータベースをもとにAlphaFold2を訓練し、GDTという指標で従来の実験的手法に迫るスコアを達成しました。今年5月に新たに発表された後続のAlphaFold3を含め、オープンソースで公開されていることも高く評価されています。

タンパク質の立体構造の予測結果例
(緑):実験的手法によって得られた構造、(青):AlphaFold2によって得られた構造
Google DeepMind

タンパク質はあらゆる生命活動の根幹を支えており、正確な構造予測がもたらすインパクトは極めて大きいとされています。AlphaFoldシリーズは、疾病のメカニズムの解明や創薬、干ばつに強い植物や安価なバイオ燃料の開発への応用が期待されており、今後はより実生活に紐づいた形でこのAIモデルの恩恵を実感できる機会が増えていくでしょう。

③ 今年のAI業界の動向を総括した「State of AI Report 2024」が公開

AI特化のVCである米Air Street Capital社より2018年から毎年出版されている「State of AI Report」の2024年版が発表されました。212ページからなる超大作となっていますが、今回はこの中から、AIモデル・プロダクトに関わる重要な動向を抜粋して解説します。

(1) 昨年と比較してLLMの推論コストが100分の1倍に。生成AIの低コスト化が進む

今年の生成AI分野における動向の中で、まず押さえておくべきはLLMの小型化・低コスト化でしょう。昨年3月にGPT-4がリリースされたときは、100万トークンの出力に60ドルもの費用がかかっていましたが、現在公開されているGPT-4o miniの費用は100分の1の0.6ドルです。

OpenAIのGPTとAnthropicのClaudeのトークン入出力費用の推移
State of AI Report 2024

日本語の出力速度もGPT-4と比べて約10倍まで改善されています。OpenAIによるChatGPT無料ユーザーへのGPT-4o開放も、LLM小型化の成功を象徴する出来事と言えます。

画像・動画生成AI分野においても、劇的ではありませんが同様の動きが見られます。例えば動画生成AIを提供するRunway社は最先端モデルGen-3 Alphaよりも7倍高速で2倍安価なGen-3 Alpha Turboをリリースしました(以前のニュースレター)。またこれまで、最先端の動画生成AIはAPIで使用できないのが通例でしたが、先月から今月にかけて立て続けにRunway社、Luma社、Kling社が最先端モデルのAPIを公開・正式リリースし、状況が一変しています(以前のニュースレター)。生成AIの運用コスト問題は、今後も着実に改善されていくでしょう。

(2) エンタープライズ向けAIプロダクトの顧客維持率は12ヶ月経過後も70%以上

法人クレジットカード会社大手のramp社によれば2023年にAIベンダーと取引を開始した企業のリテンション率は70.4%であり、2021, 2022年と比べて20%以上上昇しています。少なくともエンタープライズ向けのAIプロダクトは、顧客に広く受け入れられつつあると言えるでしょう。

AIベンダーと取引をする企業のリテンション率の推移を取引開始年ごとに仕分けしたプロット
顧客数Top 10のAIベンダーの中には、OpenAI, Grammarly, Midjourney, ElevenLabsなどが含まれる(Ramp

(3) 億単位の売り上げを有するAI企業はSaaS会社の3倍の成長速度

ChatGPTがわずか2ヶ月で1億人のユーザーを獲得したことは有名ですが、AI企業の成長速度の凄まじさはこの限りではありません。収益1億円を達成するのに要する年月と、そこからさらに収益30億円までスケールする年月のどちらを見ても、AI企業は同等に有望なSaaS企業の3倍の速度で成長しています。コーディング支援AIの発展による開発の高速化も相まって、AIプロダクト開発の競争は今後も激化の一途を辿るでしょう。

AI企業及び、同等のSaas企業の収益1億円、30億円を達成するのに要した時間の比較
State of AI Report 2024

State of AI Report 2024では他にも「来年のAI業界の動向に関する10の予測」など、興味深いコンテンツが多数収録されています。詳しく知りたい方は是非こちらよりご覧ください。

2. SNSで話題のAIツールをピックアップ!

  • AIに自然言語で指示して、フルスタックwebアプリを作成できる画期的なツール。以前話題になった「世界初のAIソフトウェアエンジニア Devin」に近い仕様

  • 実用的とは言えないが、遠くない将来に実現するであろうAIをフル活用したwebアプリ作成を擬似体験できるため非常におすすめ

  • 単一のHTML, TSXファイルを生成するのではなく、ディレクトリ設計からファイル分割まで自動で遂行してくれることもあり、ページ遷移や認証機能もかなり正確に実装してくれる

  • 一部機能制限があるが、無料でも試すことができる

  • 自分が喋っている動画をアップロードするだけで、自身のクローンAIを作成できて自由に喋らせることができる最も有名なアバター動画生成AIツール

  • 新たに「Unlimited Looks」機能が追加され、あらゆるカメラアングル、ポーズ、背景、服装で撮影した動画をもとにAIアバター動画を生成できるように

  • 無料でもカスタムアバターを一人分作成でき、それを用いて3分以下の動画を1ヶ月に3本生成できる

3.  🐬NoLangのInstagramアカウントを開設しました!

これまでNoLangの新機能紹介、使い方、使いこなすにあたってのコツをX(旧Twitter)、eメール、本ニュースレターにてお届けしてきましたが、今回新たに、Instagramのアカウントを開設しました!

こちらのInstagramアカウントでは、

✔️ NoLangの新機能・使い方を動画で学びたい
✔️ NoLangで実際にどんな動画が作られていて、流行っているか知りたい

といった要望にお応えする形で、文章ではなく動画を通して分かりやすく、有益な情報をお届けする予定です。NoLangを普段から使用されている方、今後のNoLangのアップデート情報を楽しみにされている方は、是非フォローいただけると幸いです!🐬

現在私たちは、NoLangをより多くの方に使っていただける、もっと使いやすいツールへと進化させるべく、精力的に開発を進めております。次の発表まで今しばらくお待ちください。

今後ともNoLangをよろしくお願いいたします。

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

  • どんなWebページでも3秒で解説動画に変換する「🐬NoLang

  • ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)

  • 生成AIアップスケーラー「🥩カクダイV1

といったプロダクトをリリースしてまいりました。

またMavericksは、ニュースレターだけでなくXにおいても、開発プロダクトに関する最新情報を積極的に発信しています。

特に、NoLangを普段から使用している方、生成AIの動向をより前線でキャッチアップしたい方におすすめです。是非チェックしてみてください!