• Newsletter from Mavericks
  • Posts
  • MetaのオープンLLMがついにGPT-4レベルに!NoLangギャラリーで公開されている動画の中で、特に見ておくべきものを厳選して6つ紹介!

MetaのオープンLLMがついにGPT-4レベルに!NoLangギャラリーで公開されている動画の中で、特に見ておくべきものを厳選して6つ紹介!

Newsletter from Mavericksをご覧いただきありがとうございます!

今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、🐬NoLangギャラリーで公開されている動画の中で、特に見ておくべきものを厳選して6つ紹介します!

1. 直近のビッグニュースTop 3

① MetaのオープンLLMがついにGPT-4レベルに!Llama 3.1が公開

Metaが開発するオープンLLM Llamaの最新版として「Llama 3.1」が公開され、8B, 70B, 405Bの3サイズで公開されました。8B, 70Bの小〜中型モデルは、今年4月に発表されたLlama 3(以前のニュースレター)よりも大きく性能が向上している上、405Bの大型モデルは、ベンチマーク評価及び人手評価の双方において、GPT-4oやClaude Sonnet 3.5といった世界最高水準のクローズドLLMに匹敵する性能を達成しています。

(上)Llama 3.1及び主要LLMのベンチマーク比較(下)Llama 3.1と主要LLMの人手による比較。どちらのLLMの回答が好ましかったかが割合で示されている。
いずれもMetaの公式発表より抜粋

下図のように「リリース済のクローズドLLMの性能」と「オープンLLMの性能」の差はこの2年間で着実に縮まっていましたが、405Bの大型モデルの発表をもって、ついに、GPT-4レベルのオープンLLMが登場する形となりました。

言語理解ベンチマークMMLUにおけるクローズドLLMとオープンLLMの性能推移(引用元

この大型モデルを動作させるには莫大な計算資源が必要となるため、開発者が自ら構築した環境内で使用することは基本的に困難ですが、AWS, Google Cloud, Azure, Groq, Snowflakeといった主要なクラウドサービスで既に利用可能となっています。

もとよりLlamaは日本語性能が低いことで知られていますが、残念ながらLlama 3.1の対応8言語の中にも日本語は含まれておらず、Xでも日本語性能の低さを示す結果がいくつも報告されています(例:8B405B)。

それでも、LlamaのようなオープンLLMは、追加学習によって日本語性能を大きく向上させられる可能性を秘めており、実際ELYZA社が開発した「Llama-3-ELYZA-JP-70B」は、日本語ベンチマークにてGPT-4を上回る性能を達成しています(※ここで言うGPT-4は、昨年6月に公開された、GPT-4 Turbo、GPT-4oより前の世代のモデルであることに注意)。ベンチマークだけでなく、大衆による評価でもGPT-4oレベルと認められるような高性能な日本語LLMが新たに開発・公開されることが期待されます。

Metaは300億ドル相当のGPU(マンハッタン計画と同規模)を使用して開発した高性能なAIモデルを、なぜオープンにしているのでしょうか?CEOのザッカーバーグ氏は自身が執筆した記事の中で、

  • (スマートフォン市場におけるApple社を例に挙げて)クローズドモデルを提供する特定企業にロックインされることで、AI, AR/VRにおける開発が制限されることを避けたい

  • AIモデルの開発競争が非常に激しく、モデル公開がほとんどアドバンテージにならない

  • そもそもAIモデルの提供による収益化を考えていない

といった点を挙げています。Metaは直近でも、次世代スマートグラスへの画像認識AI搭載を発表しており(以前のニュースレター)、AIモデル単体だけでなく、AIモデルを搭載した画期的なプロダクトの発表にも注目していきたいところです。

② OpenAIが独自検索エンジンAI「SearchGPT」を発表!

一見良さそうだが実は推奨されないChatGPTのユースケースとして「検索」がよく挙げられます。この弱点を補うようなツールとして、生成AI検索エンジンPerplexityが登場しており、ソフトバンクと提携するなどして、国内外で着実にユーザー数を伸ばしています。しかし、欲しい情報が得られなかったり、誤情報が提供されたりすることもあって、かつてのGoogleのような革新的なブレイクスルーは起きていないのが現状です。

そんな中、かねてより噂されていたOpenAIの独自AI検索エンジン「SearchGPT」がついに発表されました。まずは、以下のデモ動画をご覧ください。

質問を入力すると、webページの検索結果を引用して回答が生成される仕様になっており、引用されたページは簡単に確認できます。また、生成された回答に対して続けて質問することも可能です。

すでにChatGPTのwebブラウジング機能やPerplexityについてご存知の方は、それらと何が異なるのか?と思われたのではないでしょうか。OpenAIの公式記事では、Atlantic, News Corpといった有名出版社のCEOらのコメントを大々的に引用しつつ、「出版社や個人により執筆された信頼性の高い文献を引用して回答すること」が強みとして強調されていました。

OpenAIはこれまで、Financial Times(日本経済新聞の子会社), AP通信をはじめとして、幾度となく大手メディア企業とのパートナーシップ提携を発表しており、それら企業が出版する信頼性の高い記事が、引用されやすい仕組みになっていると考えられます。

ただし、アルゴリズムに違いはあれど、これはすでにChatGPTのwebブラウジング機能やPerplexityにも導入されている特徴です。公式発表でも、今回の機能は将来的にChatGPTに統合される予定だと明記されており、かつてのGoogleのような革新的なブレイクスルーを起こす製品とは言えないでしょう。

SearchGPTはこちらのURLから、ウェイトリストに参加でき、既に一部の海外ユーザーに向けて公開されています。Wikipediaのページが引用されているほか、アプリのUIはPerplexityと似通っていることが見て取れます。

Perplexityでは、通常モードと比べて有料ユーザーのみが使用可能なProモードを使用した方が、回答の正確性が大きく向上する印象です。同じインターフェースであれど、回答の質は大きくUXに影響を与えることから、SearchGPTがどのレベルの検索体験を提供してくれるのかには、依然として大きな注目が集まるでしょう。

③ Google DeepmindのAIが国際数学オリンピックで銀メダル獲得を達成したと発表!

ChatGPTをはじめとするLLMが数学を苦手としているのは有名ですが、他の技術と組み合わせることにより、極めて難易度の高い問題も解けることが示されつつあります。Google DeepMindが、Alpha Geometry 2とAlphaProofという2つのAIを組み合わせて、2024年の国際数学オリンピックで銀メダル相当のスコアを達成したと発表しました

国際数学オリンピックの受験者の得点分布・メダルの色と今回AIが達成した得点を記したグラフ
AIはあと1点で金メダル相当の極めて高い点を達成していることが分かる
Google DeepMind公式発表より抜粋)

2024年の国際数学オリンピックは全6問からなり、AIはそのうちの4問を解くことに成功しました。AlphaGeometry 2は幾何学を専門とするAIであり、今年1月に発表されたAlphaGeometry(過去のニュースレター)の後継モデルです。今回は、幾何の問題1問を解くことに成功しています。AlphaProofは、組み合わせの問題を2つ解けなかったものの、2つの代数の問題と1つの数論の問題を解くことに成功しています。

AIの正解・不正解とどのAIモデルが正解したかを図示したフローチャート
Eraserにより作成)

GoogleチーフサイエンティストのJeff Dean氏によると数年前までは、数学AIシステムが国際数学オリンピックの100問のうち1問を解けただけでも幸運だったとのことで、AIの進化の速さに驚かされます。

AlphaGeometry 2とAlphaProofの双方において、LLMの得意領域でGeminiが使用されています。幾何学専門AIのAlpaGeometry 2では、補助線や補助円を考える作業をGeminiに担当させており、これはLLMの得意な「アイデア出し」のタスクに相当します。一方で、LLMの苦手な論理展開は、既存の証明システムによって処理されています。

AlphaProofでは、数学の問題をLeanと呼ばれるプログラミング言語に変換する作業をGeminiに担当させています。自然言語をプログラミングに変換したり、その逆を行うことは、やはりLLMの得意なタスクです。プログラミング言語に変換された問題は、世界最強の囲碁棋士を打ち負かしたことで有名なAlphaGoの後継モデル「AlphaZero」によって解かれています。

AlphaProofの学習にあたっては、幅広い難易度と数学的トピック領域をカバーする数百万の問題を証明または反証させています。また、本番では3日間をかけてようやく解けた問題もあったとのことです。LLM技術の発展はもちろん、他の技術との組み合わせ方を工夫することで、より効率良く広範な問題を解けるようになる可能性があり、次なる成果発表が待たれます。

2. SNSで話題のAIツールをピックアップ!

  • RunwayのGen-3と並んで有名な高品質な動画を生成できるAIツール。ついに日本でも使用可能に

  • テキスト及び画像からの動画生成に対応しており、カメラワークも指定可能。5分前後で5秒の動画が生成される

  • 右上の「Sign In」をクリック後、「Sign up for free」を押下してメールアドレスとパスワードを入力してサインアップ可能

  • ログインボーナスとして、1日66クレジット(動画生成6.6回分)が無料付与

  • LINEやインスタのDMなどのスクショをアップロードするだけで、会話に合わせたぴったりな返信案を出してくれるアプリ。日本の若手クリエイターが開発

  • LINE, Instagram, Messanger, Slack, X, Pairsなどあらゆるアプリに対応

  • 返信案が気に入らなかった時の修正方法が非常に直感的かつ簡単。生成される文章の質も高い

  • Apple Storeから利用可能月額800円だが3日間無料トライアルがある。加入直後に解約しても期限日まで使用可能

3. 🐬NoLangギャラリーで公開されている動画の中で、特に見ておくべきものを厳選して6つ紹介!

今回は、NoLangのギャラリーにて公開されている動画の中から、特に見ていただきたいものを厳選して6つお届けします。各動画へのURLも添付していますので、是非NoLangのユースケースを考えるにあたって、参考にしてみてください!

(1) 日常で生じた疑問を種に解説動画を作る(URL

ユニクロを訪れた時に、会計時に衣服を雑に置くだけで、全ての商品が自動検出されたことに感動したことがある方は多いのではないでしょうか。これはRFIDと呼ばれる仕組みで実現されています。

そのような日常で生じた疑問に関して、NoLangは分かりやすい解説動画を生成してくれます。「導入コストはいくらなのか?」など、気になった点に関してさらに質問してみるのも良いでしょう。

(2) 専門用語について分かりやすく解説(URL

最近話題になった「ダークウェブ」に関する驚くほど分かりやすい「ゆっくり解説」形式の動画です。NoLangは難しい専門用語の解説を得意としており、例や比喩を交えながら分かりやすく解説してくれることが多いです。

(3) もしホッキョクグマとシャチが闘ったら…?(URL

ホッキョクグマとシャチが闘ったらどちらが勝つのか?を題材に作成された動画です。この動画のように、迫力のある仕上がりになった場合は、縦型ショート動画形式でダウンロードしてみるのもおすすめです。

(4) 動画をまさかの展開にもっていく(URL

「ずんだもんが雑学を紹介するが、最後に既に人類は滅んでいて、この動画を見る者は残っていないと思い出してしまう」というユニークなプロンプトで生成された動画です。NoLangではこのように、大枠を伝えてあげるだけで、ストーリー仕立ての動画も簡単に作成できます。

(5) 画像生成AI機能を用いて、動画の品質を大幅アップ(URL

イースター島の歴史について学べる分かりやすい解説動画です。NoLangでは、画像生成機能をONにすることで、高度なAIで生成された画像を使用できます。下記動画では、巨人がモアイ像をレゴブロックで組み立てる様子を描いた、非常に高品質な画像が生成されている点が印象的でした。

(6) 歴史上の人物になりきってもらう(URL

「偉人にインタビュー」という公式プロンプトを使用して作成された動画。ペリーになりきった人物に対してインタビューする形で、歴史について学ぶことができます。NoLangのプロンプト機能を使えば、特定の人物になりきってもらう「ロールプレイング」が可能です。動画の面白さが一気に増しますので、是非試してみてください。

紹介は以上です。以前のX投稿(初回第二回)にて、ユーザーの皆様が投稿してくださった動画の中で、特に素晴らしかったものを取り上げていますので、併せてご覧ください!

なお、以前のニュースレターにてNoLang2.0についての詳細な解説を行いました。NoLangを使いこなしたい方は、是非こちらもご覧ください!

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

  • どんなWebページでも3秒で解説動画に変換する「🐬NoLang

  • ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)

  • 生成AIアップスケーラー「🥩カクダイV1

といったプロダクトをリリースしてきました。

またMavericksは、ニュースレターだけでなくXにおいても、開発プロダクトに関する最新情報、AI分野の最新動向や知見を積極的に発信しています。

特に、NoLangを普段から使用している方、生成AIの動向をより前線でキャッチアップしたい方におすすめです。是非チェックしてみてください!