- Mavericks AI ニュース
- Posts
- DeepSeekショックによりNVIDIAの時価総額が90兆円減少、NoLangの法人プランリリース並びに株式会社大広WEDOとの業務提携開始のお知らせなど
DeepSeekショックによりNVIDIAの時価総額が90兆円減少、NoLangの法人プランリリース並びに株式会社大広WEDOとの業務提携開始のお知らせなど

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!
今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、🐬NoLangの法人プランリリースならびに株式会社大広WEDOとの業務提携による新サービス開始のお知らせをいたします。
📚 目次
1. 直近のビッグニュースTop 3
① OpenAIが最新モデル「o3-mini」をリリース!驚異的なコスト効率を実現
② NVIDIAの時価総額を90兆円減少させた「DeepSeekショック」をどう捉えればいいか?
③ OpenAI o1が共通テストで東大合格レベルの9割超えを達成!
2. SNSで話題のAIツールをピックアップ!
① Freepik AI
② Artificial Analysis
1. 直近のビッグニュースTop 3
① OpenAIが最新モデル「o3-mini」をリリース!驚異的なコスト効率を実現
OpenAIが昨年末発表していた「o3」シリーズの軽量モデルをリリースし、「o3-mini (medium)」「o3-mini (high)」の2つのモデルが使用可能となりました。o3-mini (medium)は全ChatGPTユーザーに向けて公開され、より高性能な「o3-mini (high)」は有料ユーザー向けに提供されています。
以前の発表通り、両モデルは数学、プログラミング、科学といったSTEM分野のベンチマークでo1-miniを上回り、場合によってはo1をも上回るスコアを達成しています。さらにo3-mini (medium) の応答時間は、o1-miniと比較して76%まで短縮されています。

(左)数学のベンチマークAIME 2024におけるo1, o3シリーズのモデルのスコア比較
(右)o1-mini, o3-mini (medium) のレイテンシ比較
(OpenAI)
特筆すべきは、圧倒的なコストパフォーマンスです。o3-mini (medium)は、STEM分野のベンチマークで2ヶ月前にリリースされたo1に迫る性能を達成しながら、料金はその約14分の1に抑えられています。
昨年のLLM業界では「モデルの小型化」が主要なトレンドであり、Anthropic CEOのAmodei氏によれば、GPT-4の15ヶ月後にリリースされたClaude 3.5 Sonnetは、ほぼすべてのベンチマークでGPT-4を上回るスコアを記録しながら、API価格は約10分の1です。今回の発表は、o1のような長考型の「reasoning model」においても、今後目まぐるしいスピードで小型化が進み、それに伴ってコストと速度が改善されていくことを示唆していると言えるでしょう。
一方で、これらモデルには留意すべき点もいくつかあります。OpenAIの公式発表では、o1が「汎用的なモデル」と位置付けられているのに対し、o3-miniは「技術的分野に特化したモデル」とされており、人手による評価でも、o3-mini (medium)のo1-miniに対する勝率は、非STEM分野において53%以下と、限定的な性能向上に留まっています。

(左)STEM分野におけるo3-mini (medium) の人手比較における勝率
(右)非STEM分野におけるo3-mini (medium) の人手比較における勝率
(OpenAI)
さらに個人的には、o3-mini (high)であってもプログラミング用途において、問題解決力や回答の品質はo1-miniこそ上回るものの、o1には及ばないという印象です。また、o1と異なり検索機能と併用できる点がo3-miniの強みですが、取得されるweb文献数が増えていないようであり、GPT-4oと比較して劇的な体験向上には至っていないと感じます。Google Deep SearchやFeloでは一度に数百の文献を取得できることを考えると、まだまだ改善の余地が残されていると言えるでしょう。
OpenAI公式のAMAでは、o3のフルバージョンのリリースは早くて数週間後、遅くとも数ヶ月以内と言及されています。この期間中にLLM開発の勢力図がどのように変化するのか、注目したいところです。
💡o3-miniは以下の形で提供されています
・Freeプラン→o3-mini (medium) を利用可能
・Plus, Teamプラン→o3-mini (medium, high) を150回利用可能
・Proプラン→o3-mini (medium, high) を無制限に利用可能
Tier3以上のアカウントには o3-mini (medium)のAPIが提供されています。
② NVIDIAの時価総額を90兆円減少させた「DeepSeekショック」をどう捉えればいいか?
DeepSeek社による新モデル「DeepSeek-V3」「DeepSeek-R1」の発表が業界に大きな衝撃を与え、その影響は依然として続いています。NVIDIA社の株価は一時前週末比で17%もの大幅な下落を記録し、時価総額の減少額は約91兆円に達しました。これはトヨタ自動車の時価総額(約46兆円)のおよそ2倍に相当します。また、DeepSeek社のモバイルアプリが日本とアメリカのApp Store無料アプリランキングで1位を獲得するなど、世間から広く注目を集めています。
しかし現在は、様々な情報が錯綜している状況です。ここでは、Anthropic社CEOのDario Amodei氏による投稿と、半導体およびAI業界の専門調査分析会社であるSemiAnalysisのレポートを基に、状況を整理していきます。
DeepSeek-V3
(1) V3の開発費用として論文では「600万ドル」という数字が公表されているが、これは事前学習時のGPUコストのみを指しており、R&D、ハードウェアの導入・管理、データ収集、人材獲得のコストを反映した総費用ではない。SemiAnalysisは「GPUの購入費用だけでも5億ドルを超える」と分析
→ OpenAI, Google, Anthropicらによる競争に加わって、最先端のLLMを新規開発するのにかかる総コストは依然として莫大
(2) V3のAPI料金の安さが話題を呼んでいるが、同等性能を実現するための推論コスト低下のペースを鑑みると既定路線内
→ それでも、中国企業が最先端の開発競争に参入できる水準に達したという事実自体は、高く評価されるべき
DeepSeek-R1
(3) なぜo1に匹敵する性能を持つ「DeepSeek-R1」をこのタイミングで発表できたのか?
→ 業界全体が「事前学習によるスケーリング」の時代から、oシリーズに代表される「強化学習によるスケーリング」の時代へと移行する過渡期にあり、一時的に参入障壁が低下していたことが挙げられる
(4) ただしR1の開発費用は非公表となっており、その学習方式から判断して、膨大な計算資源が投入されたと推測される
(2)について、Anthropic CEOのAmodei氏やEpoch AI社の推定によると、同等性能のLLMを学習・推論させるために必要なコストは毎年約4分の1に低下すると推定されており、最大で10分の1まで低下する可能性も指摘されています。これまでのLLM開発分野は、このような「コストダウン」と広く認識されている「スケーリング則」の相乗効果によって発展を遂げてきたと言えるでしょう。
実際、下図が示す通り、GPT-3クラスのLLMのAPI料金は年々約10分の1のペースで低下を続けています。

MMLUスコアで42を超える最安のLLM(GPT-3水準)のAPIトークン費用の推移
(SemiAnalysis)
さらにGPT-4水準のLLMについても、同様に約10分の1ずつの価格低下が見られ、Meta社の開発したオープンLLM「Llama 3.1」もこの流れに位置づけられています。

MMLUスコアである閾値を超える最安のLLM(GPT-4水準)のAPIトークン費用の推移。一つ目のグラフと異なりモデル間で性能差があるため「Certain MMLU Cost」と表記されている。
(SemiAnalysis)
このことから、R1の発表自体はこうした業界トレンドの延長線上にある成果と捉えることができます。それでも、半導体の輸出制限下にある中国企業が初めてこの水準に到達したという事実のインパクトは、やはり大きかったと考えられます。
さらに(3)と(4)が示すように、V3とR1は異なるスケーリングパラダイムに属するモデルとして、区別して考える必要があります。R1の開発には依然として巨額のGPU投資が必要だったと推測され、今後は「強化学習によるスケーリング」の発展に伴い、開発コストが急増する可能性も指摘されています。
Amodei氏から見てもNVIDIA社の株価急落は不可解な現象だったようですが、AIモデル開発分野への社会的関心が一層高まっていることは確かです。また、いずれにせよDeepseek-V3, R1がテクニカルレポートを含めてオープンに公開されたことは、LLM開発業界に大きな影響を与えると予想されます。今後の動向を注視したいところです。
③ OpenAI o1が共通テストで東大合格レベルの9割超えを達成!
OpenAI社のAIモデル「o1」が、共通テスト(旧センター試験)にてついに90%を超える驚異的な正答率を記録しました。これはLifePrompt社が毎年実施している調査の結果であり、昨年の正答率67%から大幅に向上し、東大合格レベルの得点に到達しています。

この結果は、Web Browsing機能、Code Interpreter機能(pythonを使用して計算可能)はもちろん、特別なプロンプトテクニックをも使用せずに達成されました。回答にあたっては基本的に問題のスクリーンショットのみを与えており(国語のみ文字起こし結果を併用)、純粋なAIの知能によって得られた結果と言えます。
LifePrompt社の調査レポートでは正答率が飛躍的に向上した要因として、マルチモーダル機能が強化され、図表の読み取り精度が大幅に向上したこと、ついで数理計算能力が向上し、数学の問題にも対応できるようになったことが挙げられています。
このように生成AIモデルの知能面における汎用性は極めて高くなっており、外部ツールや他者の助けを借りられない状況での比較では、「人間には簡単だがAIは苦手なタスク」はなくなりつつあります。
ではAIが「東大合格レベル」の知能を獲得しているのにも関わらず、なぜAIのビジネス活用は依然として限定的なのでしょうか?その要因の一つとして「オンボーディングの難しさ」があると考えられます。
「AIオンボーディング」はLayerX社が提唱している概念でもあり、以下のように説明されています:
人間の社員は、色々な苦楽を乗り越えて成長していきます。業界にもよりますが、会社の中で「エース」として活躍するために、5年から20年かかることもあるでしょう。色々な人と日々議論して、上司に指導されて、時には失敗をして、、、人間が時間をかけて得られる経験に比べると、現状LLMに渡されている情報はとてもわずかです。
一方で残念ながら、現時点でAIに会社特有の知識や業務を身につけさせようとすると、「プロンプトを工夫して背景知識を与える」「RAGを使用して資料へアクセス権限を与える」といった手段しかないのが現状です。これらはいわばAIに「Slackで要望をメッセージ送信する」「Google Driveでファイルへのアクセス権限を与える」といった行為に相当し、オンボーディングには程遠いです。
これらの技術的課題が解決され、AIが独自の知識やルールを一定以上の精度で会得できるようになるのは、早くとも数年から5年後になるでしょう。しかしそのような時が訪れれば、生成AIのビジネス活用における大きな転換点となることは間違いありません。
2. SNSで話題のAIツールをピックアップ!
Freepik AI (https://www.freepik.com/ai)
画像素材サイトとして有名なFreepikが提供するAIサービス。画像生成・編集に関する様々なAI機能がオールインワンで提供されている
特に「Retouch」と呼ばれる機能では、Fluxを使用してどんなアスペクト比の画像でも簡単に部分修正できる。複数の選択肢が表示されるのも嬉しい
機能や回数の制限はあるが、Googleログインで無料で利用可能。今後も機能を拡充予定とされている

Artificial Analysis (https://artificialanalysis.ai/)
最先端のAIモデルの性能、速度、API料金などを一挙に比較できるwebサイト
「性能×料金」「性能×速度」といった切り口でもモデルを比較できる
網羅性はもちろん、更新頻度も非常に高くモデル発表後数日でデータが掲載
ログインなしで無料で利用可能

3. 🐬NoLangの法人プランがリリースされました!
NoLangをより多くの企業様にご活用いただけるよう、この度法人向けプラン「NoLang for Business」をリリースいたしました。さらに、株式会社大広WEDOとの業務提携による新サービス「NoLang with WEDO」の開始についてもお知らせします。
(1) NoLang法人プラン提供開始のお知らせ
NoLangはサービス開始以来、多くの皆様にご利用いただき、登録者数10万人を突破いたしました。企業や自治体での導入実績も着実に増加し、社内教育や営業支援、広報・PRといった用途で「自社で動画制作を内製化したい」という強いニーズが寄せられるようになりました。
こうした要望を受け、この度法人向けプラン「NoLang for Business」の提供を開始いたします。

⬛︎ NoLang for Business の主な特長
企業の動画制作ニーズを包括的にサポートすべく、以下のような機能を提供しております:
・自社独自のアバター(Live2D)・画像・背景動画・BGMが使用可能
・ユーザー・動画生成ログの管理機能、社内アセット共有機能
・専任カスタマーサクセスマネージャーによる手厚いサポート
またAIの学習有無や著作権について、NoLangではコンテンツを学習に一切使用せず、著作権に配慮したコンテンツのみを使用しております。
さらに、ご要望に合わせて以下のような開発も承っています。
・オリジナルアバターや独自音声の作成
・貴社セキュリティプランに応じた追加開発
・外部システムとのAPI連携
・独自アルゴリズムの追加開発
詳細はこちらのwebサイトをご覧ください。
(2) 大広WEDOとの提携による新サービス開始のお知らせ
株式会社大広WEDOとの業務提携により、新サービス「NoLang with WEDO」の提供を開始いたします。
本サービスでは、月額制で一定本数の動画を高速かつ安価に制作可能です。WEDOのプロクリエイターがNoLangを活用し、お客様のニーズに合わせた動画制作をサポートいたします。
詳細はこちらのURLをご確認ください。

⬛︎ お問い合わせ
上記2サービスに関するお問い合わせは、こちらのwebページより受け付けております。
その他のご質問やご相談は、以下のメールアドレスまでお気軽にお問い合わせください:
[email protected]
NoLangは今後も、個人での創作活動から企業での業務活用まで、あらゆる場面での動画制作をサポートしてまいります。さらに、今後縦型ショート動画についての新機能をリリース予定ですのでご期待ください。引き続きNoLangをよろしくお願い申し上げます。
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、
どんなWebページでも3秒で解説動画に変換する「🐬NoLang」
ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)」
生成AIアップスケーラー「🥩カクダイV1」
といったプロダクトをリリースしてまいりました。
またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!
🐬NoLangとPerplexityを組み合わせれば、最新トレンドに関する解説動画も簡単に生成できます!
「ゆっくり解説」も「ショート動画」も、リサーチから生成まで一瞬で完了!
Perplexityのいいところは、引用文献も閲覧できること。怪しいな...と思ったらすぐに確認、修正まで可能です!
続く >> x.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
6:08 AM • Jul 11, 2024