- Mavericks AI ニュース
- Posts
- OpenAIが月額3万円で使用可能な驚異の新モデル「o1 pro mode」を公開!まもなくNoLangの大規模アップデートを実施します!など
OpenAIが月額3万円で使用可能な驚異の新モデル「o1 pro mode」を公開!まもなくNoLangの大規模アップデートを実施します!など
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!
今回は、OpenAIが先日発表した新モデル「o1」「o1 pro mode」の解説を重点的に行い、さらに12/11 (水) に予定している🐬NoLangのリニューアルについてお伝えします!
※ 「SNSで話題のAIツール紹介」は、お休みさせていただきます。
📚 目次
1. 【o1、o1 pro mode特集】直近のビッグニュースTop 3
① OpenAIがo1正式版と、月額3万円で使用可能な新モデル「o1 pro mode」を公開!
② o1に過去9ヶ月分のニュースレターを与えて未来予測させてみた
③ 今後の生成AIの進化を考えていく上で、やはり鍵になるのは「AIエージェント」である
1. 【o1、o1 pro mode特集】直近のビッグニュースTop 3
① OpenAIが「o1」正式版と月額3万円で使用可能な新モデル「o1 pro mode」を公開!
今年も残るところあと一ヶ月となりましたが、12月は生成AI業界が熱狂するひと月となりそうです。OpenAIは12月5日、年末の大型イベント「12 Days of OpenAI」を開始し、12月23日までの土日を除く12日間、毎日新しい技術やアップデートを発表していくと発表しました。
そして初日から、待望のo1シリーズの正式版「o1」と、月額200ドルの新プランでのみ利用可能な「o1 pro mode」という2つの新モデルをリリースしました。
o1シリーズの最大の特徴は、「回答前にじっくり推論する」という新しいアプローチにあります。これにより、数学や科学、プログラミングといった論理的思考力が試される分野において、博士レベルの難問にも対応できるようになってきています(以前のニュースレターも参照)。
9月に公開されたo1-previewと、今回発表されたo1, o1 pro modeの性能比較。数学、プログラミング、科学の問題を集めたベンチマークにおいて、4回試行して4回とも正解した割合(%)を比較しており、一回だけ問題を解かせる時と比べて性能差が大きくなっている点が強調されている。
9月に発表されたo1-mini, o1-previewと比較すると、今回の新モデルはSNSでの評判が良いように見受けられます。実際の生成例を見ながら、o1, o1 pro modeの「凄さ」について見ていきましょう。
(1) コンサルタントの模範解答とも言える論理展開
o1の高い論理的思考力は、コンサルティングのケース面接のような場面で特に際立っています。例えば「三鷹市のパン屋の売り上げを2倍にするには?」という質問に対し、o1は前提・仮定の確認から丁寧に入った上で、「売上=客数×客単価×購入頻度」という明確な要素分解を行い、さらに各要素を向上させるための具体的な施策まで落とし込んでいます。
o1にケース面接を模したプロンプトを与えた際の回答。プロンプトはusutakuさんの投稿で使用されているものを拝借した。
ここには掲載していませんが、gpt-4o, o1-miniに対し同一プロンプトを与えると、十分な前提検討なくいきなりアプローチに入り、要素分解の粒度も荒く説得力に欠ける文章を生成します。
POSTS代表の梶谷健人氏も「もはや普通のコンサルよりも良いアウトプットを出してくる気がする」とコメントしている通り、o1の論理的思考力は人間のプロフェッショナルに迫る、あるいは凌駕する水準に達していると言えるでしょう。
(2) 画像入力に対応し、コーディング能力も大きく向上
o1, o1 pro modeは画像入力にも対応しており、これまでのVLMでは難しかったタスクも実現できるようになっています。例えば、暗号資産取引所「Coinbase」のウェブページのスクリーンショットを入力し、そのデザインを再現するコードを生成させる実験では、o1 pro modeは他の有名モデルを大きく引き離す品質でページを再現することに成功しています。
OpenAI o1 pro is *significantly* better than I anticipated.
This is the 1st time a model’s come out and been so good that it kind of shocked me.
I screenshotted Coinbase and had 4 popular models write code to clone it in 1 shot.
Guess which was o1 pro.
— Mckay Wrigley (@mckaywrigley)
5:44 PM • Dec 6, 2024
この結果は、o1シリーズが優れた画像解析能力とコーディング能力を併せ持っていることを示しています。特にコーディング能力については、昨年3月のGPT-4リリース以降大きな進展が見られていませんでしたが、o1シリーズの「じっくり推論する」というアプローチによって、コーディング能力における「GPT-4の壁」が打ち破られたと感じます。
更なる比較として、次の節ではこれまでのニュースレター記事を与えて未来予測させてみた結果についてお伝えします。
② o1に過去8ヶ月分のニュースレターを与えて未来予測させてみた
本ニュースレターの4月から12月までの記事から、各月1本ずつ計9本を選んでo1シリーズに入力し、未来予測を行わせる実験を実施しました。その結果は、LLMの進化を如実に示すものとなりました。
まずgpt-4oの回答は、「モデルの小型化・高速化が進む」「規制が整うことで市場はさらに拡大し、信頼性が高まる」といった、ニュースレターの内容を参照しなくても書けてしまうような抽象的で一般的な予測に終始しました。
9ヶ月分のニュースレターの記事を与えて、その要約をもとに未来予測させた結果(gpt-4o)
一方、o1の回答は格段に具体的で示唆に富んでいます。「(今年は動画生成AIの年だったが)これからは3Dへの拡張が期待される」という予測や、「LLMの性能が伸び悩んでいる」「LLMは性能は中程度だが安価なモデルと、超高性能なモデルに二極化していく」といった、本ニュースレターで述べた重要な知見についてしっかりと言及できています。また、「」を効果的に使って強弱をつけようという姿勢も見られます。
厳しく評価するなら、「世界モデル」や「MCP」といった切り口は過去のニュースレターと同じでオリジナリティに欠けますが、それでもgpt-4oと比較すると格段に優れたインサイトを提供しています。
9ヶ月分のニュースレターの記事を与えて、その要約をもとに未来予測させた結果(o1)
さらにo1 pro modeになると、分析の深さは一段と増します。「動画生成AIの性能は、品質面では既に実写と区別不可能な水準にある」という本ニュースレターでよく強調している現状分析に加え、より長期的な展望として「人間は最終的に承認・意思決定側に回る」「ハルシネーションはなくならず、ファクトチェックは不可欠だが、それをAIで行えるかもしれない」といった、生成AIの本質的な課題にまで踏み込んだ予測を示しています。
9ヶ月分のニュースレターの記事を与えて、その要約をもとに未来予測させた結果(o1 pro mode)
これらの結果からo1シリーズの特徴が見えてきます。o1-mini, o1-previewの段階で、「8cmの綿菓子の上に7cmのレンガを置いたらどうなるか?→7cm」といった引っ掛け問題にしっかり回答できるなど、入力を「理解する (Read)」際の思考力の高さは確認されていました。しかし新モデルのo1, o1 pro modeはさらに、出力を「生成する (Write)」段階でもじっくりと推論を行うことで、体系化され、強弱のある「読みやすい」文章を生成できていると感じました。
③ 今後の生成AIの進化を考えていく上で、やはり鍵になるのは「AIエージェント」である
これまで見てきたように、o1およびo1 pro modeの知能・思考力は極めて高い水準にあります。もはや性能を引き出すにあたり、我々使い手の知能がボトルネックになるケースが多くなっているとも言えるでしょう。
一方で、現状ではこれらのAIモデルはあくまで「究極の指示待ち人間」として機能しており、代替可能なタスクは限定的なものとなっています。ChatGPTの登場直後には「コンサルの仕事がなくなるのでは」という声も聞かれましたが、結局は多くのユーザーが「どうやって使えばいいか」という課題に直面しています。実際、2023年6月時点でのアクセンチュア社の第三四半期統計によれば、同社の生成AI領域における受注額は36億ドルに相当し、これはOpenAI社の売上34億ドルをも上回る規模となっています。
この「生成AIをどう使えばいいか分からない」という問題を技術的に解決する可能性として、2つのシナリオが考えられます:
AIが外部ツールを活用して自ら行動し、問題を解決できるようになる
AIがユーザーが本当に求めているものを「聞き出す力」を獲得する
特に注目すべきは1つ目のシナリオで、これは現在の生成AI業界で「AIエージェント」として注目されているトレンドそのものです。このワードは、やはり来年以降の生成AI業界を象徴する重要なキーワードとなっていくのではないでしょうか。
o1は、既に「プログラミング」「壁打ち」といったタスクにおいて、これまでにない新しい体験を提供しており、「ライティング」においても大きな可能性を秘めています。今後、ユーザーによって更なるユースケースが発掘されていくことを期待しましょう。
💡 ChatGPTの「o1」は、Plus, Teamプランのユーザーに公開されています。また「o1 pro mode」は、月額200ドルの「ChatGPT Pro」に加入しているユーザーのみ使用することができます。
2. 【予告】12月11日に🐬NoLangの大規模アップデートを実施します!
長らくお待たせしました!明後日12月11日に、NoLangの大規模アップデートを実施します!
既にNoLangで定期的に動画を作成されている方も、そうでない方も楽しめるアップデートを予定しています!さらに、新機能を存分に体験していただけるよう期間限定のキャンペーンも実施予定です。
公式Xアカウント(https://x.com/sayhi2ai_jp)にて情報発信していきますので、フォローの上リリースまであと2日、今しばらくお待ちください!
なお、今回のアップデートにおいては動画設定画面が刷新されます。これに伴い動画設定が初期化されますのでご注意ください。詳しくは以下の注意事項をご覧ください:
⚠️動画設定リニューアルに伴う注意事項
・ユーザーの皆様の動画設定が初期化されます
・従来の設定内容は閲覧できなくなります
・お気に入りの設定がある方は、今のうちにメモを取っていただきますようお願いいたします
・現在適用可能な動画設定は全て、リニューアル後も適用可能です
・既に作成された「プロンプト」は削除されず、残り続けます
さいごに
最後までお読みいただきありがとうございました。
来週のニュースレターでは、NoLangの大規模アップデートで追加される新機能について詳しくご紹介する予定です。どうぞお楽しみに!
運営元の紹介
生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、
どんなWebページでも3秒で解説動画に変換する「🐬NoLang」
ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)」
生成AIアップスケーラー「🥩カクダイV1」
といったプロダクトをリリースしてまいりました。
またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!
🐬NoLangとPerplexityを組み合わせれば、最新トレンドに関する解説動画も簡単に生成できます!
「ゆっくり解説」も「ショート動画」も、リサーチから生成まで一瞬で完了!
Perplexityのいいところは、引用文献も閲覧できること。怪しいな...と思ったらすぐに確認、修正まで可能です!
続く >> x.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
6:08 AM • Jul 11, 2024