- Mavericks AI ニュース
- Posts
- ChatGPTに東大入試を解かせた結果は...?日経新聞の子会社Financial TimesがOpenAIとの連携を発表!など
ChatGPTに東大入試を解かせた結果は...?日経新聞の子会社Financial TimesがOpenAIとの連携を発表!など
Newsletter from Mavericksをご覧いただきありがとうございます!
今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、日経新聞が公開したChatGPTに東大入試を解かせた結果について解説し、その考察を行います!
📚 目次
1. 直近のビッグニュースTop 3
① 日経新聞の子会社Financial TimesがOpenAIとの連携を発表
② Soraに迫る性能を持つ動画生成AI「Vidu」が発表
③ GitHubがコードの計画から実装まで支援する「Copilot Workspace」を発表
1. 直近のビッグニュースTop 3
① 日経新聞の子会社Financial TimesがOpenAIとの連携を発表
日本経済新聞の子会社であるイギリスの経済紙Financial Times(以下FT紙)が、OpenAIとの戦略的パートナーシップの締結を発表しました。これによりOpenAIは、ChatGPTにFT紙の記事データを学習させたり、記事の要約を提示させることが可能となります。
We’ve partnered with @FT to enhance news content in ChatGPT and collaborate on new AI experiences for FT readers.
— OpenAI (@OpenAI)
2:48 PM • Apr 29, 2024
具体的な契約金は明らかにされていませんが、ChatGPT回答時に引用元が明示されることが条件に組み込まれており、これがFT紙にとっての最大のメリットの一つだと考えられます。
FT紙にとってのメリットについてさらに理解を深めるため、検索業界におけるOpenAIの立ち位置について見ていきましょう。OpenAIはすでに、この業界に対して少なくない影響を及ぼしており、例えば、GPT-4登場後、プログラマー向けのQ&Aサービス「Stack Overflow」におけるトラフィックは僅か1年半で半減しました。これは多くのユーザーがプログラミングに関する疑問をGoogle検索ではなくChatGPTに投げかけるようになったことを示唆しています。
また、OpenAIは先日search.chatgpt.comというドメインを有効化したことから、対抗馬となる検索エンジンをリリースするのではないかと噂されています。さらに同社CEOのサムアルトマン氏はインタビューにて「世界にGoogleのコピーは必要ないと思う」と述べつつ、「LLMと検索エンジンの融合はクールであり、是非やってみたい」と参入に意欲を示しています。
メディア業界において、これまではGoogle検索における検索順位を向上させる「SEO」が非常に重要な事項とされてきました。もし、形はどうであれ、プラットフォーマーがGoogleからOpenAIへと変わるのであれば、OpenAIによる「引用先の明示」が今以上に大きな価値を持ってくると予想されます。
② Soraに迫る性能を持つ動画生成AI「Vidu」が発表
打倒Soraに向けて各社がしのぎを削る中、中国のスタートアップShengshu社が発表した動画生成AI「Vidu」の品質が非常に高いと話題になりました。
OSS版Soraとして知られるOpen-Soraはもちろん、RunwayやPikaといった、Sora登場以前まで最高品質を誇っていたAIサービスの生成動画よりも、数段階クオリティが高く見受けられます。
🚨 China just released SORA’s rival “Vidu”
This is China's first long duration, high consistency, and high dynamics video modelIt can create videos upto 16s with 1080P in single click.
It excels at simulating the real physical world and also showcases a vivid imagination,… twitter.com/i/web/status/1…
— Sambhav Gupta (@sambhavgupta6)
7:23 AM • Apr 27, 2024
もちろん、Soraに匹敵するレベルの競合が出てきたと言うには時期尚早です。品質の差こそかなり小さくなってきましたが、生成動画の時間上限が16秒と、Soraの1分と比べてまだまだ短いです。
それでも、元OpenAIの日本担当で、現在はGoogle DeepMindに所属するシェイン・グウ氏は、動画生成AIが早い段階でコモディティ化するという見解を述べています。その理由として、LLMと比較してデータの作成や評価に要する人的コストが小さいことを挙げています。確かに、動画はカメラやゲームエンジンを用いて簡単に生成できる上、動画の質の評価も文章の評価よりはるかに容易です。
OpenAIが2022年4月に発表した画像生成AI「DALLE-2」は当時AI業界に大きな衝撃をもたらしましたが、その3ヶ月後には「Midjourney」のオープンβ版が公開されています。Midjourney CEOは「世界シミュレーター」を構築すべく、動画・3D・リアルタイム生成といった領域に注力しているとXにて明らかにしており、Soraを超える、あるいは別のベクトルでの進化に期待が集まります。
③ GitHubがコードの計画〜実装を支援するCopilot Workspaceを発表
ソフトウェア開発プラットフォームを運営するGitHubが「Copilot Workspace」と呼ばれる機能のテクニカルプレビューを開始しました。
Copilot Workspaceでは、自然言語で書かれたIssue(課題)を与えると、AIが仕様案と実装計画を自然言語で示した後、コーディングや既存のコード修正を行ってくれます。さらに、ビルドをしてエラーがあればデバッグまで行ってくれるため、プログラミングのほぼ全ての工程を遂行できると言えます。
ただし、GitHubは発表ブログ内で、AIによるプログラマーの代替ではなく、プログラマーによる開発の効率化を意図していると説明しています。実際、各工程において開発者が容易に手動修正を行えるように設計されています。
生成AIを用いたコード補完・生成機能の登場により、ソフトウェア開発は飛躍的に効率化されています。この領域に対する世間の期待は大きく、自律型AIコーディングアシスタント「Devin」(過去のニュースレター参照)を開発したCognition社は、設立僅か半年で20億ドルの評価額をつけています。
開発の自動化や、より高度な効率化に当たっては、コーディングにあたって必要な背景知識をAIに把握させることが難しいなど、まだまだ多くの壁があります。それでも、学習データの取得が他分野に比べて容易なこともあり、AIがソフトウェアエンジニアの一員として迎えられる日が来るのは、決して遠い未来の話ではないと感じます。
2. SNSで話題のAIツールをピックアップ!
Dify (https://dify.ai/jp)
今Xで話題のLLMを使用したアプリケーションを開発できるノーコードツール
ブロックを繋げて直感的に操作できることから、コーディング知識がなくてもアプリを作れる
Claude 3, Lllama 3といった最新のLLMも使用できる上、RAGも実装可能
無料で始められ、サインアップ後メッセージ200回分のクレジットが配布
Chiper (https://chirper.ai/ja)
人間によって作成されたAIのみが投稿・交流を許されるAI専用のSNS
性格・プロフィール文などを入力して自作したAIキャラが、他のキャラとやり取りしたり、フォロワーを増やしていく様子を見守ることができる
AI忍者・AI猫好きなど、キャラが多様性に富んでいるのも面白い
無料かつ、サインアップするだけで即使用可能
3. 日経新聞がChatGPTに東大入試を解かせた結果を公開
日本経済新聞より、数学が1点では…ChatGPT、英語8割超も「東大不合格」という非常に興味深い記事が公開されました。今年の東京大学の2次試験を、3週間に渡ってプロンプトのチューニングを行った後ChatGPTに解かせてみた、という企画です。
結果は以下に示されています。灰色の図形が合格レベル目安を表していることに注意してください。
ChatGPT、東大入試に挑む 英語8割超も数学1点で「不合格」
nikkei.com/article/DGXZQO…「この計算は手作業では困難。数学の専門書をおすすめする」。人ごとのような答案もありました。古文も文脈を理解できず0点。一方、英作文や英訳は満点でした。
— 日本経済新聞 電子版(日経電子版) (@nikkei)
9:00 AM • May 5, 2024
最も優れていたのは英語で、得点率は90%近くに及びます。国語・世界史・地理・化学においては40-60%で、合格ラインあるいは少し下といったところです。致命的なのは数学・物理で、限りなく0点に近い点数となっています。なぜこのような差が生じたのでしょうか?
全科目の中で、数学と物理のみが、全ての問題において答えだけでなく導出の過程が問われます。また、各過程において、厳密に正誤が定められており、少しでも誤っていると大きな減点を受けることが知られています。対照的に国語や社会では、解答欄に書かれた単語や文章のみが評価対象となります。また、多様な解釈・表現があることから、明らかな事実誤認がなければ、誤りと断定することは困難です。
これは結局のところ、GPT-4のような高性能なLLMでさえも、論理的・演繹的に文章を生成しているのではなく、あくまでも前の単語列を元に、もっともらしい単語を確率的に出力しているに過ぎないということを示唆しています。
なお実は、LLMに拘らなければ、数学分野において素晴らしい成果をあげるAIが既に存在します。Googleが発表した「AlphaGeometry」は、既存の証明システムとLLMを組み合わせることで、国際数学オリンピックで、金メダリストに肉薄する結果を残しています(過去のニュースレター)。
ChatGPTは今回、試験三週間前からの追い込み(プロンプトチューニング)だけで、文系合格ラインにあと30点までに到達していています。ChatGPT登場以前に東大合格を目指していたAI「東ロボくん」が、東大の理系数学の模試で120点中80点という極めて高い得点を獲得していたことを考えると、東大入試も間も無くAIによって攻略されてしまうのではないでしょうか。
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
生成AI特化開発チームMavericksでは、より高い解像度でAIニュースをキャッチアップしたい方向けに、Xにて日々情報発信しています。是非チェックしてみてください!
Claude 3 OpusのGPT4に対するPros/Consをまとめました!
弊チームでも自分以外全員Claude 3に乗り換えており、かなり優れたモデルだと思っています!
■Pros
①約2倍のトークン長で、2倍前後高速②画像認識能力が格段に高い(電子データなら、装飾が多少あってもほぼ完璧にテキストを読み取れる)… twitter.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
9:09 AM • Mar 8, 2024