• Mavericks AI ニュース
  • Posts
  • OpenAIがついにGPT-5へのロードマップを公開!NoLangに新たなボイスが追加されています!おすすめボイスを5つ紹介など

OpenAIがついにGPT-5へのロードマップを公開!NoLangに新たなボイスが追加されています!おすすめボイスを5つ紹介など

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、🐬NoLangのおすすめボイスを、直近追加されたものを含めて5つ紹介します!

1. 直近のビッグニュースTop 3

① OpenAIがGPT-5へのロードマップを公開。oシリーズとの統合で全く新しいシステムへ

2023年3月にGPT-4がリリースされてからおよそ2年が経ち、ついにOpenAI CEOのサム・アルトマン氏がXにて、今後のOpenAIのロードマップを公開しました。概要は以下の通りです:

・状況に応じてモデルやプロダクトを使い分けることは煩雑であり好ましくないという考えのもと、GPT-4.5をリリースした後、GPTシリーズとoシリーズの統合を進めていく

GPT-5は、o3を含む複数技術が統合されたシステム†であり、音声、Canvas、Search、Deep Researchといった機能が含まれる形で提供

・無料ユーザーからProユーザーまで、原則誰でも無制限にGPT-5へアクセス可能となる予定。ただしプランが上がるにつれて、より高度な知能を持ったGPT-5にアクセスできる仕組みを導入
† 同時に、「GPT-4.5はChain-of-Thoughtを使用しない最後のモデルである」「o3単独でのリリースは行わない」とも明言

(全文はこちら

サム・アルトマン氏が示したOpenAIの今後のロードマップ
引用元:Threads

現在ChatGPTを最大限に使いこなすためには、GPT-4o、o1、o1 proといったモデルの選択や、Search、Canvasといった機能の有効化タイミングを、タスクごとに私たちが判断する必要があります。このような問題を解決すべく、「GPT-5というただ一つのAIに聞くだけで残りはAIが全てやってくれる」といったユーザー体験の提供を目指していることが明らかになりました。

一方で、「GPT-4.5はChain-of-Thoughtを使用しない最後のモデルである」と発表されたこともあり、海外の有識者からは、GPT-3からGPT-4への飛躍を支えた「学習のスケーリング則」の限界への言及も見られます(Standard NLP Group, Gary Marcus氏)。AIを巡る誇大広告への批判で知られている認知科学者のGary Marcus氏は「AIは、おそらく新たな発明をしながら生き延びるだろう。しかし、データと計算の純粋なスケーリングは、GPT-6はおろか、GPT-5にさえ到達できなかった」と述べています

またGPT-4.5のリリースに先駆けて、GPT-4oの大幅なアップデートも実施されました。これまでClaudeが得意としてきた「AIっぽさのない自然なライティング」「文体に関する指示への高い追従性」が実現されていると国内外で話題を呼んでいます。

実際にNoLangに関するweb情報をもとに「小学生向けに説明して」と質問すると、小学生向けに相応しい語彙レベルと例を用いた回答が得られ、カジュアルな口調での質問には「ガチで編集」といった口語的な表現で応答するなど、ChatGPTとは思えないほど自然な対話が可能になっています。

NoLangに関してsearch機能を使って情報をまとめさせた後、別クエリでChatGPT 4oに質問した結果。
(左)「小学生に向けて説明して」(右)「じゃあ普段は動画制作にどんなツール使ってるん?」
なお、NoLangの正式な読み方は「ノーラン」である。

GPT-3.5、GPT-4の登場時には、LLMの得意タスクとして「ライティング」「アイデア出し・壁打ち」「コーディング」の3つがよく挙げられていました。oシリーズをはじめとした長考型モデルの登場により、壁打ち・コーディングタスクにおける有用性が大幅に向上していましたが、さらに最も手軽なユースケースであるライティングにおいても、まだまだ伸び代がある可能性が示された形となります。

💡 真偽は定かではありませんが、サム・アルトマン氏はXでのユーザーとのやり取りの中で、GPT-4.5を数週間後に、GPT-5を数ヶ月後にリリース予定だと発言しています。

② Pikaが動画内に自然にオブジェクトを追加できる新機能「Pikadditions」を発表

昨年のSoraの発表を皮切りに、動画生成AIの性能は飛躍的に向上してきましたが、今年に入ってもその進化は着実に続いています。新たにPika社より、あらゆるオブジェクトや人物を既存の動画に追加できる新機能「Pikadditions」がリリースされました。

動物やアニメキャラクター、人物など、様々な対象をまるで最初から動画に登場していたかのように合成できており興味深いです。是非以下のデモ動画をご覧ください。

SNSでは早速、ユーザーによって作成された動画が多数投稿されており、人気ドラマ「イカゲーム」にアインシュタインを登場させたり、Blenderで作成した3D空間にキャラクターを配置したりといった試みがなされています。追加されたオブジェクトに対して照明による影までもがリアルに再現されており、やはり生成動画の品質は高いです。

ここ数ヶ月の間に、動画に登場するオブジェクトを指定する機能がいくつかリリースされており、例えば今年発表されたKlingの「Elements」機能では、動画に映る人物、商品、洋服、場所などを指定でき、商品、アパレルのプロモーション動画を簡単に制作できるようになっています。

しかし、動画生成AIにはまだ課題も残されています。動画内に「何が登場するか」は徐々に制御できるようになってきた一方で、「何が起きるか」「登場人物が何をするか」といった「変化」の指定は依然として難しく、思うような結果が得られない「ガチャ」なのが現状です。これは画像を「動かす」必要のある動画生成AI特有の課題であり、今年どの程度改善が進むのか、注目したいところです。

💡 Pikadditionsは無料でも試すことが可能ですが、最新モデルPika 2.1は有料プランに加入しないと使用できず、Pika 1.5のみが使用できます。

③ DeNAが「AIにオールイン」を宣言。全社員の半数となる1500人で新AI事業展開へ

DeNAの南場智子会長が「DeNA×AI Day」での基調講演で、社員約3000人の半数にあたる1500人で新規AI事業を展開し、「AIにオールイン」する方針を表明しました。toB領域では既存事業で強みを持つヘルスケアやスポーツ分野でのバーティカルAIエージェントサービスを、toC領域では中国の先行サービスを参考にしつつ、ゲームやコミュニティなどエンタメ分野での新サービス展開を検討していると述べています。

「DeNA×AI Day」で公演を行う南場氏

現在のtoC向け生成AIアプリケーション市場では、中国のByteDance社が大きな存在感を示しており、ByteDanceグループのアプリのうち実に6つが、a16zが選出したtoC向け生成AIアプリTop 100にランクインしています。旅行計画、恋愛相談など日常生活をアシストしてくれるチャットボットを作成できる「Doubao」をはじめとして、画像・動画編集、AI家庭教師など、多岐にわたる分野でサービスを展開しています(過去のニュースレター)。

ByteDance社が展開するDoubaoの英語版アプリ「Cici」の説明(a16z

また南場会長は、今回DeNA社が実施する「AIシフト」について、同社が2021年に完了した「クラウドシフト」を引き合いに出して説明しました。

当時、DeNAの敏腕エンジニアがクラウドの半分のコストでオンプレシステムを運営していたものの、同社は勇気を持って全面的な移行を決断。結果として、エンジニアが突発的な障害対応に追われなくなり、より創造的な仕事にフォーカスできるようになったと言います。その上で、クラウドシフトはエンジニアに恩恵を与えたが、今回のAIシフトは同様の恩恵を全社員に対してもたらすだろうと展望を語っています。

先週、ソフトバンクグループが78兆円規模の投資計画への参画を表明し、アメリカ政府やOpenAIとの連携を強化してく方針を示したことが話題を呼びましたが、DeNAもまた大胆な組織再編に着手しようとしています。両社による「攻めの一手」が、国内AI市場に新たな活況をもたらすことが期待されます。

2. SNSで話題のAIツールをピックアップ!

  • カリフォルニア発スタートアップZyphra社がリリースし、Xで大きな話題を呼んだ最先端音声合成モデル「Zonos」が試せる公式プレイグラウンド

  • ElevenLabsやFish Speech v1.5といった最先端音声合成AIに匹敵する生成品質を誇り、ボイスクローンにも対応

  • 日本語にも対応。ただし難しい漢字は読み間違えることも多い

  • 無料でも1ヶ月あたり100分の音声を合成可能。モデルはオープンソース (Apache 2.0) で公開されている

  • 検索エンジンAI「Perplexity」に膨大な文献を深く調査して回答してくれる「Deep Research」機能が登場

  • しかし2月16日現在ではハルシネーションが非常に多く、SNS上でも不満の声が多い

  • 少ない文献でも良い回答が得られそうなケースでは、ChatGPT標準の検索機能やGenspark、膨大な文献をもとにレポート化して欲しいときは、FeloやOpenAI Deep Researchの利用がおすすめ

  • Deep Research機能は無料ユーザーでも一日5回使用可能

3.  🐬NoLangに新たなボイスが追加されています!おすすめボイスを5つ紹介

NoLangでは昨年末から今年にかけて新たなボイスが追加され、総ボイスが32となりました。今回は、新たに追加されたボイスを中心に、特におすすめの音声を5つピックアップしてご紹介します!

なお、実際にボイスを聴いてみたい方は、NoLangの「動画設定」→「長さ・音声」からサンプルボイスを試聴することができます。

(1) Anneli(女性、感情豊か、アニメ声)

先月末のアップデートで追加された感情豊かな音声合成モデル「AivisSpeech」のボイスです。AI音声とは思えないほど感情豊かに喋ってくれますので、まだ試していない方は、是非一度使ってみてください!

(2) にせ(男性、若い声)

同じくAivisSpeechのボイスの一つで、若い男性が丁寧に話しかけているような印象を与えてくれます。解説動画、チュートリアル動画で使用するのがおすすめです。

(3) decoprokun(女性、感情豊か、アニメ声)

Anneliと同様に感情豊かなアニメ声ですが、より芯のある太い声が特徴となっています。

(4) 波音リツ(女性、落ち着いた声)

落ち着いたアナウンサーのような声質です。ビジネス向けのコンテンツ制作時に特に重宝するボイスです。

(5) 青山龍星(男性、低く落ち着いた声)

YouTubeやTikTokなどでよく耳にする人気のボイスです。落ち着いた低音ボイスで聞き心地が良く、幅広い用途で活用できます。

動画のテーマに合ったボイスを選択するだけで、驚くほど印象が良くなります。気になったボイスがあった方は是非試してみてください!

解説は以上となります。以前のニュースレターにてNoLang2.0についての詳細な解説を行っているので、NoLangを使いこなしたい方は、是非こちらもご覧ください!

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

  • どんなWebページでも3秒で解説動画に変換する「🐬NoLang

  • ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)

  • 生成AIアップスケーラー「🥩カクダイV1

といったプロダクトをリリースしてまいりました。

またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!