• Mavericks AI ニュース
  • Posts
  • OpenAIが新音声AIとデバイスに大きな賭け!Googleへの反撃に向けた動きが明らかに

OpenAIが新音声AIとデバイスに大きな賭け!Googleへの反撃に向けた動きが明らかに

他にも...MetaがあのAIスタートアップ「Manus」を買収!

新年明けましておめでとうございます!🐬NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① OpenAIが逆転に向けて大きく賭けた!新音声モデルとデバイスを準備中

昨年はGoogle社が凄まじい躍進を見せ、OpenAI社にとっては優位性が揺らぐ苦しい一年となりました。同社はこの状況に対する逆転の一手として、「音声」と「デバイス」に大きく賭けているようです。

1月1日、OpenAI社は過去2か月の間に複数のエンジニアリング、プロダクト、リサーチチームを統合し、2026年初頭を目処に新しい音声モデルのリリースを目指しているとThe Information紙が報じました。これは、元Apple社のデザイン責任者であるジョニー・アイブ氏と共に開発を進めている、音声ファーストの新しいAIデバイスのリリースを見据えた動きとなります。

(左)元AppleでMacBook、iPodなどのインダストリアルデザインを手がけた「伝説的なデザイナー」アイヴ氏と(右)OpenAI CEOアルトマン氏が対談する様子
OpenAI

音声AIについては、2023年9月にOpenAI社がリリースした「ボイスモード」こそ衝撃的でしたが、それ以降、会話の自然さで従来モデルを圧倒するようなモデルはまだ登場していません。

一方、今回開発中の新しい音声モデルは、より自然に聞こえ、実際の会話相手のように割り込めることに加え、私たちが話している最中でも話すことができるとされています。真の意味で、人間と対話しているような体験を目指していると言えます。

新デバイスに関しては、まだ断片的な情報しか公開されていませんが、過去にはMacBook ProやiPhoneに次ぐ「第3の主要デバイス」として設計されていると報じられました。また、中国の国営新聞「経済日報」によれば、「新デバイスはスマートペンである可能性も、身に着けて持ち運べるオーディオ機器である可能性もある」ようです。アイブ氏は今年11月、新デバイスは2年かそれより早く登場予定と示唆しています

OpenAIの新デバイスに関する報道内容まとめ
過去のニュースレター

OpenAI社以外にも、新しいAIデバイスの開発に取り組む企業は多数あります。例えばSandbar社や、スマートウォッチPebbleの生みの親であるEric Migicovsky氏はそれぞれ、「手」に話しかけられるAIリングを今年発売予定としています。音声AIデバイスの時代がいよいよ到来するのか、今年の動向に注目です。

Instagram Reel

② MetaがあのAIスタートアップ「Manus」を買収!ついに消費者向けサービスにもテコ入れ

米国時間12月29日、Meta社がAIスタートアップ「Manus」の買収を発表しました。Manusのサービス自体は昨年3月にローンチされたばかりで、4月時点での評価額は5億ドルでしたが、WSJ紙の報道によれば、今回の買収額は20億ドル(約2800億円)を超えるとされています。

Manus

ManusはGensparkと並んで有名な「汎用AIエージェント」を提供するサービスであり、スライド生成、デザイン制作、webアプリ作成、リサーチ業務など、あらゆるタスクを器用にこなしてくれる点が強みです。運営元の発表によれば、Manusは既に数百万人のユーザーを獲得しており、年間経常収益(ARR)で1億ドル超を生み出しているとのことです。

Meta社は買収後もManusを独立したサービスとして運営し続けるとしており、並行してManusのAIエージェント技術をFacebook、Instagram、WhatsAppといった主力サービスに組み込んでいく予定です。

Meta社はビッグテック間のAI競争において苦戦しており、巻き返しを図るべく昨年半ばから大規模な投資を繰り返してきました研究領域においては、昨年6月に「Meta超知能ラボ」を立ち上げ、その2ヶ月後には約2兆円で実質買収したScale AI社からAlexandr Wang氏を引き抜いています。さらには、会議内容から日常会話まであらゆる音声を録音してデータ化してくれる首かけデバイス「Limitless」の運営元も買収しました。

今回のManusの買収を経て、さらに消費者向けソフトウェアサービスにもテコ入れをしていく姿勢が明確になっています。

録音機能を持つ首かけデバイスLimitless
Limitless

Manusは昨年12月にNano Banana Proで生成したAIスライドの編集機能を公開するなど、今も驚くべきスピードで新機能をリリースし続けています。一方で、親会社のButterfly Effect社が元々北京で設立されていたこともあり(現在はシンガポールへ拠点を移動)、米国内からは懸念の声も上がっていました。こうした背景を踏まえると、今回の買収は双方にとって好ましい結果だったと言えるかもしれません。

③ 2026年のAI予測。AIと人間の関係性が根本から変化する

昨年は年初から予想されていた通り、OpenAI DeepResearch、Manusといった実用水準のAIエージェントが数えきれないほど登場し、「AIエージェント元年」となりましたが、2026年のAI業界はどう変わっていくのでしょうか?

a16zThe InformationWIREDAxiosなど各メディアが予測を出していますが、ChatGPT o1がリリースされた直後で、AIエージェントの可能性が一気に明るみになった昨年と比べると、控えめな予測が多く、バブルから実用フェーズへの移行を改めて感じます。

a16zパートナーによる2026年のAI予測。ユーザーが入力するプロンプトボックスが消滅する代わりに、AIが自ら観測・行動し、レビューを依頼するようになると述べている。
a16z

私個人の予測としては、人間に「従う立場」であったAIが、「対等な立場」になっていき、その延長で音声AIの浸透が進んでいくと考えています。

これまでAIを使って業務をこなすには、私たち人間側でプロンプトを考え、AIに成果物を出力してもらい、そこから手直しを経て、はじめて十分な品質に到達するという流れでした。プロンプトを考える0→10の作業と、最後の90→100の作業は結局人手で行う必要があり、どこまで行っても大変だったのです。

しかし現在、特にコーディング分野ではこの常識は打ち崩されつつあります。

まず0→10のフェーズでは、人間がプロンプトを考えるのではなく、より緻密な「計画」を「AIと一緒に」策定することが主流になってきています。計画を立てる際は、AIが能動的に質問してくれることから、まるで同僚と議論しているような感覚で楽に実施できるのです。

緻密に計画を立てられるようになると、タスクの処理精度が大幅に向上し、AIの出力は90点から99点まで改善されます。その結果、最後の手直しはもはや「承認」業務のみになっていき、人間の負担は大幅に減るでしょう。

そして、このようにAIとの協働形態が変化すると、タスク遂行のボトルネックが「AI性能」から「AIとのコミュニケーション」に移り変わっていき、音声AIの重要性が強く押し上げられるはずです。

例えば計画の策定にあたっては、従来よりAIとのやり取り回数が増加し、「一問一答」になりがちだったAIとのチャットが「会話」になっていくため、スムーズなコミュニケーションがより重要になります。また人間のタスクが「作業」から「承認」に移り変わっていくと、並列でAIにタスクを依頼することが当たり前になり、AI側から能動的に質問をしたり、承認を求めたりする機会が増えることから、「ちょっといいですか…?」という自然な割り込みが重要になっていきます。

もちろん音声AIの更なる普及にあたっては、AIモデル自体のさらなる性能向上が不可欠なだけに、OpenAI, Google, ElevenLabsといった音声AI開発企業からの発表が楽しみです。

2. SNSで話題のAIツールをピックアップ!

  • Nano Banana Proなどで生成した画像スライドを要素ごとに分解して、PPTXとして出力できるツール

  • 分解後は、テキストやオブジェクトの色や配置などを自由に変更できる上、パワーポイントに直接取り込めるのが便利

  • 日本の学生AIコミュニティ「Aircle」が開発

  • クレジットが付与されることから、無料でも十分利用可能

  • スライド生成機能が特に便利な、AIエージェントサービス

  • 先日新たに、既存のPPTXをテンプレートとして参照させて、スライド生成する機能が追加

  • 同様の機能は競合サービスManusにもあり、どちらもまだ実用水準ではない印象

  • 無料でも毎日100クレジット付与されるようになり、以前より試しやすくなった

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!