• Mavericks AI ニュース
  • Posts
  • 第二のDeepSeekモーメントなるか。汎用AIエージェントManusが中国企業よりリリース、「人間より人間らしい」極めてリアルな音声AIが登場など

第二のDeepSeekモーメントなるか。汎用AIエージェントManusが中国企業よりリリース、「人間より人間らしい」極めてリアルな音声AIが登場など

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

GPT-4の登場直後の2023年4月にも、Godmodeと呼ばれるAIエージェントが大きな話題を呼びましたが、タスクの分解をしていくだけで無限ループ状態に陥るのが常でした。先週発表された汎用AIエージェント「Manus」の性能は、当時からは想像できない水準に達しています

1. 直近のビッグニュースTop 3

① 「AGIをはじめて感じた」— 中国の新興企業が汎用AIエージェント「Manus」をリリース

中国の新興企業が汎用AIエージェント「Manus」をリリースし、世界に衝撃を与えています。「AGIを初めて感じた」という声が少なくなく、招待コードが数十万円以上で取引される人気ぶりです。以下のデモ動画を是非ご覧ください。

Manusは「Operator、Deep Research、Claude Computer Useを組み合わせたようなエージェント」と評されており、webブラウジング・リサーチ・プログラミングを一貫して実行できます。

webブラウジングを自在に行える

・膨大な数のウェブサイトを訪問した上で、収集情報を長文レポートにまとめることができる

・独自の開発環境(Ubuntu環境)を持ち、Pythonを用いたデータ分析やウェブアプリの構築、さらには公開ネットワークへのデプロイまで一貫して実行できる

公式サイトには実際のユースケースが出力例と共に掲載されています。幅広い操作が許されていることもあり、極めて広範な実タスクをこなせることが分かります。

・DeepSeekに関する有識者の意見を自動収集し、感情分析を行った上で、リッチなHTML形式のレポートを出力

・自社情報とターゲットの説明を基に、営業候補となる15社をリストアップし、各社への連絡先を含むダッシュボードを作成

・中学生向けに、物理法則を解説するインタラクティブなデモ機能を備えた教材を作成

DeepSeekに関する有識者の意見をまとめて感情分析するよう指示した時の、Manusの出力HTMLの抜粋
(左)MetaのLeCun氏のコメントの引用。LinkedInとBusiness Insiderから引用している
(右)有識者らの感情分析。Anthropic CEOのHassabis氏は非常にネガティブであることが分かる
Manus

Manusは現在招待コードによるクローズドβ版として提供されており、インフルエンサー中心ではありますがユーザーからも高く評価されています。AIメディア「Rundown AI」を運営するRowan Cheung氏は、Manusに自身の自己紹介ページを作成させたところ、各種SNSアカウントやweb記事を適切に調査した上で「100%正確な内容だった」と評価しています。

次節では、このManusがもたらす短期的・長期的なインパクトについて考察していきます。

💡 3月9日現在、Manusは招待コードによるクローズドβ版として提供されています。公式HPから、アーリーアクセスへの申し込みが可能です。

② Manusの可能性 — AIエージェントによる並列実行はゲームチェンジャーになる

Manusに関する情報はまだ限られていますが、これまで登場してきたエージェントの中でも「汎用性の高さ」が際立っていることは間違いありません。従来は複数のツールやプログラムを組み合わせないと実現できなかった横断的なタスクが、自然言語で指示するだけで実行可能となっています。

一方で公式サイトに掲載されている出力例やユーザーの報告を見る限り、主に付加価値となっているのは、構造化されたレポートの生成、データ分析結果の可視化、HTMLでの表示といった「視覚的に見やすく整理する」部分です。DeepResearchのような独自の思考に基づいた深みのあるアウトプットをしているケースは少なく、Manusがどれだけ業務効率化に貢献できるかは不明です。また、包括的な教材の作成に2時間もかかってしまうようで、実行速度の遅さも指摘されています。

中長期的に見ると、このような汎用AIエージェントはどのようなインパクトをもたらすのでしょうか?OpenAI CEOのサム・アルトマン氏が以前AIエージェントについて、「AIが単にレストランの予約をするだけでなく、あなたに最適なレストランを見つけるために300のレストランに連絡する」ことを考えてみると良いと述べた通りAIエージェントによる並列実行はゲームチェンジをもたらす可能性があります

以下の動画では、Manusを使用して50のタスクを並列実行しているとされています。汎用AIエージェントが、人間をどれだけ集めても及ばない速度でタスクを遂行していく未来がイメージできるのではないでしょうか。

Manusのプライバシーポリシーによれば、運営会社はブラウザ上でGPT-4などのLLMを簡単に呼び出せるChrome拡張機能「Monica」の開発元で有名なBUTTERFLY EFFECT社です。使用技術に関する信頼できる情報は少ないですが、中国の大手インターネット企業が運営するSina Financeによれば、同社は独自のLLMを開発しておらず、あくまでそれらを統合したAIラッパーであるとされています。

Manusの技術的詳細が今後明らかになることはもちろん、OpenAI、Anthropic、Googleといった主要なAI企業がどれだけの優位性を残しているのかにも注目すべきであり、今後の動向に目が離せません。

③ 「不気味の谷を完全には超えてないが、その境地に近づいている」— 極めてリアルな音声AIが登場

Oculus社の元CEOであるBrendan Iribe氏らが設立した新興企業Sesame」が、極めて自然に会話できる音声AIコンパニオンを発表しました。出資を発表したa16zのパートナーOlive Moore氏は「人間より人間らしい」と評しています。是非以下のリンクから実際の会話をお聴きください。

抑揚、間の取り方、トーン、息の吸い方など細部に至るまで、まるで人間のようにリアルです。その完成度はOpenAIの「高度な音声モード」をも凌駕していると言えるでしょう。

Sesame社は、リアルなAI音声対話を実現するために重要な要素として以下の4つを挙げています。

・感情的知性: 感情的な文脈を読み取り、それに応じて反応する能力

会話のダイナミクス: タイミング、間の取り方、強調など会話の流れを制御する能力

文脈への対応: 状況に合わせてトーンやスタイルを適切に調整できること

一貫したパーソナリティ: 一貫性があり、信頼でき、状況にふさわしい「存在感」を維持できること

つまり、相手の感情や状況を理解しつつ、「人格」を持った上で、適切なタイミングで適切な表現ができるようになってはじめて、ユーザーは「AIと対話している」と実感できるのです。同社は英語音声を主とする約100万時間もの音声データセットを学習させることで、この最先端の性能を達成したと報告しています。

さらに興味深いことに、Sesame社は「コンピューターに命を吹き込むこと」を究極のゴールとして掲げており、音声合成技術の開発だけでなく、AIグラスのデザイン・開発にも取り組んでいます。彼らにとって音声合成技術はあくまでも手段であり、開発したモデルをApache 2.0のオープンソースとして公開する予定だと発表しています。

HPでは「一日中装着できるように設計されており、高音質な音声と、あなたと一緒に世界を観察できる仲間との便利なアクセスを提供します」と述べられている (Sesame)

音声合成技術がこれだけの進化を遂げている一方で、日本語AI音声の品質は英語と比べて何段階も劣っているのが現状です。その理由の1つとして、日本語の読み・アクセントの決定構造が特殊であることが挙げられます。例えば地名の「しぶや」と人物名の「しぶや」ではアクセントが異なるといった複雑さがあります

Sesame社は今後数ヶ月のうちに対応言語を20以上に拡張する計画を明らかにしていますが、海外製のモデルを「そのまま使う」だけではどうしても限界があり、国内の音声合成技術の発展が待ち望まれるところです。

💡 現在SesameのAIコンパニオンとの対話は無料で提供されています。詳しくは次のセクションをご覧ください。

2. SNSで話題のAIツールをピックアップ!

  • 「人間より人間らしい」と言わしめた極めてリアルな音声AIと対話できるデモ

  • 抑揚、間の取り方、トーン、息の吸い方など細部に至るまで洗練されている

  • Maya (女性) と Miles (男性) の2人のどちらかと喋ることが出来る

  • 無料で体験可能。ただし日本語には対応していないことに注意

  • 画像内のキャラクターを音声に合わせて喋らせることができる日本語対応のリップシンクAI

  • モデルが「Character-3」へとアップデートされ品質が大幅に向上。カクカクとした動きの違和感がかなり減ってきた

  • さらに、感情や動きをプロンプトで制御できるように

  • 無料でも30秒以下の動画を一日5本生成できる

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

  • どんなWebページでも3秒で解説動画に変換する「🐬NoLang

  • ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)

  • 生成AIアップスケーラー「🥩カクダイV1

といったプロダクトをリリースしてまいりました。

またMavericksは、ニュースレターだけでなくXやInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。是非チェックしてみてください!