- Mavericks AI ニュース
- Posts
- OpenAI元CTO率いるラボがAIエージェントに次ぐ大発明!目・耳・口をもち、リアルタイムで割り込みもできる「Interaction Models」発表!
OpenAI元CTO率いるラボがAIエージェントに次ぐ大発明!目・耳・口をもち、リアルタイムで割り込みもできる「Interaction Models」発表!
他にも...NoLangスライド生成が大幅アップデート。SNS用図解からPPTXまで生成可能に!
NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

📚 目次
1. 直近のビッグニュースTop 3
① NoLangスライド生成が大幅アップデート。SNS用図解からPPTXまで生成可能に!
② 2027年のAIの姿が見えた。OpenAI元CTO率いるラボが「Interaction Models」を発表
③ あらゆる面倒な作業が楽になる。Android向けAI「Gemini Intelligence」が発表!
2. SNSで話題のAIツールをピックアップ!
① NoLangスライド生成
② Eleven Music
1. 直近のビッグニュースTop 3
① NoLangスライド生成が大幅アップデート。SNS用図解からPPTXまで生成可能に!
先月リリースされたNoLangスライド生成が、早くも大幅にアップデートされました!
会議の説明資料からYouTube解説動画用のスライド、Instagramリール向けの図解まで、あらゆるデザインをNoLang内で作成できるようになっています。無料で試せるチケットも配布中ですので、この機会にぜひお試しください!
今回まず注目したいのが、デザインバリエーションの拡張です。
新たに「図解モード」が導入され、縦型生成にも対応しました。フローチャートやタイムライン、組織図といった図解要素を盛り込んだスライドはもちろん、SNSで目を惹くような訴求力の高いビジュアルも、これ一つで賄えるようになっています。

もうひとつの要が、法人プラン限定で提供を開始した「独自アルゴリズムを活用したPPTX生成」機能です。スライドマスターを独自に定義することで、レイアウト崩れをほとんど起こさずにスライドが生成され、PowerPointやGoogle Slides上で自由に手直しできます。

なおNoLangでは直近、開発スピードを一段と上げており、立て続けにアップデートをお届けしています。SNS連携機能によりYouTube、Instagram、TikTokといったプラットフォームへワンクリックで投稿できるようになったほか、Live2Dアバターも一気に拡充。200体もの多種多様なキャラクターをご利用いただけるようになりました。

そして、大変お待たせいたしました。
今月末に2025年3月以来の動画編集機能の完全リニューアルを予定しています!「誰でも動画を作れる」という体験はそのままに、これまでNoLangでは作りきれなかった動画まで、自由に作成できるよう進化しますので、リリースまで今しばらくお待ちください!
💡 このたび、NoLangスライド生成を無料で試せるチケットを配布しました!詳しくは次のセクションをご覧ください。
② 2027年のAIの姿が見えた。OpenAI元CTO率いるラボが「Interaction Models」を発表
東京大学に主席で合格するほどの知能を獲得したAIに、なお足りないものは何でしょうか。
その答えは「インタラクション」であると、OpenAI元CTOのミラ・ムラティ氏率いる「Thinking Machines Lab」が、デモを交えて鮮やかに示してくれました。
今回発表されたのは、Claude Codeの延長線上から外れた、全く新しいAIモデルのカテゴリ「Interaction Models」です。以下のデモ動画でその一端は掴めますが、初見ではやや読み取りにくい部分も多いため、以下で全容を解きほぐしていきます。
新モデルについて押さえておきたいのは、次の3点です:
・目と耳と口を持つ
・従来の「ターン制」から解放されて、あなたのことを常に見ているし、聞いている。 それゆえ、途中で割り込んだり、ユーザーの様子を見て自発的に行動したりできる。
・そして見聞きしながら、検索やスライド生成といった作業まで同時並行でこなせる
これまでのAIモデルは「人間が入力→AIが出力→人間が入力」というターン制のフローを前提に動作してきました。一方で「Interaction Model」にはターンという概念がなく、AIは目と耳でリアルタイムに情報を取得しながら、いつでも発話できる態勢にあります。それゆえ、人間が喋っている途中に割り込んで発言したり、人間の声に被せる形で同時通訳をこなしたりできるのです。
発話のタイミングを自由に握れることは、モデルが「指示待ち」に留まらず、自発的に話しかけてくれることも意味します。ユーザーが画面に映った瞬間に挨拶したり、姿勢が悪くなっていることを検知して指摘したりと、気の利く挙動をしてくれます。
もう一つ押さえておきたいのが、入出力やツール利用を全て「マルチスレッド」で同時にこなせる点です。ユーザーに口頭で説明しながらHTMLで説明用グラフを描画したり、最新の話題について振られた際に、ユーザーが喋り終わる前からweb検索を走らせることで、遅延なくシームレスな応答を実現したりする様子が公開されています。
個人的には、OpenAIが2024年9月に推論モデル「o1」を披露して以来の、AIモデル進化における新しいパラダイムだと捉えています。Thinking Machines Labによれば、こうした「インタラクション」を司る能力はスケーリング則と共に伸びていくとのことで、来年にかけての動向に目が離せません。
既存のAIモデルの多くは、(中略)インタラクティブ性を後付けしています。しかし、「苦い教訓(The Bitter Lesson)」が示すように、これらの手作りのシステムは、一般的な能力の進歩によって追い抜かれていくでしょう。
インタラクティブ性が知能とともにスケールするためには、それがモデル自体の一部でなければなりません。 このアプローチにより、モデルをスケールアップさせることで、モデルはより賢くなると同時に、より優れた協調相手になります。
💡 Thinking Machines Labは今回の研究成果について、今後数ヶ月でフィードバック収集のために限定的にリサーチプレビューを公開するほか、今年後半により広くリリース予定だと述べています。
③ あらゆる面倒な作業が楽になる。Android向けAI「Gemini Intelligence」が発表!
今週は、Google社の年次開発者会議「Google I/O 2026」がいよいよ開催されます。
それに先駆ける形で、Androidデバイス向けのAI機能群「Gemini Intelligence」が発表されました。コンサートチケットの購入や到着予定時刻の計算、お気に入りの服のセール通知まで、アプリ上での面倒な作業を、AIがユーザーに代わってこなしてくれます。
Gemini Intelligenceの強みは、Android OSの基盤に直接統合されており、アプリを横断した操作も安全にこなせる点でしょう。
似たような試みは「Apple Intelligence」も見せているものの、こちらは現状「使いものにならない」と酷評されているのが実情です。Google社が「実用的」な体験を届けられるかどうかに、注目が集まります。
また、自分専用のミニアプリを作れる「カスタムウィジェット」機能もユニークです。例えば作り置きを習慣にしている人なら、「高タンパクな作り置きレシピを毎週3つ提案して」と頼むだけ。専用ダッシュボードが自動で構築され、そのままホーム画面に追加してサイズも自由に調整できるようになります。
さらに同日、Google DeepMindからも、ありそうでなかった新しい取り組みが発表されました。AIとの連携機能を備えたカーソルポインターの開発です。以下のデモ動画で紹介されているように、マウス操作と音声入力を組み合わせて指示するだけで、AIが自動でPCを操作してくれます。
テキスト入力に頼ることなく、マウスで対象物を指しながら「この服をノートアプリにメモしておいて」「この文を要約して」と頼むことができます。まるで隣にいる人に作業を依頼するかのような、自然な感覚で扱えるのが魅力です。
昨年のGoogle I/Oでは、新たな音声合成・動画生成モデルの公開に加え、GmailをはじめとするGoogle各種製品へのGemini統合が一挙に発表され、AI分野におけるGoogle社の地力を世に知らしめました。今年はどのようなインパクトを残してくれるのか、期待が高まるばかりです。
2. SNSで話題のAIツールをピックアップ!
NoLangスライド生成 (https://no-lang.com/slide/template)
「日本らしいスライド」を作れるNoLangスライド生成が大幅アップデート!
新たに「図解モード」が導入され、縦型デザインの生成にも対応。図解要素を盛り込んだスライドはもちろん、SNS投稿用のビジュアルも作成可能に
生成したスライドは、一気通貫で解説動画に変換することができる
現在無料でも、スライド生成を試すことが可能

Eleven Music (https://elevenlabs.io/music)
音声合成AIで有名なElevenLabsだが、音楽生成の品質も非常に高い
生成音楽に対して、スタイルを足し引きすることで微調整できる機能がユニーク
ただし日本語の読み上げはまだやや不安定なため、インスト曲や英語歌詞のBGM作成での利用を推奨。それ以外では、Sunoの利用をおすすめ
無料でも十分な回数の音楽を生成可能

さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは?一番ためになったのは? |
運営元の紹介
株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLang」をリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。
今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。
採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://


