• Mavericks AI ニュース
  • Posts
  • Claudeがスマホ指示で動画編集もパワポ操作もやってくれるように!大本命のコンピューター操作機能がついにリリース

Claudeがスマホ指示で動画編集もパワポ操作もやってくれるように!大本命のコンピューター操作機能がついにリリース

他にも...OpenAIが動画生成AI「Sora」アプリおよびAPIのサービス終了を発表

NoLang運営チームよりお届けしている、Mavericks AIニュースをご覧いただきありがとうございます!

1. 直近のビッグニュースTop 3

① Claudeがあらゆるコンピューター操作を行えるように!PowerPointも動画編集アプリも

米国時間3月23日、Anthropic社がClaudeアプリをアップデートし、コンピューター操作機能を公開しました。以前からClaude in Chromeなどのツールを利用すれば、Webブラウザを操作させることは可能でしたが、今回のアップデートにより、PowerPointやSlackといったデスクトップアプリも含めた、あらゆるPC操作をClaudeに委ねることが可能になりました。

以下の投稿では、動画編集ソフト「Adobe Premiere Pro」にて、Claudeが正確に操作できている様子を確認できます。PCの操作精度は実用水準にかなり近づいてきた印象です。

今回興味深いのは、Anthropic社が単に「AIがあらゆるPC操作をこなせるようになった」という技術的な進歩に焦点を当てるのではなく、「スマホから指示を送ってAIにタスクを完了してもらえる」という体験を強く打ち出している点です。

以下の公式デモ動画では、「(移動中で遅刻ギリギリなので)PowerPointアプリから今日の資料をダウンロードして、インビテーションに添付しておいて」といった、日常的なシーンが紹介されています。

そしてこれは単なるコンセプトムービーではなく、現在公開されている機能で十分に実現可能です。先日発表された「Dispatch」と呼ばれる機能と組み合わせることで、モバイルアプリからClaudeのセッションを起動し、外出先からでもAIにPCを操作してもらうことができます

Claude Dispatch機能を使って、NoLangのLPのスクリーンショットを撮影し、PCフォルダに保存させた例。利用するPCは起動している必要がある点に注意。

これは言わば、先に出社した同僚に、代わりにPCを操作してもらっているようなものであり、もちろんリスクとは隣り合わせです。私が実際に試した中でも、Slackの操作を依頼しているにも関わらず、なぜか別で開いていたNotionの使用権限を求められるといった、意図しない挙動が見られることがありました。また現時点では、クリックやスクロールなど1つの画面操作に約10秒程度かかるなど、速度が実利用におけるボトルネックとなっています。

Claude Codeが、制限された権限の中で定型作業を正確にこなしてくれる「秘書」のような存在だとすれば、今回のコンピューター操作機能は、より距離感の近い「同僚」に本来任せるべきではないようなタスクまで依頼してしまう感覚に近いでしょう。とはいえAIの性能進化とともに、これらの境界線は徐々に曖昧になっていくのではないでしょうか。

💡 コンピューター操作機能は、ClaudeのPro, Maxプランユーザー向けに提供されています。現時点ではmacOSのみの対応です。

② OpenAIが動画生成AI「Sora」アプリおよびAPIのサービス終了を発表

諸行無常とは言えど、あまりに早い幕引きでした。

OpenAI社が、動画生成AI「Sora」のアプリ及びAPIのサービス終了を発表しました。Soraアプリのリリースは2025年9月30日であり、わずか半年での発表となります。

OpenAI社はかつて動画生成AI領域において、間違いなくトップランナーでした。2024年2月に、一見AI生成とは分からない品質の動画を生成できる初代Soraを発表し、それまでの常識を打ち破りました。翌年9月の「Sora 2」リリース時には、物理シミュレーションの正確さや、SNS・CMで目にするようなストーリー性のある動画作品を完成させる能力が高く評価され、動画生成AIにおける「GPT-3.5モーメント」とも呼ばれました。

また同モデルを搭載したSoraアプリは「AI生成動画のみが流れてくる全く新しいSNS」として話題を呼び、リリースから5日で100万ダウンロードを達成したほか、ディズニー社との提携により、200以上のディズニーキャラクターを活用してユーザーがショート動画を生成・共有できるようになるとされていました。

しかしSoraは、「収益性」「リスク」「競合優位性」の3つの観点から、非常に厳しい状況に立たされていました。

まず収益面では、Soraアプリは持続的な人気を維持できず、ダウンロード数は今年1月時点でピーク時の約66%にまで低下していました。それでいてForbesの試算によれば、10秒の動画1本あたり約1.3ドル、1日換算で約23億円もの推論コストがかかっていたとされています。

Soraアプリの月間ダウンロード数の推移
TechCrunch

またOpenAI社は、今年後半のIPO申請に向けて準備を進めていると各社が報じていますが、Soraはその足枷となりうる問題を多数抱えていました。マリオやピカチュウなどの著作権キャラクターの濫用、マイケル・ジャクソンやキング牧師といった故人のディープフェイク動画の拡散に関して、世間から大きな批判に直面していたのです。

そしてOpenAI社の技術的優位はもうほとんど残っておらず、さらには先行者利益までじわじわと食いつぶされている現状があります。特に直近ではClaude CodeやCoworkを擁するAnthropic社の躍進が目立ち、Ramp社の調査によれば、AIを新規導入する企業の約70%がOpenAIではなくAnthropicを選択しているといいます。

AIを新規導入する企業におけるOpenAIとAnthropicのシェアの比較
Ramp

今回のサービス終了を受けて、ディズニー社との業務提携並びに出資話は事実上キャンセルになったとも報じられました。そして次節でお伝えするように、OpenAI社ではSora以外にも、かねてより計画されていた構想の見直しが相次いでいます。

③ OpenAIがアダルトモード構想を無期限停止。「選択と集中」でやむなく現実路線へ

Soraのサービス終了に続く形で、OpenAI社がかねてより計画していた「ChatGPTアダルトモード」構想の無期限停止も報じられました。

2025年12月の開始が予定されていましたが、性的AIコンテンツの社会的影響について従業員や投資家から懸念が出ていたほか、NSFW制限を緩和しつつも非同意行為や児童性的虐待のような有害シナリオは排除するといったモデレーションの設計にも苦戦していたとされています。

このようにネガティブなニュースが続く中、OpenAI社はどこに向かおうとしているのでしょうか。

同社が目指しているとされるのが「選択と集中」です。元々OpenAI社は、研究開発を拡張する形であらゆる方面へとプロダクトを展開しており、上述のSoraアプリだけでなく、ジョニー・アイブ氏と次世代AIデバイスを開発しているほか、ChatGPTを教育・Eコマース・ヘルスケア領域それぞれに特化させたサービスも展開していました。

(左)元AppleでMacBook、iPodなどのインダストリアルデザインを手がけた「伝説的なデザイナー」アイヴ氏と(右)OpenAI CEOアルトマン氏が対談する様子
OpenAI

しかし直近の状況を受けて、同社は元Instacart CEOのフィジー・シモ氏の役割を「アプリケーション部門CEO」から「AGI展開部門CEO」へと改めた上で、同氏とサム・アルトマン氏が主導する形で、コーディング支援と企業向け利用に経営資源を集中させるとされています。

OpenAIでアプリケーション部門CEOを務めるFidji Simo(フィジー・シモ)氏
(Wikipedia)

具体的には、Wall Street Journal紙が「ChatGPT」、AIコーディングツール「Codex」、AIブラウザ「Atlas」の3製品を1つのデスクトップアプリに統合し「スーパーアプリ」として提供する構想を報じています。またFinancial Times紙によれば、OpenAI社は年内に従業員数を4,500人から8,000人にまで増強し、特にサービスの企業導入・活用を支援する人材を増やすことで、企業向け事業拡大の体制構築を目指しているとのことです。

いずれにせよ、先週の一連の発表は、OpenAI社が現実路線への方針転換を迫られていることを決定づけたのではないでしょうか。IPOを控えた同社にとって、夢を追うフェーズから収益の柱を固めるフェーズへの移行は避けられなかったようです。

2. SNSで話題のAIツールをピックアップ!

  • Googleが買収したProducerAI社が運営する音楽生成AIサービス

  • Googleが先週発表した音楽生成AI「Lyria 3 Pro」も使用可能

  • ChatGPTのようなチャットインターフェースで、AIと音楽作りを進めていける点が嬉しい

  • 無料でもクレジットが付与され、試すことが可能

  • PFN社が開発する純国産フルスクラッチモデル「PlaMo」を試せる公式ウェブサイト

  • 現在提供されているのは、「PLaMo 2.2 Prime」というモデル。「gpt-oss-120b」などのトップレベルのオープンLLMに肉薄する「PLaMo 3.0 Prime」はまだ一部企業のみに公開

  • 画像アップロード機能がある一方、web検索機能はまだ未搭載

  • 現在は無料で利用可能

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは?

一番ためになったのは?

Login or Subscribe to participate in polls.

運営元の紹介

株式会社Mavericksは2023年、世界に先駆けてリアルタイム動画生成AIサービス「🐬NoLangをリリースし、現在15万超のユーザーを抱えるまでに成長してきました。法人向けの展開も行い、法人プランのユーザー数は60社を突破しています。また、大手企業との協業や独自開発案件にも着手しており、唯一性の高い価値創出が加速しています。

今後、NoLangを中核に据えながら事業をさらに成長させるべく、エンジニア・デザイナー、営業・マーケティング担当、そして全方位で学生インターンの募集を開始しています。法人営業の担当や、SNS運用などに興味のある方も、ぜひこちらのフォームより一度ご応募ください。

採用ページでは、弊社の実績、求める人物像に加え、メンバーの声をインタビュー形式で掲載しております。興味を持った方はぜひご覧ください。お問い合わせは、[email protected]にて受け付けています。https://

また、私たちはニュースレターだけでなくXInstagramにおいても、開発プロダクトに関する最新情報について積極的に発信しています。こちらも是非チェックしてみてください!