Mavericks AI ニュース
Posts
デザインツールFigmaが満を持して注目機能「Figma AI」β版をリリース!Claudeにてカスタマイズされたチャットボットを制作可能になど

デザインツールFigmaが満を持して注目機能「Figma AI」β版をリリース!Claudeにてカスタマイズされたチャットボットを制作可能になど

マーベリック
June 30, 2024

Newsletter from Mavericksをご覧いただきありがとうございます！

今回は、インパクトの大きかったAIニュースや注目ツールの紹介に加えて、Perplexity CEOが語る「Googleが覇権を握れた理由と生成AIの未来」について解説します！

📚 目次

1. 直近のビッグニュースTop 3
① デザインツールFigmaが満を持して「Figma AI」β版をリリース！
② Claudeにてカスタマイズされたチャットボットを制作可能に！
③ 音楽生成AIのSunoが新機能を公開。しかしUdioと共に提訴される

2. SNSで話題のAIツールをピックアップ！
① Eightify
② Suno

3. Perplexity CEOが語る「Googleが覇権を握れた理由と生成AIの未来」

1. 直近のビッグニュースTop 3

① デザインツールFigmaが満を持して「Figma AI」β版を公開！

ChatGPT登場以後、テキストからwebアプリやモバイルアプリのUIデザインを生成するツールは無数に登場していましたが、実用的と言えるものはほとんどありませんでした。

そんな中ついに、UIデザインプラットフォーム最大手のFigma社が、「Figma AI」のβ版をリリースしました。まずは以下の1分弱のX投稿をご覧ください。さすがFigmaが提供するツールだと頷けるクオリティの高さです。

This is the best implementation of AI to design I've seen so far
— Meng To (@MengTo)
3:38 AM • Jun 27, 2024

このデモで紹介されているFigma AIの機能を振り返ってみましょう。

まず、Figma AIはテキストからUIデザインを生成する機能を備えています。やはり、生成されるデザインは洗練されており、完成度も高いです。これらは、Figmaのコンポーネントとして生成されるため、マウスを使ってGUIで簡単に編集可能です。

また複数のバリエーションが生成されるため、それらを複数人で議論しながら比較検討することも可能です。70点のアウトプットを大量生産できる生成AIの強みが存分に生かされるユースケースと言えるでしょう。

もちろん既存のFigmaの機能とも併用でき、色、図形の丸み、フォントなどを簡単に変えることができます。さらに、プロトタイプ機能では、各ボタンを押下した際にどう画面遷移するかを設定すると、そこから一瞬でインタラクティブに画面操作できるプロトタイプが完成します。

より実用的な使い方を見てみたいという方は、下記の梶谷氏のX投稿も参考になります。「airbnbのような、しかしよりミニマリスティックなホテル予約webサイトのデザイン」などと有名サイトをベースにしたデザイン生成を行ったり、フレームを指定して追加で指示を与えたり、AIに画像を追加してもらったりすることが可能です。

Figma AIのアーリーアクセス届いたので早速使ってみてるけど、「Text-to-Design」を体現しててスゴすぎる。
テキストを入れるだけで一定レベルのデザインを一発で作れてしまう。
フレームを選択して「ここをもっとこうして」という指示も可能。
レイヤー要素の名前を整理してくれるのも地味に超便利
— KAJI | 梶谷健人 / 著書「生成AI時代を勝ち抜く事業・組織のつくり方」 (@kajikent)
1:44 AM • Jun 28, 2024

前回紹介したClaudeのArtifacts機能は、webアプリ作成業務で実用的とは言えないものの、「対話形式でAIと一緒にデザインを作り上げていく」という新たな体験を提供してくれました。Figmaの画面は既にリッチであり、こうしたチャット画面を追加する余地がないのではと思わせる一方で、AIとの音声対話が可能になれば話は変わってきます。GPT-4oのデモレベルの音声対話機能がAPIで公開されれば、新しいUX革命が随所で勃発するのではないかと考えています。

なお、Figma AIはβ版として公開されており、Figmaのwebページからウェイトリストに参加することができます。機能が使用できるようになるまで待ち時間を要しますが、β版の現在は無料で使用可能です。

② Claudeにてカスタマイズされたチャットボットを制作可能に！

Anthropicが、Claudeの利便性を向上させる新たなアップデートを行いました。プロジェクト機能が大幅強化され、複数の文書を読み込ませたり、専用の「カスタム指示」を与えてチャットボットを制作できるようになりました。またチャットボットや会話履歴をチーム間で共有することも可能になります。同一プロジェクト内では登録した文書が常に参照されるため、毎回ファイルを上げ直す必要もなくなります。

You can now organize chats with Claude into shareable Projects.
Each project includes a 200K context window, so you can include relevant documents, code, and files.
— Anthropic (@AnthropicAI)
2:59 PM • Jun 25, 2024

これらはOpenAIが既にリリースしているGPTsに近い機能となりますが、チーム外への共有を想定していないという点が大きく異なります。現状はClaudeの課金ユーザーにしか提供しておらず、使用可能なシチュエーションは限定されるかもしれません。

一方で、ClaudeのArtifacts機能はチームでの作業と相性が良いという側面もあります。ChatGPTのCode Interpreterで実現可能なのは、pythonによるデータ分析やAPIの実行（ChatGPT研究所のGAS Interpreterが有名）といったバックエンド処理であり、いずれも個人作業に使用されることが多いです。それに対し、ClaudeはHTML, Javascriptを実行して、webサイト、スライド（例）、分かりやすいグラフ・図解（例）を生成するといったフロントエンド処理を実行できます。これらを活用して、デザインのイメージを話し合う、スライド・図解を交えてチャットボットとの会話を分かりやすく共有するといったチーム作業を行うことができます。

Anthropic社にまつわるニュースは他にもあります。今週、同社は日本政府に向けた資料の中で「6~18ヶ月以内に最先端のモデルが新しい能力で産業を急速に変革する」と述べました。年内公開予定とされているClaude 3.5 Opusの発表を含め、引き続き動向を注視していく必要がありそうです。

③ 音楽生成AIのSunoが新機能を公開。しかしUdioと共に提訴される

昨年12月より人気を博している音楽生成AI「Suno」、今年3月に後発でSunoレベルの楽曲を生成できると話題になった「Udio」が共に大きく進化を遂げています。

Sunoは先週、アップロードした音声を元にそれに合う楽曲を生成してくれる新機能「Audio Inputs」を無料ユーザーを含む全ユーザーに向けて公開しました。ペンなど棒状のものを持って机をリズミカルに叩いた音声をアップロードするだけで、それに似合った金管楽器の音色が甲高く鳴り響く楽曲を生成できるほか（公式X投稿）、以下のハミングから楽曲を生成するデモ動画は特に衝撃的でした。

Make a song from any sound. Coming soon 🎧
VOL-3: Humming a tune, but give it an R&B vibe
Sung by Rebecca (Suno Product Manager)
— Suno (@suno_ai_)
2:23 PM • Jun 3, 2024

他にも、Sunoは今年3月のアップデート以降楽曲の品質が大幅に向上しており、AI生成であることが素人には判別できないクオリティに到達しつつあるほか、生成できる楽曲の長さが4分にまで伸びています。

Udioに関しても、生成できる楽曲の長さが2分まで伸びているほか、「Audio Inpainting」と呼ばれる非常に興味深い機能がリリースされています。この機能では楽曲の中で選択した一部分のみを修正でき、歌詞だけを変えたり、ピアノのソロパートを追加したりといった変更を行うことができます。

Today we're delighted to launch Audio Inpainting, an innovative feature that allows you to seamlessly edit and refine your audio tracks.
With Audio Inpainting, you can select a portion of a track to re-generate based on the surrounding context. This makes it easy to edit single… x.com/i/web/status/1…
— udio (@udiomusic)
4:25 PM • May 8, 2024

このように音楽生成AIの最先端を切り拓いている両社ですが、かねてより問題視されていた著作権問題に関して大きな動きがありました。「3大レーベル」と呼ばれるアメリカのソニー・ミュージックエンタテインメント、ユニバーサル・ミュージック・グループ、ワーナー・レコードの3社が、Suno, Udioを相手に著作権侵害で訴訟を起こしたのです。

著作権で保護されている楽曲に酷似した楽曲を生成できることが権利侵害の証左として示されており、例えば、マライア・キャリーの超ロングヒット曲「恋人たちのクリスマス」に類似したアウトプットを十数曲も生成できたといいます。

両者は生成AIの訓練にどのようなデータを使用したのか明らかにしていません。原告側は、侵害された楽曲1件につき最高15万ドル（約2400万円）の損害賠償を求めており、今後の音楽生成AI業界の動向を決める重要な裁判となりそうです。

2. SNSで話題のAIツールをピックアップ！

Eightify (https://eightify.app/ja/)

YouTubeで、動画の文字起こしやタイムスタンプ付き要約を表示してくれるイチオシのAIツール。Chrome Extensionとモバイルアプリで提供
特にタイムスタンプ付きの要約は、インタビュー動画など長時間の動画から自分の知りたい情報のみを抽出したいときに大いに役立つ
無料でも一日30分の動画に対してタイムスタンプ付き要約や文字起こしを生成可能
有料版に課金すれば、時間制限はなくなり、日本語の要約も生成できる

Suno (https://suno.com/)

今最も有名な音楽生成AI。6月29日よりアップロードした音声を元にそれに合う楽曲を生成してくれる新機能が無料公開
使い方：「Upload Audio」ボタンからアップロードした楽曲に対して「Extend」ボタンを押した後、歌詞や音楽スタイルを指定して楽曲生成
他にも、楽曲をキーワード検索したり、探索する新機能が追加
無料でも、1日10曲分の生成に相当するクレジットが付与される

3. Perplexity CEOが語る「Googleが覇権を握れた理由と生成AIの未来」

科学、テクノロジー、スポーツ、政治などさまざまな分野の著名人にインタビューを行っているレックス・フリードマンのPodcastにPerplexity CEOのスリニバス氏が登場し、Perplexityの歴史・ビジョン、影響を受けた著名人などについて語っています。

その中でも、特にGoogle元CEOのラリーペイジ氏に関するエピソードに基づいた、生成AIの将来に対する言及が興味深く、私自身の意見も交えて解説していきます。

1. Google CEO「ユーザーが怠け者であっても正解に辿り着けるべき」

あまり有名ではないかもしれませんが、1998年に設立されたGoogleが検索エンジン業界の覇権を握る前、Yahooと並んで「Excite」という企業が大手検索エンジンの一角を占めていました。

1999年当時、Exciteはページランク技術で注目を集めていたGoogleの買収に興味を持っていました。そこで、Excite CEOはGoogle CEOのラリーペイジ氏と面会し、両社の製品の検索結果を並べて比較しました。

ある検索クエリに対し、Googleの検索結果の方が明らかに優れていたとき、ExciteのCEOは以下のように弁明したそうです

「このようにクエリを入力すれば、うまくいったはずだ」

一方でラリーペイジ氏は、「ユーザーが怠け者であっても正解に辿り着けるべき」という価値観を持っており、検索エンジンはユーザーが何を入力したかに関係なく、高品質の回答を与えられるべきだと考えていました。結局、検索エンジンの将来に対する見方の食い違いから、買収は成立しませんでした。その後、どちらの検索エンジンが大衆に受け入れられたかは言うまでもないでしょう。

2. Perplexity CEO「プロンプトエンジニアリングは長期的なものではない」

このエピソードを引き合いに出して、Perplexity CEOのスリニバス氏は、「プロンプトエンジニアリングは長期的なものではないと信じている」と述べています。

実際、あのChatGPTでさえ、ローンチ後半年（GPT-4公開後2ヶ月）を過ぎてからはユーザー数を伸ばせておらず、Googleと比較すると1/10にも満たないというデータがが出てきており（以前のニュースレター）、今の「プロンプトを工夫しないと良い回答が導けないインターフェース」は多くの人にとって難しすぎるという指摘は妥当でしょう。

他方、Perplexityはプロンプトエンジニアリングを一切意識させないGoogleと同じ検索インターフェースを有しています。さらに、どんなに雑なクエリを入れても、いつも整ったフォーマットで高品質な回答を繰り出します。

3. 「ユーザーが怠け者であっても正解に辿り着けるべき」はまだ実現不可能

しかし私自身、Perplexityを日常で使う機会はそこまで多くありません。回答フォーマットが固定されているにも関わらず、回答生成のプロセスがブラックボックスであるからです。リアルタイム情報やリファレンスが必要なときは引用元の信頼性を判断しやすいGoogleを使用し、そうでないときは融通の効くChatGPT, Claudeを使用します。

もう少し踏み込むと、今の生成AIモデルの性能では「ユーザーが怠け者であっても正解に辿り着ける」は実現されないと考えています。では今後どのようなブレイクスルーが必要になるのでしょうか？

LLMのハルシネーションは原理的にゼロにはなりません。このことから、個人的には、今のPerplexityがGoogleをリプレイスする未来はイメージしにくいです。

一方で、以前のGPT-4oの対話デモの衝撃を踏まえて、Perplexityの回答が画像・動画・音声を含んだマルチモーダルになり、インプット効率が格段に上がるという進歩の仕方には、大きな可能性を感じます。

そして何れにせよ、GoogleやPerplexityが大事にしている「ユーザーが怠け者であっても正解に辿り着ける」という哲学は、今後生成AI時代の覇権を握るプロダクトが満たすべき必要条件であると考えています。

元のインタビュー動画を視聴したい方は、以下のX投稿よりご覧ください。

「ユーザーが怠け者であっても正解に辿り着ける」
Googleが覇権を握る前、当時Yahooに次ぐ世界2位の検索エンジンだったExciteとの決定的な哲学の差
生成AI時代でも歴史は繰り返され得ると思っています
PerplexityのCEOが、Googleのラリーペイジ氏がExcite CEOと会った時のエピソードを語っています:… x.com/i/web/status/1…
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
3:22 AM • Jun 27, 2024

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは？

運営元の紹介

生成AI特化開発チームMavericksは、AI分野における深い知見と高度な技術力を活かし、多岐にわたるAIプロダクトの開発に取り組んでいます。これまでに、

どんなWebページでも3秒で解説動画に変換する「🐬NoLang」
ほしいAIがすぐに見つかる「👋sayhi2.ai (Say Hi to AI)」
生成AIアップスケーラー「🥩カクダイV1」

といったプロダクトをリリースしてきました。

またMavericksは、ニュースレターだけでなくXにおいても、開発プロダクトに関する最新情報、AI分野の最新動向や知見を積極的に発信しています。

特に、NoLangを普段から使用している方、生成AIの動向をより前線でキャッチアップしたい方におすすめです。是非チェックしてみてください！

【🐬NoLangがアップデート！】
動画編集機能が追加され、テキスト・画像・背景動画・音声・BGMを自由に変更できるようになりました！
✔︎少し嘘が混じってる...
✔︎画像がおかしい...
といった場合でもすぐに修正できます！
さらに使用可能なキャラ音声の数が26種類に増加。是非お試しください！
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
10:32 PM • May 12, 2024

AI分野に革命を与えた論文「Attention is All You Need」の著者を至る所で見かけるので、彼らの現在を気合い入れて調べてみましたが
8人中7人が新たに創業しており、Sakana AI, Character AI, Cohere (Command R+開発) などさすがすぎる面々でした...(残り1人もOpenAI研究者)
以下で全員見ていきます
— マーベリック|生成AI@NoLang (@sayhi2ai_jp)
9:40 AM • Apr 9, 2024