- Newsletter from Mavericks
- Posts
- AIによる音楽生成に大革命、ChatGPTとGeminiの比較論文を解説!など
AIによる音楽生成に大革命、ChatGPTとGeminiの比較論文を解説!など
sayhi2.ai Newsletterをご覧いただきありがとうございます!
今回も、特にインパクトの大きかったニュースを振り返った後、注目ツールや、運営チーム推薦のAIを厳選してご紹介します!
📚 目次
1. 直近のビッグニュースTop 3
① AIによる音楽生成に大革命
② ChatGPTとGeminiの性能を比較した論文が発表
③ キャスターが全員AIのニュースメディアが誕生
2. SNSで話題のAIツールをピックアップ!
① Suno AI
② Vercel V0
4. 最近、資金調達を行なった注目企業・ツール
① Harvey
② Mistral AI
1. 直近のビッグニュースTop 3
① AIによる音楽生成に大革命
歌詞から曲を生成するSuno AIが凄すぎるとSNS上で大きな話題になりました。生成される曲のクオリティが本当に高く、自信を持っておすすめできるツールなので、騙されたと思って、是非一度聴いてみてください!使い方は次のセクションで説明しています。
歌詞も曲も歌もAI。ChatGPTで歌詞を、Suno AIでそれ以外を作成したけどすごい。$8/月で商用利用も出来る。これで作詞家、作曲家がいなくなるとは思わないが、AIと曲を作る人が当たり前に出てくるのは間違いない。今使いこなす必要はないけど、音楽に関わるならとりあえず一曲作る体験をしておくべき
— 熊澤秀道 | テクノロジーを理解しやすく (@noumi0k)
12:43 AM • Dec 13, 2023
ちなみに、Suno AIがここまで著しく盛り上がったのは日本だけです。Googleトレンドを使って検索数の推移を調べてみましたが、一目瞭然ですね。
日本における直近6ヶ月のSuno AI の検索数の推移(相対値)
アメリカにおける直近6ヶ月のSuno AI の検索数の推移(相対値)
海外AIツールの多くは、日本語の音声合成を苦手としています。Suno AIはその常識を覆したため、ここまで大きな反響を呼んだと考えられます。
他にも、音楽生成に関する興味深い研究がいくつか見られました。どちらも5秒聴くだけで凄さが分かりますので、是非チェックしてみてください!
Amphion
歌声の変換が行え、Taylor Swiftを中国語で歌わせられることが話題となった。
ピアノの音から、それに合わせてギターやドラムの音を作り出すといったように、ある音楽から別パートの音楽を作成できるモデル。
② ChatGPTとGeminiの性能を比較した論文が発表
Googleによって今月6日に発表されたAIモデルGemini Pro (3サイズのうち真ん中のモデル)と、GPT-3.5の性能比較を行った論文が発表されています。
結論、抑えておくべきは以下の2点です。
1. Gemini ProとGPT-3.5はほぼ同性能で、どちらが優れているかはタスクによってケースバイケース
2. Geminiは、「入力に”OpenAI”が含まれている」「回答に自信がない」など様々な理由で回答をブロックすることがあるので、要注意
より詳しく知りたい方は、以下のポストをチェックしてみてください。
GeminiとChatGPTどっちがいい?に回答する論文がCarnegie Mellon大学の研究者らにより発表
6つのタスク全てにおいて「Gemini ProはGPT3.5に僅かに劣る」結果でした
ただし著者が忠告する通り、この結果を安直に受け入れてはいけません。なぜでしょうか?
Gemini APIの使用を検討している人必見です twitter.com/i/web/status/1…
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
8:52 AM • Dec 20, 2023
③ キャスターが全員AIのニュースメディアが誕生
「百聞は一見にしかず」ですので、まずは下記の動画をご覧ください。こちらの「Channel 1」というニュース番組に出現するキャスターのアバターや音声は全てAIによって作成されています。
【キャスターが全員AIのニュースメディアが誕生】
音声は全て人工的に生成されたもので、
キャスターについては、実在の人物をもとに生成された「デジタルダブル」と完全に一から生成されたアバターの両方が在籍しているようです
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
4:48 AM • Dec 13, 2023
表情・身振り手振り・音声など全てが自然であり、いよいよAIかどうかを見分けることが不可能になってきました。冒頭に出現する3人のキャスターは、全て実在の人物の動画をもとに作成された「デジタルダブル」だと思われます。
AIキャスターが特に優れているのは、簡単に話す言語を変えられる点です。CNNのニュースを日本語かつリアルタイムで聞けるようになったら、と思うと大きな可能性を感じますね。
AIキャスターの威力は、こちらの動画を見れば一目瞭然です。
このように一瞬で、話す言語を変えることができます。
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
5:14 AM • Dec 13, 2023
2. SNSで話題のAIツールをピックアップ!
SNSで話題になっているAIツールの中から、特におすすめできるものをピックアップしました。後ほど見返すかもしれないという方は sayhi2.ai でブックマークしておきましょう!
※ログイン後、左上の画像内、右上の赤いボタンを押すことで、ブックマークが可能
Suno AI (https://sayhi2.ai/ja/product/suno_ai)
歌詞から高品質な曲を生成できるツール。高度はテクニックは一切不要
歌詞・ミュージックスタイル・タイトルを指定すると、数十秒程度で音楽が生成される。歌詞は、ChatGPTに生成させるのがおすすめ
無料かつ、サインアップするだけで即使用可能
(Microsoft Copilotユーザーの方向け)プラグインの導入が開始されており、こちらも要チェック
Vercel V0 (https://sayhi2.ai/ja/product/v0_dev)
有名WebホスティングサービスVercelが提供する、テキストからWebデザインを生成できるツール
例:「提出ボタン付きのお問合せフォームを作成して」
生成時に画像も追加することができ、色合いや配置などを大雑把に指定できる
生成されたデザインに対して、「見出しを1サイズ大きくして」「背景の色を変えて」など、テキストで指示して変更をお願いすることも可能
生成時間は、30秒〜1分程度
無料かつ、サインアップするだけで即使用可能
3. 編集部が厳選!おすすめAIツール
私たちが運営する sayhi2.ai では、市場評価に基づき、各ツールをスコアリングしています。世界で人気を博しているスコアの高いツールの中から、特におすすめできるものを厳選してご紹介します!
Poe | スコア: 4.6 / 5.0 (https://sayhi2.ai/ja/product/poe_com)
ChatGPT, Gemini, Stable Diffusion など今話題のAIを一気に試せるAIツール。Q&AプラットフォームのQuoraによって開発
スマホアプリも出ていることが非常に魅力的。いつでも気軽に生成AIを試すことができます!
無料かつ、サインアップするだけで即使用可能
4. 最近、資金調達を行なった注目企業・ツール
今までとは視点を変え、最近資金調達を行なった注目の企業・ツールを見ていきましょう!
Harvey | 資金調達額: $80M (12月19日)
Meta AIの研究者と弁護士によって共同設立された、契約書のレビューや法的文書の書き換えといったタスクを行う弁護士をサポートするLLMを提供する企業です。
例えば「このリース契約の条項がカリフォルニア州の法律に違反しているかどうか教えてください。もし違反している場合、それが違反しないように書き換えてください。」といったタスクをこなすことができます。
リーガル領域へのLLM適用では「データプライバシー」「ハルシネーション」の2つが大きな問題となります。データプライバシーについて、訴訟文書にはデリケートな情報が数多く含まれます。ユーザーデータを匿名化し、所定の期間後にデータを削除、要求があればいつでもデータを削除、といった徹底的な対策をとっているとのことです。
Harveyのハルシネーションへの具体的な対処法について情報を得ることはできませんでしたが、引用文献の明示が最も重要だと考えられます。
Mistral AI | 資金調達額: $414M (12月10日)
DeepMindとMetaのOBにより、7ヶ月前に共同設立された企業で、欧州発のOpenAIの競合として知られています。
Mixtralが最も力を入れているのが、オープンな言語モデルの開発です。資金調達直後に、GPT-3.5相当のオープンLLMであるLLaMA 70Bよりも高性能な上、6倍高速なLLM Mixtral 8x7Bを公開しました。
画像生成分野では、オープンモデルの Stable Diffusionやその派生系が存在感を占めています。LLM開発においても、オープンモデルの成長速度はクローズドモデルを凌駕するとも言われている一方、モデルのファインチューニングで成果を得るためには莫大な計算資源が必要であり、個人が開発コミュニティに参入しにくいという問題点があります。この状況を打破することはできるのか、注目が集まります。
GPT-4レベルのオープンソースLLMが1年以内に誕生?
GPT3.5基準で、オープンモデルの開発はクローズドモデルと比べて6~8ヶ月遅れているが、
オープンモデルの精度は線形に向上しており、進化速度でクローズドモデルを圧倒
クローズドモデルの中でも別格なGPT4にさえ、半年~1年で追いつく計算 twitter.com/i/web/status/1…
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
8:24 AM • Dec 12, 2023
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
私たちは sayhi2.ai というサイトを運営しています。5000以上のAIツールを掲載しており、様々なAIツールを調査、深掘りすることができます。ぜひお試しください!
文章や目的を入力するだけでツールを探せる
実際にツールを試さずとも、チャットボットが答えてくれる
厳選された5,000以上のAIツールから欲しいツールを見つけられる
独自のスコアリングアルゴリズムによるAIプロダクトの人気度の推定
またXでは、AIツールや関連するニュース・トレンドに関して、一段踏み込んだ考察を交えながら日々情報発信しています。是非こちらもフォローしてみてください!
サムアルトマン、Microsoft が OpenAI の取締役会に口出しできない理由
今回の一連の騒動の背景にある、創業者・出資者・取締役会の関係性について考察しました。解説します。
最も重要な結論:
①営利法人 OpenAI LP に籍をおく サム・グレッグ・イリヤの3名は親会社兼 非営利法人である OpenAI… twitter.com/i/web/status/1…
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
10:09 AM • Nov 19, 2023