- Newsletter from Mavericks
- Posts
- Google発のGPT-4V越えAIモデル、生成AI時代に最重要な「データの質」を向上させる注目サービスなど
Google発のGPT-4V越えAIモデル、生成AI時代に最重要な「データの質」を向上させる注目サービスなど
この度は、sayhi2.ai Newsletterをご覧いただきありがとうございます!
生成AI分野の発展は目覚ましく、この数週間だけで、GPT-4V越えのAIモデル「Gemini」の発表やキャラクターの静止画を自由自在に動かせる技術「Magic Animate」の公開など、様々な革新的な出来事がありました。
特にインパクトの大きかったニュースを振り返った後、注目ツールや、運営チーム推薦のAIを厳選してご紹介します!
📚 目次
1. 直近のビッグニュースTop 3
① Google がGPT-4V越えのAIモデルGeminiを発表
② キャラクターの静止画を自由自在に動かす技術の登場
③ 画像生成速度がついに100fpsに
2. SNSで話題のAIツールをピックアップ!
① KREA
② Leonardo AI
1. 直近のビッグニュースTop 3
① Google がGPT-4V越えのAIモデルGeminiを発表
まずは以下の3点を抑えておきましょう。
1. マルチモーダル
「テキスト・画像・動画・音声」を入力、「テキスト・画像」を出力することができます。特に動画を入力できる点がGPT-4と異なりユニークです。
2. GPT-4を性能で凌駕
こちらの記事にある通り、マルチモーダルなタスクのほとんどにおいて、GPT-4を上回った上、言語理解のタスクでは、人間の専門家をも上回っています。
3. 3つのサイズのモデルを提供
Geminiは、GPT-4を上回った最高性能のUltra、中間サイズのPro、モバイルデバイス向けのNanoからなります。Ultraは2024年公開予定ですが、ProはチャットボットAIのBardで既に使用可能です。
デモ動画が衝撃的なので、視聴をお勧めします。ただし、演出要素が入っている点に注意してください。(どこまでが演出なのかが気になる方は、こちらのnoteをご覧ください)
確かに、GPT-4を上回る性能を持つGeminiの発表は衝撃的でしたが、圧勝ではありませんでした。OpenAIが保有している次世代モデルの方が遥かに性能が高いと予想されており、今後の動きに大きな注目が集まります。
② キャラクターの静止画を自由自在に動かす技術の登場
11月30日に「Animate Anyone」が発表され、その後すぐに、Tiktokを運営するByteDanceによって「Magic Animate」と呼ばれる同様の技術が発表されました。
アニメーション生成では、フレーム間で画像が不自然に変化してしまう「チラツキ」が最大の問題点でした。今回発表された技術はこれを克服しており、顔や服装が終始一貫している上、動きも滑らかです。
「Magic Animate」に関しては、高性能なGPUでも生成に5分要するとのことですが、コードが公開されており、今後の更なる技術進化に期待です!
キャラクターや人物の画像を自由自在にアニメーション化できる「Animate Anyone」
破綻が全くありません…!
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
5:35 AM • Nov 30, 2023
③ 画像生成速度がついに100fpsに
画像生成の速度が大幅に向上しており、ついに0.01秒に1回のペースで画像を生成できるようになりました!2022年8月にStable Diffusionが公開されてから、まだ1年半も経っていません。当時は、1枚画像を生成するのに10秒以上かかっていたことを考えると、1000倍以上高速になっています。
使用されている技術は、画像生成モデル Stable Diffusion を開発する Stability AI社によって公開された 「SDXL Turbo」です。
高速な画像生成を体験してみたい方は、後ほど紹介するリアルタイムお絵描きツールを是非触ってみてください!
StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました!!
sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます!多分これが一番速いと思います
— あき先生 / Aki (@cumulo_autumn)
8:01 AM • Dec 6, 2023
2. SNSで話題のAIツールをピックアップ!
SNSで話題になっているAIツールの中から、特におすすめできるものをピックアップしました。後ほど見返すかもしれないという方は sayhi2.ai でブックマークしておきましょう!
※ログイン後、左上の画像内、右上の赤いボタンを押すことで、ブックマークが可能
今最も話題のリアルタイムお絵描きツール
使いやすさ抜群
PCカメラの映像からリアルタイムで画像生成できるなど、機能が豊富
昨日ベータ版が公開され、無料かつ、サインアップするだけで即使用可能に
Leonardo AI (https://sayhi2.ai/product/leonardo_ai)
話題のリアルタイムお絵描きツールの一つ
生成した画像をワンクリックで入力画像にできる機能が優秀
無料なのはもちろん、サインアップするだけで即使用可能
サインアップ後は、横のタブからLiveCanvasをクリックして始められる
3. 編集部が厳選!おすすめAIツール
私たちが運営する sayhi2.ai では、市場評価に基づき、各ツールをスコアリングしています。世界で人気を博しているスコアの高いツールの中から、特におすすめできるものを厳選してご紹介します!
Hatchful | スコア: 4.7 / 5.0
カナダ発の大手Eコマース企業Shopifyが運営する、無料のロゴ作成ツールです。ビジネス領域・スタイル・用途などを豊富な選択肢の中から選んでいくと、僅か5ステップ程度で質の高いロゴが生成されます。マイナーですが、試す価値ありです!
Perplexity | スコア: 5.0 / 5.0
ChatGPTの進化が目覚ましく影が薄まっていますが、依然として有用な対話型の検索エンジンです。おすすめは Chrome Extensionで、どんなWebページの内容も、ワンクリックで要約してくれるため、非常に強力です!
4. 最近、資金調達を行なった注目企業・ツール
今までとは視点を変え、最近資金調達を行なった注目の企業・ツールを見ていきましょう!
Cleanlab | 資金調達額: $25M (10月10日)
ChatGPTをはじめとする、強力なAIモデルを誰でも使用できるようになった生成AI時代において、保有する「データの質」は競争優位性を獲得するための非常に重要な要素です。
Cleanlab社は、自社で保有する学習データの誤り検出・自動修正を行えるノーコードプラットフォームを提供しており、こういった企業ニーズを的確に捉えています。
既に、オープンソースプロジェクトで1万人以上のユーザを獲得している上、Fortune 500企業や政府機関を含めた100社以上の顧客にクラウド製品を提供しており急成長しています。今後も注目の企業です。
Objective | 資金調達額: $13M (10月18日)
GAFAM出身の機械学習のスペシャリストたちによって設立された、検索アプリをローコードで構築できるプラットフォームを提供する会社です。
Objectiveの検索アルゴリズムは、我々がGoogle検索で馴染み深い「キーワードベースの検索」とは異なり、新しい「マルチモーダル検索」となっています。
つまり、テキスト・画像・動画・音声を入出力できる上に、それらを組み合わせた検索を行うことができます。加えて文脈に基づいた検索も行えるようで、非常に高い技術力を持っているスタートアップと言えます。
生成AIの発展とともに、これからの検索体験をどのように変革してくれるのか、非常に楽しみです。
さいごに
最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。
一番ためになったのは? |
運営元の紹介
私たちは sayhi2.ai というサイトを運営しています。5000以上のAIツールを掲載しており、様々なAIツールを調査、深掘りすることができます。ぜひお試しください!
文章や目的を入力するだけでツールを探せる
実際にツールを試さずとも、チャットボットが答えてくれる
厳選された5,000以上のAIツールから欲しいツールを見つけられる
独自のスコアリングアルゴリズムによるAIプロダクトの人気度の推定
またXでは、AIツールや関連するニュース・トレンドに関して、一段踏み込んだ考察を交えながら日々情報発信しています。是非こちらもフォローしてみてください!
サムアルトマン、Microsoft が OpenAI の取締役会に口出しできない理由
今回の一連の騒動の背景にある、創業者・出資者・取締役会の関係性について考察しました。解説します。
最も重要な結論:
①営利法人 OpenAI LP に籍をおく サム・グレッグ・イリヤの3名は親会社兼 非営利法人である OpenAI… twitter.com/i/web/status/1…
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
10:09 AM • Nov 19, 2023