Mavericks AI ニュース
Posts
Google発のGPT-4V越えAIモデル、生成AI時代に最重要な「データの質」を向上させる注目サービスなど

Google発のGPT-4V越えAIモデル、生成AI時代に最重要な「データの質」を向上させる注目サービスなど

マーベリック
December 13, 2023

この度は、sayhi2.ai Newsletterをご覧いただきありがとうございます！

生成AI分野の発展は目覚ましく、この数週間だけで、GPT-4V越えのAIモデル「Gemini」の発表やキャラクターの静止画を自由自在に動かせる技術「Magic Animate」の公開など、様々な革新的な出来事がありました。

特にインパクトの大きかったニュースを振り返った後、注目ツールや、運営チーム推薦のAIを厳選してご紹介します！

📚 目次

1. 直近のビッグニュースTop 3
① Google がGPT-4V越えのAIモデルGeminiを発表
② キャラクターの静止画を自由自在に動かす技術の登場
③ 画像生成速度がついに100fpsに

2. SNSで話題のAIツールをピックアップ！
① KREA
② Leonardo AI

3. 編集部が厳選！おすすめAIツール

4. 最近、資金調達を行なった注目企業・ツール
① Cleanlab
② Objective

1. 直近のビッグニュースTop 3

① Google がGPT-4V越えのAIモデルGeminiを発表

まずは以下の3点を抑えておきましょう。

1. マルチモーダル
「テキスト・画像・動画・音声」を入力、「テキスト・画像」を出力することができます。特に動画を入力できる点がGPT-4と異なりユニークです。

2. GPT-4を性能で凌駕
こちらの記事にある通り、マルチモーダルなタスクのほとんどにおいて、GPT-4を上回った上、言語理解のタスクでは、人間の専門家をも上回っています。

3. 3つのサイズのモデルを提供
Geminiは、GPT-4を上回った最高性能のUltra、中間サイズのPro、モバイルデバイス向けのNanoからなります。Ultraは2024年公開予定ですが、ProはチャットボットAIのBardで既に使用可能です。

デモ動画が衝撃的なので、視聴をお勧めします。ただし、演出要素が入っている点に注意してください。（どこまでが演出なのかが気になる方は、こちらのnoteをご覧ください）

確かに、GPT-4を上回る性能を持つGeminiの発表は衝撃的でしたが、圧勝ではありませんでした。OpenAIが保有している次世代モデルの方が遥かに性能が高いと予想されており、今後の動きに大きな注目が集まります。

② キャラクターの静止画を自由自在に動かす技術の登場

11月30日に「Animate Anyone」が発表され、その後すぐに、Tiktokを運営するByteDanceによって「Magic Animate」と呼ばれる同様の技術が発表されました。

アニメーション生成では、フレーム間で画像が不自然に変化してしまう「チラツキ」が最大の問題点でした。今回発表された技術はこれを克服しており、顔や服装が終始一貫している上、動きも滑らかです。

「Magic Animate」に関しては、高性能なGPUでも生成に5分要するとのことですが、コードが公開されており、今後の更なる技術進化に期待です！

キャラクターや人物の画像を自由自在にアニメーション化できる「Animate Anyone」
破綻が全くありません…！
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
5:35 AM • Nov 30, 2023

③ 画像生成速度がついに100fpsに

画像生成の速度が大幅に向上しており、ついに0.01秒に1回のペースで画像を生成できるようになりました！2022年8月にStable Diffusionが公開されてから、まだ1年半も経っていません。当時は、1枚画像を生成するのに10秒以上かかっていたことを考えると、1000倍以上高速になっています。

使用されている技術は、画像生成モデル Stable Diffusion を開発する Stability AI社によって公開された「SDXL Turbo」です。

高速な画像生成を体験してみたい方は、後ほど紹介するリアルタイムお絵描きツールを是非触ってみてください！

StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました！！
sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます！
多分これが一番速いと思います
— あき先生 / Aki (@cumulo_autumn)
8:01 AM • Dec 6, 2023

2. SNSで話題のAIツールをピックアップ！

SNSで話題になっているAIツールの中から、特におすすめできるものをピックアップしました。後ほど見返すかもしれないという方は sayhi2.ai でブックマークしておきましょう！

※ログイン後、左上の画像内、右上の赤いボタンを押すことで、ブックマークが可能

KREA (https://sayhi2.ai/product/krea_ai)

今最も話題のリアルタイムお絵描きツール
使いやすさ抜群
PCカメラの映像からリアルタイムで画像生成できるなど、機能が豊富
昨日ベータ版が公開され、無料かつ、サインアップするだけで即使用可能に

Leonardo AI (https://sayhi2.ai/product/leonardo_ai)

話題のリアルタイムお絵描きツールの一つ
生成した画像をワンクリックで入力画像にできる機能が優秀
無料なのはもちろん、サインアップするだけで即使用可能
サインアップ後は、横のタブからLiveCanvasをクリックして始められる

3. 編集部が厳選！おすすめAIツール

私たちが運営する sayhi2.ai では、市場評価に基づき、各ツールをスコアリングしています。世界で人気を博しているスコアの高いツールの中から、特におすすめできるものを厳選してご紹介します！

Hatchful | スコア: 4.7 / 5.0

カナダ発の大手Eコマース企業Shopifyが運営する、無料のロゴ作成ツールです。ビジネス領域・スタイル・用途などを豊富な選択肢の中から選んでいくと、僅か5ステップ程度で質の高いロゴが生成されます。マイナーですが、試す価値ありです！

Hatchful - AIツール情報、類似ツール、人気度 | sayhi2.ai

Hatchfulは、無料のロゴ作成ツールで、特にAI技術向けのロゴデザインが可能です。デザイン経験がなくても、数ステップで独自のロゴを作成できます。数百のテンプレートと業界別のロゴデザインライブラリを提供し、アイコンの追加や色のカスタマイズ、フォントの変更、レイアウトの編集が可能です。また、作成したロゴは高品質のPNGファイルとして提供され、SNSなどでのブランド認知度向上に役立ちます。例えば、AI技術の開発がほぼ完了し、市場投入を控えている場合、Hatchfulを使ってAIロゴを作成し、技術に親しみやすい顔をつけることができます。

sayhi2.ai/ja/product/shopify_com---tools---logo-maker---artificial-intelligence

Perplexity | スコア: 5.0 / 5.0

ChatGPTの進化が目覚ましく影が薄まっていますが、依然として有用な対話型の検索エンジンです。おすすめは Chrome Extensionで、どんなWebページの内容も、ワンクリックで要約してくれるため、非常に強力です！

Perplexity - AIツール情報、類似ツール、人気度 | sayhi2.ai

Perplexityは、AI技術を活用した検索と生成プラットフォームです。世界トップクラスの投資家から支援を受け、革新的な技術と製品を提供することを目指しています。月額20ドル、年間200ドルのプランで利用でき、年間プランを選ぶと40ドルお得です。特に注目すべきは、1日300回以上使用可能な個人用検索アシスタントCopilotと、最新のAIモデルGPT-4へのアクセスが可能な点です。新機能の追加は無料で、プライベートなコミュニケーションチャンネルも利用できます。

sayhi2.ai/ja/product/perplexity_ai

4. 最近、資金調達を行なった注目企業・ツール

今までとは視点を変え、最近資金調達を行なった注目の企業・ツールを見ていきましょう！

Cleanlab | 資金調達額: $25M (10月10日)

ChatGPTをはじめとする、強力なAIモデルを誰でも使用できるようになった生成AI時代において、保有する「データの質」は競争優位性を獲得するための非常に重要な要素です。

Cleanlab社は、自社で保有する学習データの誤り検出・自動修正を行えるノーコードプラットフォームを提供しており、こういった企業ニーズを的確に捉えています。

既に、オープンソースプロジェクトで1万人以上のユーザを獲得している上、Fortune 500企業や政府機関を含めた100社以上の顧客にクラウド製品を提供しており急成長しています。今後も注目の企業です。

Cleanlab - AIツール情報、類似ツール、人気度 | sayhi2.ai

Cleanlabは、機械学習モデルのためのデータ品質を向上させるツールです。このツールは、データの誤りを自動的に見つけて修正し、信頼性の高いデータセットへと変換します。簡単な操作でMLモデルを訓練し、チューニングすることができ、ウェブインターフェースやREST APIを通じてモデルを展開することも可能です。また、データセットの問題点を分析し、ラベルの誤りが多いクラスを特定することができます。GoogleやBBVAなどの大手企業もCleanlabを利用しており、eコマースや小売業界での製品情報の精度向上や顧客体験の改善に特に有効です。

sayhi2.ai/ja/product/cleanlab_ai

Objective | 資金調達額: $13M (10月18日)

GAFAM出身の機械学習のスペシャリストたちによって設立された、検索アプリをローコードで構築できるプラットフォームを提供する会社です。

Objectiveの検索アルゴリズムは、我々がGoogle検索で馴染み深い「キーワードベースの検索」とは異なり、新しい「マルチモーダル検索」となっています。

つまり、テキスト・画像・動画・音声を入出力できる上に、それらを組み合わせた検索を行うことができます。加えて文脈に基づいた検索も行えるようで、非常に高い技術力を持っているスタートアップと言えます。

生成AIの発展とともに、これからの検索体験をどのように変革してくれるのか、非常に楽しみです。

Objective, Inc — AI-Native Search for Every Website and Application

Objective, Inc. is the modern, AI-native search API for every website and application, that understands language, makes sense of bad data, and sees inside images.

www.objective.inc

さいごに

最後までお読みいただきありがとうございました。
サービス改善のため、アンケートにご協力いただけると幸いです。「ワンクリック」で完了します。

一番ためになったのは？

運営元の紹介

私たちは sayhi2.ai というサイトを運営しています。5000以上のAIツールを掲載しており、様々なAIツールを調査、深掘りすることができます。ぜひお試しください！

AIツール一覧 | sayhi2.ai

このサイトでは、様々なAIツール情報を発信しています。様々な機能を駆使し、目当てのAIツールを探してみてください。

sayhi2.ai/ja

文章や目的を入力するだけでツールを探せる
実際にツールを試さずとも、チャットボットが答えてくれる
厳選された5,000以上のAIツールから欲しいツールを見つけられる
独自のスコアリングアルゴリズムによるAIプロダクトの人気度の推定

またXでは、AIツールや関連するニュース・トレンドに関して、一段踏み込んだ考察を交えながら日々情報発信しています。是非こちらもフォローしてみてください！

サムアルトマン、Microsoft が OpenAI の取締役会に口出しできない理由
今回の一連の騒動の背景にある、創業者・出資者・取締役会の関係性について考察しました。解説します。
最も重要な結論：
①営利法人 OpenAI LP に籍をおくサム・グレッグ・イリヤの３名は親会社兼非営利法人である OpenAI… twitter.com/i/web/status/1…
— 東大卒AIツール開発者 | マーベリック (@sayhi2ai_jp)
10:09 AM • Nov 19, 2023