サイト内
ウェブ

今でも便利なGoogleが「Gemini(ジェミニ)」でさらに進化します

  • 2023年12月8日
  • Gizmodo Japan

今でも便利なGoogleが「Gemini(ジェミニ)」でさらに進化します
Graphic: Google

GoogleがAIモデルの最新版「Gemini(ジェミニ)」を発表しました。

1年ほど前にOpenAIがChatGPTを発表したのをきっかけに、AIが非常に盛り上がった1年。超巨大テック企業のGoogleにとっては、OpenAIの背中を見て走り続けた1年となりました。が、2023年の締めくくりについに追い越しにかかりましたよ! 最新のAIモデルGeminiは、Googleが「うちのAIがトップだ!」と世界に示すための鍵となる存在です。

AI好きは、すでにGoogleのプレスリリースを熟読してワクワクしていると思います。

AI気になるけど正直よくわかってないし、エンジニアでもないし…、でも気になるし…という方。Gemini発表で押さえておくべきポイントは10個。以下にまとめました。

Geminiは3モデルある

Graphic: Google

GoogleのAI最新モデルGeminiには3モデルあります。まず、最高位となるGemini Ultra。3つの中で最もパワフルで、OpenAIのGPT-4とはバッチバチのライバルという位置付け。真ん中のGemini Proは、発表後すぐから、今まさにGoogle版ChatGPTと言われるBardに乗っているモデル。Googleいわく、OpenAIのGPT3.5を超える性能を持ちます。そして末っ子のGemini Nanoは、モバイル端末に特化したモデルになっています。

やはり最高位のGemini Ultraの性能が1番気になりますが、まずは一部の人だけに先行公開。ビジネスパートナー企業や安全の専門家、ごく一部のテストユーザーにのみ公開されます。それ以外の人々(=私たち)にGemini Ultraが公開されるのは、来年頭頃とのこと。

発表後すぐからBardに乗ってます!

Gemini Ultraはちょい待ちですが、前述の通り真ん中のGemini ProはすでにのBardの裏で動いています。Googleいわく、Bard最大のアップデート。GPT-3.5搭載の無料版ChatGPTでは見過ごされそうな情報もカバーするとのこと。

Pixel 8 ProにGeminiが来た!

Gemini Nano搭載となる最初のスマートフォンは、やはりGoogle印の最高位モデルPixel 8 Pro。ただ、スタートすぐはできることに限りあり。

まず、Androidのレコーダーアプリの要約をスマホの内部だけで行えます。WhatsAppアプリにてGoogleキーボードを使っていれば、スマート返信機能も使えるようになります。

今後、より多くのメッセージ系アプリ、来年にはOS全体へ拡大対応を予定。

性能はOpenAI超え(Google調べ)

Graphic: Google

全方位的にOpenAIに勝ってるぜ!といいたいGoogle。さまざまなタスクでのパフォーマンススコアが公開されています。

「スコア90%以上、業界基準の大規模マルチタスク言語理解のベンチマークで人間の専門家を超えたパフォーマンスを発揮できる初めてのAIモデル、それがGeminiです」と、プレス向けに語ったのはGoogle Deepmind部のEli Collins氏。

「我々のAIモデルでは最大かつもっとも有能です。Geminiの性能は、現在業界で広く利用されているベンチマークの32項目のうち30において、最先端結果をも上回っています」

あくまでもGoogle側の言い分ですけどね。

大規模マルチタスク言語理解(MMLU:Multitask Language Understanding)は、数学や物理、歴史、法、医療、倫理など57の題材を取り入れた基本テストで、AI能力を図ることができるもの。

有料版Bardもでる

Gemini Proが支えるのは無料版Bard。Gemini Ultraが支える「Bard Advanced」もリリース予定。こちら有料版となります。現時点では、リリース時期も価格も明らかになっておらず。

ちなみに、OpenAIの有料版ChatGPTが月額20ドル(約3,000円)ですね。

Bardはしゃべる

今現在、お話できるのは、そこそこ無口ですがChatGPTのみ。ChatGPTモバイルアプリでは音声認識しますが、「OK Google」とか「Hey Siri」のような発動セリフがないので使い勝手はイマイチ。これを変えようとしているのがBard。

来年中には、Google AssistantにBardを追加予定。Bardが乗ることで何がどうなるのか詳細は明かされていないものの、プレス向けイベントのでも動画では、Bardがユーザーに語りかけるシーンがありました。

Siri、Alexa、Google Assistantなどのスマートアシスタントは、現状、事前準備された制限つき回答しかできません。が、ここにAIエンジンが乗ることによってユーザーとの関係性も変わっていきそう。いち消費者、普通の人がAIのありがたみを日常生活で実感できるのは、ここかも。

テキスト同様に、画像も動画も音声だって処理できる

Screenshot: Google

Googleが自慢したGeminiの特徴の1つが、優れたマルチモーダル性能。

マルチモーダルとは、テキストのみならず、画像も動画も音声などいろんな形の情報を一緒に処理できることです。Googleいわく、チャット機能ができてからトレーニングするのではなく、ゼロからいろいろな媒体でトレーニングしてきたのが強みになっているといいます。

Googleは、物理を学ぶ生徒が宿題をBardに手伝ってもらうデモ動画を公開。手書きの宿題(画像)をBardが認識し、採点、間違えた問題の解説をしています。賢すぎ!

プログラミングも得意

Googleがコーディングロボ「AlphaCode」をリリースしたのは2年前のこと。ChatGPT含め、今、AIの力を借りているコーダーは少なくないと思います。

Gemini登場で、Googleの新たなコーディングAIとなるのが「AlphaCode 2」。Googleいわく、コーディングだけでなく、複雑な数学や理論的コンピュータ科学の問題も含め、プログラミング課題を解いていく能力に長けているそうです。

Googleのすべてに拡大していく

Gemini活躍の場は、BardとPixelスマホだけではありません。Googleの提供するサービス、Chrome、検索、広告、ありとあらゆるところにGeminiが拡大されていく予定です。

予定なので、現段階で何がいつという明確なタイムラインはでていませんけれど。ただ、一部サービスは数ヶ月内にはとのこと。

変わるクラウドビジネス

Photo: Google

Googleが行うビジネスの根幹の1つにGoogle Cloudがあります。データのストレージ、データ解析、マネジメントツール、マシンラーニングを含め多様なサービスを企業向けに提供中。世界のビジネスの大きな部分がこのGoogle Cloudに乗っているわけですが、ここにもGeminiがやってきます。

Gemini発表で明かされた「Cloud TPU v5p」、AI用に作られた新型コンピューターチップです。AIを開発・トレーニングするには莫大な処理能力が必要になりますが、Googleはそれ専用に最適化されたチップでさらに上を目指します。

AIモデルもチップもGoogle印という最強のタッグは、OpenAIのGPT-4よりも、Geminiを選ぶ理由になるとGoogleは自信を持っています。

これこそ、GoogleがどれだけAIビジネスに大きくコミットしているか、賭けているかの証拠かもしれません。

キーワードからさがす

gooIDで新規登録・ログイン

ログインして問題を解くと自然保護ポイントが
たまって環境に貢献できます。

掲載情報の著作権は提供元企業等に帰属します。
copyright 2024 (C) mediagene, Inc. All Rights Reserved.