Lifehacker 2025年4月7日掲載の記事より転載
Googleは2025年3月末、最新AIモデル「Gemini 2.5 Pro」の提供を開始しました。
実験版とはいえ全ユーザーが無料で利用できるので、有料版「Gemini Advanced」に登録する必要はありません。
Gemini 2.5 Proは、相次いでリリースされているほかのAIモデルと同様に、「推論」がアップグレード最大の目玉だとされています。
人工知能界隈で言う「推論」とは、より考え抜かれた回答を意味します。
ミスが減り、より論理的で、「文脈とニュアンス」をいっそう理解したうえでの回答が得られるはずとGoogleは述べています。
この「推論力」は、Googleが今後リリースするAIモデルに標準搭載されることになるでしょう。
Pro(実験版)は、Gemini 2.5シリーズの第1弾としてリリースされました。
Googleの発表ブログでは、ユーザーへの無料提供については触れられていませんでしたが、それから1週間も経たず発表された最新情報で、全ユーザーに提供されることがわかりました。
ただし、Gemini Advancedに登録していないユーザーには、レート制限が課せられるようです(具体的な値は明らかにされていません)。
現時点でGemini 2.5 Proを使えるのはデスクトップ版のみですが、近いうちにモバイル版でも利用可能になります。
Googleは、Gemini 2.5 Proの実力を示すために、ベンチマークテストの結果をいくつか公表しています。
この記事の執筆時点では、さまざまなAIチャットボットの回答に対してユーザーが評価を下すプラットフォーム「LMArena」のリーダーボードで、Gemini 2.5 Pro が1位を獲得しています。
また、AIがもつ人類の知識と推論を測定する「Humanity's Last Exam」では得点が18.8%と、ライバルのOpenAIならびにAnthropicのAIモデルを、わずかながらも上回りました。
Gemini 2.5 Proの注目すべき点には、コンテキストウィンドウの大きさもあります。コンテキストウィンドウとは、簡単に言えば、AIモデルが1回で処理できるデータ量を示す指標。
Gemini 2.5 Proのコンテキストウィンドウは100万トークンで、Googleによれば、近日中に200万トークンに拡張されるようです。200万トークンは、ChatGPTの推論モデル「o3-mini」と肩を並べるレベルになります。
こうしたAI関連の発表ではよくあるように、データトレーニング時の著作権侵害やエネルギー使用量の増加については一切触れられていません。
マサチューセッツ工科大学(MIT)の研究者によると、現代のAIモデルは驚くほどの電力と水を使用しており、私たちは「持続不可能な道」へと向かっているとのこと。そのため、すぐさま方向転換しなければならないと主張されています。
AIモデルが前バージョンからどれだけ改善されたかを定量化するのは、それほど容易ではありません。だからこそ、LMArenaといったベンチマークが役に立つわけです。
私は専門家ではありませんし、プログラミングの知識も持ち合わせていないので、Gemini 2.5 Proの実力を判断することはできません。
しかし、前モデルのときと同じように、ごくシンプルなウェブアプリ(オンライン・タイマーなど)をつくってほしいとGemini 2.5 Proに頼んだところ、数分で完成させてくれました。
長編小説の要約も上手にできたほかにも、チャールズ・ディケンズの長編小説『荒涼館』のことであれば、私にもちょっとした知識があるので、Gemini 2.5 Proに同作を要約するよう頼んでみました。
すると、あらましの要約は正確でしたし、物語のさまざまな仕掛けについても、うまい具合に判断していました(学生時代だったらとても役に立ったでしょう)。
その上、映画用に仕立て上げた3幕構成もなかなかの出来栄え。これは、Gemini 2.5 Proが、一度に多くの情報を「心にとどめておける」証拠です。
旧モデルのGemini 2.0 Flashも、『荒涼館』を要約してほしいというプロンプトに対して、正確な答えを生成しました。とはいえ、Gemini 2.5 Proの回答のほうが、もっと長く、もっと詳しく、ありきたりな内容が減って、スマートです。
要するに、追加された「推論力」が実力を発揮したわけです。Gemini 2.0 Flashは、『荒涼館』の映画用バージョンを3回に分けて出力してきましたが、それはおそらく、処理しようとしたテキストの量が膨大すぎたせいかもしれません。
スマートさがわかる、デモ動画2本Googleは、Gemini 2.5 Proの実力を示す自社独自のデモ動画も公開しています。
たった1つのプロンプトから、シンプルでエンドレスに続くランナーゲームが生成されるまでの流れを紹介したもので、コード出力が次々とスピードを上げながら表示されています。
ゲームはきちんと動作しているようですし、デザインもなかなかの出来に思えます。自然言語のプロンプト1文のみから生成されたゲームとしては見事と言えるでしょう。
さらに、デジタルの魚が泳ぎまわる、よくできたデモ動画も公開されています。
最新のGemini 2.5 Proは、ウェブ上で幅広く検証されています。ソフトウェア技術者で独立系AI研究者のSimon Willison氏が、画像生成や音声認識、コード生成などについてテストをいくつか行なっており、Gemini 2.5 Proが生成した出来栄えにかなり満足していました。
AI開発は、熱狂的とも言える勢いで進んでおり、その速度が落ちることは当分なさそうです。また近いうちに、Gemini 2.5シリーズの新たなモデルが登場すると思われます。
Gemini 2.5を開発しているGoogle DeepMindのAIラボ最高技術責任者Koray Kavukcuoglu氏は、次のように話しています。
私たちは、いつものようにフィードバックを歓迎しています。Geminiの優れた最新能力を急ピッチで改善し続けるためです。目標は、私たちのAIがもっと便利になることですから。
【朗報】Geminiの検索結果→ポッドキャスト化が楽ちんに!簡単なやり方教えます | ライフハッカー・ジャパン Geminiの検索結果が簡単にポッドキャストにできるようになりました!やり方をご紹介します。 https://www.lifehacker.jp/article/2504-how-to-generate-podcast-style-audio-overviews-in-gemini-ai/ Apple Intelligenceがついに日本語に対応、何ができるかiPhone16で試してみた! | ライフハッカー・ジャパン Apple Intelligenceがついに日本語に対応。iOS 18.4リリースで何ができるかiPhone16で試してみました。 https://www.lifehacker.jp/article/2504_apple_intelligence/ ChatGPT、これができたら最強じゃね?Deep Researchにあったらうれしい8つのコト | ライフハッカー・ジャパン 優秀なAIツールであるChatGPTのDeep Research。でも、この8つの機能が追加されたらもっと便利になるはず。 https://www.lifehacker.jp/article/2504-chatgpt-deep-research-extra-features/ 著者:David Nield - Lifehacker US
翻訳:遠藤康子(ガリレオ)
Image: Google
Source: Google, X, gradio, Humanity's Last Exam, Massachusetts Institute of Technology, Project Gutenberg, YouTube(1, 2), Simon Willison’s Weblog