Deep Researchの評判がすこぶる良い。
OpenAI CEOのサム・アルトマン氏は、「Deep Research」モデルをChatGPTの無料ユーザーにも提供する予定であるとXで発表しました。
「Deep Research」は大規模言語モデル(LLM)の一種で、詳細なレポートを生成できるAIモデルです。レポートの生成は30分から数時間で完成することから、専門家の間ではDeep Researchがビジネス分析や金融分野の仕事を人間に代わって行なう可能性があると言われています。しかし、このような主張は慎重に受け止める必要も秘めています。
さらにアルトマン氏は、OpenAIが提供する複数のAIモデルを統合する計画があることも明らかにしました。多くのユーザーは、AIモデルの違いや機能を理解しにくいと指摘していることから、そこに対応する施策のようです。
OPENAI ROADMAP UPDATE FOR GPT-4.5 and GPT-5:
We want to do a better job of sharing our intended roadmap, and a much better job simplifying our product offerings.
We want AI to “just work” for you; we realize how complicated our model and product offerings have gotten.
We hate…
私たちも“モデルピッカー(訳註:モデルの選択画面)”は嫌いです。
だからこそ魔法のような統合型知能に戻したいのです。次にリリースするのは、社内で『Orion』と呼んでいたGPT-4.5で、これは最後の“チェイン・オブ・ソート(CoT)(訳註:複雑な問題をステップごとに分解して考える技術)を使用しないモデル”になります。
その後の最重要目標は、oシリーズモデルとGPTシリーズモデルを統合し、すべてのツールを活用できるシステムを作ることです。そのシステムは、長時間の思考が必要かどうかを判断し、幅広いタスクで実用的に機能するようになるでしょう。
近い将来、無料ユーザーもo3モデルを統合した新モデルへ「無制限」にアクセスできるようになる予定ですが、有料ユーザーはより高度な知能レベルを享受予定になっているそう。ただし、「より高度な知能レベル」が具体的に何を意味するのかは明言されていません。
現在、Deep Researchは、ChatGPTの月額200ドルかかるプレミアムプランのユーザーのみが利用可能です。しかし、OpenAIがサーバーインフラを拡充するにつれて、最先端のモデルがより多くのユーザーに提供されると予想されていました。アルトマン氏はXで次のように述べています。
i think we are going to initially offer 10 uses per month for chatgpt plus and 2 per month in the free tier, with the intent to scale these up over time.
it probably is worth $1000 a month to some users but i'm excited to see what everyone does with it! https://t.co/YBICvzodPF
まずはChatGPT Plusユーザーに月10回、無料ユーザーには月2回の利用権を提供し、徐々に拡大する予定です。
大規模言語モデル(LLM)であるChatGPTは、本質的には「確率的な予測変換」の強化版とも言えます。膨大なテキストデータを学習して、人間が書いたかのような自然な文章を生成しますが、人間のように「考える」わけではありません。
そのためOpenAIは、モデルの精度向上に向けた新しい技術を模索しています。その1つが「テストタイム・シンキング(Test-time Thinking)」です。
例えば、ユーザーが「アメリカ国内のUber車両を、すべてWaymoに置き換えるにはいくらかかる? 」と尋ねた場合、モデルは単に答えを予測するのではなく、以下のような関連する質問に分解して考えます。
・現在アメリカ国内で稼働しているUber車両の台数は?
・Waymo車両の平均価格は?
・インフラ整備や運用コストはどの程度かかるか?
このように、複雑な質問に対して自己検証しながら回答を生成する仕組みが「テストタイム・シンキング」です。
AI業界では、言語モデルをより実用的な形にするためのさまざまな試みが行なわれています。Deep Researchはその最新のアプローチの1つであり、他にも「AIエージェント」という概念が注目されています。AIエージェントとは、ユーザーのコンピューターを操作し、実際のタスクを遂行するAIのことを指しています。
例えば、航空券の予約自動化だったり、テクノロジーに不慣れな高齢者の利用など。AIエージェントが役立つ可能性も想定されています。しかし、現時点ではOpenAIの「Operator」などのエージェント機能は動作が遅く、エラーも多いため、実用化には課題が残っています。
Deep Researchが詳細なレポートを生成できるとはいえ、AIの精度には依然として問題があります。例えば、Googleがスーパーボウルで展開したGeminiのCMでは、提供された情報が一部誤っていたことが明らかになっていたりします。この事例から分かるように、AIがデータにアクセスできるからといって、常に正確な情報を提供するとは限りません。
一部のAI擁護者は「文章が正しく聞こえるならば、それは正しい」と主張していますが、AIの問題点の1つは、ユーザーがその出力を無批判に信じてしまう傾向があることです。
特にGoogleのAIが繰り返し誤情報を提供していることは、この問題を象徴していえるといえるかもしれません。テック企業のリーダーたちが、自社のAIモデルが出力する情報を十分に精査せずに発表してしまう傾向も見受けられます。
一方、OpenAIは現在イーロン・マスク氏との長期にわたる法的闘争にも直面しています。
今週、マスク氏はOpenAIの買収を目的として970億ドル(約14.7兆円)の敵対的買収提案を行ないました。マスク氏がXの買収を成功させたケースと比較されがちですが、今回の状況とは大きく異なっています。 現在のOpenAIは非営利組織(NPO)として設立されており、法的には投資家に応じる義務がありません。そのためOpenAIが営利企業に移行するまでは、買収提案を検討する義務も生じない可能性が高い状況になっています。
OpenAIは「Deep Research」を有料プランに加入していないユーザーへの提供と、AIモデルの統合に取り組むと発表しています。しかし、AIの精度や信頼性の問題、さらには競争の激化など、多くの課題が残されているのは事実です。さらにイーロン・マスク氏との法的対立もあり、OpenAIの今後の動向は業界全体に影響を及ぼす可能性がありそうです。
「ギズモード・ジャパンのテック教室」