サイト内
ウェブ

OpenAIアルトマン騒動で急浮上の「Q*」とは何なのか?

  • 2023年12月7日
  • Gizmodo Japan

OpenAIアルトマン騒動で急浮上の「Q*」とは何なのか?
Image: PlayAlchemist / YouTube

「心底恐怖を感じる瞬間はある。自分たちの造ったものは道具なのか、それとも化け物なのかと」

(CEO更迭前夜のサム・アルトマン、オークランド市内のイベント「Robot Heart」にて)

こんな意味深な発言をした翌朝、突如OpenAI社のCEO職を解任になったサム・アルトマン。

最大出資主のマイクロソフトが「うちにこい!」と即採用を決めましたが、OpenAI社員770人中710人が「復職させなかったら自分らも辞める! 」と連名で直訴したことで無事CEOに復帰。クーデターを断行した役員はQuora CEO兼務の1名を残して全員解任となり、更迭劇は4日で終息しました。が、「そもそもなんで辞めさせられたの?」という謎は未解決のままです。

その謎を解くカギを握るとされるのが、更迭前夜にアルトマンCEOがオークランド市内の倉庫で開かれた「Robot Heart」の対談ステージでポロっとこぼした上記の発言です。以下はフルバージョン。

ほんの半年前には「自分らがつくっているのは道具であって化け物ではない」とキッパリ言い切っていたのに…

急にどうしちゃったの?となりました。

そんな矢先の更迭劇ですからねえ。これは裏があるに違いない!とReutersが周辺を嗅ぎ回ったら、「どうも人類の存在を揺るがすブレイクスルーがあって役員会もビビってしまったようだ」という話が社内匿名筋から出てきました。

そのブレイクスルーをもたらしたのは「Q*(Qスター)」という、社内でもほんのひと握りの人間しか知らない極秘開発プログラムです。社内のAI研究員らが「人類の脅威になりうるパワフルなAIの発見」を役員会に報告し、安全を優先したい役員と開発を進めたいCEOが真っ向から対立したことも急な解任劇の背景にあったというんですね。

にわかには信じられない話で、世界の頭脳集団OpenAIがそんなプログラムひとつでそこまで過剰に反応するなんて、ちょっとありえなく感じますけどね。この「Q*」とやらを通すと、指示待ちのAIもひとりで勝手に小学生レベルの数学が解けるそうでして、これが「AGI *」の壁を破る偉業らしいんです。The Informationの取材でも同様の話が出てきました。

*AGI(汎用人工知能):幅広い知識を持ち、人間のように「何をすべきか」を自分で判断できるAI。

OpenAIは肯定も否定もしていないので、いろんな噂と憶測が飛び交っている状態。そのうち誰かが「QってもしやQラーニングのQなのでは?」と言い出して今にいたります。

Qラーニングって?

AIには次の3通りの学習アプローチがあります。

① 教師あり学習 (supervised learning):データに学習ラベルをつけてフィードしてやる学習方法。例)OpenAIのChatGPT。

② 教師なし学習(unsupervised learning):学習ラベルのついてないデータの山からAIがアルゴリズムでパターンを見出す学習方法。例)過去の視聴パターンをもとに新しいコンテンツのおすすめをするSpotifyやNetflixの機能。

③強化学習(reinforced learning:RL):報酬を与えて目的達成を促す学習方法。Qラーニングはその一種。餌をやって犬を調教するのに似ている。よい結果を出す行動には報酬、悪い結果を出す行動には罰を与える。するとAIは与えられた状況下で最大限の結果を出す方法を探すよう“調教”されていく。

Qラーニングではこのようなトライアル&エラー(試行錯誤)を繰り返すことで目的達成の最善ル―トを見出していくわけですが、それが数式で実現したのではないかというわけです。

専門筋は懐疑的

さっそく社外からは、その程度のことでAGI全般のブレイクスルーだいうのは空騒ぎだという声もあがっています。MIT Technology Reviewが紹介しているのは、こんなエジンバラ大学AI講師のWenda Liさんの言葉。

「AIモデルで数学の問題を解く試みは、研究員たちが長年取り組んできたことだ。ChatGPTやCPT-4のような大規模言語モデルで数学は解けるが、あまり得意ではないし、当たりはずれもある。現状、AIで安定的に数学の問題が解けるアルゴリズムはないし、それに適したアーキテクチャすら存在しない」

「言語モデルで使うディープラーニングとTransformers(一種のニューラルネットワーク)はパターン認識に優れてはいるが、それだけでは足りない」

AIウォッチャーは興奮の渦

まーそれでもジョブズ更迭リターンマッチを金土日月の4日に凝縮したような内紛劇にAIウォッチャーは興奮冷めやらずです。巷の観測のまとめ(上)を見てみると、「学習に人間のフィードバックを挟むと質が悪くてロクなことないのだけど、その部分をAIがやれる(AIがAIを採点する)ようになるとアルファGOみたいな超絶進化もありうる」という声もあったりしてワクワク半分、ヒヤヒヤ半分。

「勝手に騒いで話が大きくなってるだけ」というのが真相に近い気はしますし、アルトマンはiPhoneにかわるAI端末開発でジョニー・アイブ(昨年Appleとの契約が終了。遊軍に)、孫正義とタッグを組んで別会社を設立する動きも見せています。

これを快く思わない役員もいたのかもしれませんが、役員会もビビる何かがあったことは確か。

サム・アルトマン解任の謎… 個人的な利益の追求が原因? 11月、OpenAIのサム・アルトマン氏がCEOを解任されたと突然発表され、世界中が驚きました。その後、急ピッチでいろんな動きがあり、現在、再びOpenAIのCEOに落ち着いているアルトマン氏。CEO復活は果たしたものの、そもそもなぜ解任されたのか、詳しいことは明らかになっていません。多くのメディアがOpenAI騒動の裏を探ろうとアンテナを張り巡らせています。米Wiredが、今回の解任劇はアルト https://www.gizmodo.jp/2023/12/sam-altman-openai-chatgpt-loophole-cash-in.html 【今週ギズモードから売れたもの】
Anker Power Bank (10000mAh, 30W) (モバイルバッテリー 10000mAh 30W出力 大容量 LEDディスプレイ搭載)【USB Power Delivery/PowerIQ搭載/PSE技術基準適合】iPhone 15 Android MacBook その他各種機器対応 (ブラック) 5,990 Amazonで購入する !function(t,e){if(!t.getElementById(e)){var n=t.createElement("script");n.id=e,n.src="https://araklet.mediagene.co.jp/resource/araklet.js",t.body.appendChild(n)}}(document,"loadAraklet")

キーワードからさがす

gooIDで新規登録・ログイン

ログインして問題を解くと自然保護ポイントが
たまって環境に貢献できます。

掲載情報の著作権は提供元企業等に帰属します。
copyright 2024 (C) mediagene, Inc. All Rights Reserved.