AIの血となり肉となるのか…。
404Mediaによると、オープンソースのブログソフトWordPressやSNS・ブログツールのTumblrを所有するAutomattic社が、自社プラットフォームのコンテンツをMidJourneyやOpenAIなどのAI企業に売却する交渉を進めていることがわかりました。
用途はAIのトレーニングで、契約の詳細はまだわかりませんが、ユーザーに対しては「いつでもオプトアウト(許諾しない意思を表示する行為)してくれていいので安心してほしい」と表明しています。
404によると、AI企業に提供するために収集されたコンテンツには、Automattic社が保存していることをユーザーが知らないようなプライベートコンテンツも含まれているとのこと。そのため、Automattic社内でも対立が起きているそうです。
さらに、古いApple Musicのキャンペーン広告など、Automattic社が所有していない広告コンテンツまでがトレーニングデータセットに混入していると報じられています。
こうしたAutomattic社の計画は社内で大きな物議を醸しており、404によると、あるプロダクトマネージャーは「AIのトレーニングに使用されたら嫌だから」と、自身の写真をTumblrから削除し始めたのだそう。
OpenAIが2022年後半に初めてChatGPTを発表して以来、生成AIは大きなビジネスとなり、多くの企業がこぞって追随し、テキストプロンプトの画像生成ソフト制作に乗り出しました。この技術は膨大な量のデータを「学習」させることで機能し、オリジナルに見える動画や画像、テキストを生成できるのが特徴です。
ただ、大手パブリッシャーは、このシステムをトレーニングするために使われたデータの多くが海賊版であるか、既存の著作権の不正使用にあたると主張し、訴訟にまで発展した例もあります。
404 Mediaによると、Automattic社は2月末にもユーザーがAIシステムのトレーニングを拒否できる設定を導入する予定ですが、ただ、デフォルトでこの機能がオンになるのかオフになるのかは明らかになっていません。WordPressの競合であるSquarespaceは昨年、ユーザーがデータのAI転用を拒否する設定をすでに導入しています。
Automattic社に問い合わせたところ、同社は404 Mediaの報道を多かれ少なかれ裏付けるような投稿を掲載したと回答。さらに消費者に対しては「作成したコンテンツをより細かく制御できる」機会として、一連の動きを売り込もうとしています。
同社ブログ投稿には、以下のような内容が書かれています:
AIは、コンテンツが作成・消費される方法など、私たちの世界のあらゆる側面を急速に変革しています。当社では、自由でオープンなウェブと個人の選択を常に信じてきました。
他のハイテク企業同様、私たちはユーザーの好みを尊重しつつAI企業と協力する方法など、こうした進歩を注視しています。
ただ、この声明はかなり自己擁護的な印象を受けます。続く文章には「クローラー(検索エンジンがネット上で情報収集させるロボット)がこうした設定に従わなければならない法律は存在しない」とあり、Automattic社は「ユーザーにコンテンツ使用許可の選択肢を与えないと、業界的に良くないから」と暗に示している感じがします。以下、同社の投稿をさらに紹介します:
地理的な位置に関係なく、私たちはできるだけ制御可能なツールを提供したいと考えています。立派な企業はみなこれらの設定に従っており、それがコンテンツがウェブ上でどのようにクロールされるかを強制する最良の方法です。
私たちのパートナーシップは、すべてのオプトアウト設定を尊重します。
また、さらに一歩踏み込んで、新たにオプトアウトした人々について、すべてのパートナーに定期的なアップデートを行い、そのコンテンツを過去のソースや今後のトレーニングから削除するよう要請する予定です。
AIとの会話は保存されている。プライバシーは大丈夫なの? AIの後ろにいる人間の存在…。ChatGPTの登場以来、自然な会話でAIへ尋ねるシーンって増えてきたように感じます。でも、つい相手が人間ではないからといって、いろいろ話しすぎるのは考えものです。このほどGoogle(グーグル)のAI「Gemini」のデータ保存実態が明らかになってきました。Geminiとの会話は保存されているGoogleは、これまで「Bard」というAI開発を続けてきましたが、新 https://www.gizmodo.jp/2024/02/googles-gemini-ai-keeps-your-conversations-three-years.html