AI スタートアップ、ブラジルの子供の写真を同意なしにモデルのトレーニングに使用

擁護団体は、画像生成業者がブラジルの子供たちの同意なしにAIモデルをトレーニングするために数十億枚の画像を使用したことを明らかにした。ヒューマン・ライツ・ウォッチ（HRW）は、Stable Diffusion のような人気のある画像ジェネレーターがモデルのトレーニングに「幼少期全体にわたる」子供の画像を使用していることを示す調査を実施しました。

関連記事:テクノロジー企業、AI 生成の児童ポルノの波と戦うよう促される

HRWの調査では、これらの画像がブラジルの約10州から撮影されたことが明らかになった。この行為はまた、彼らの肖像を含む同意のない画像の制作を増加させるため、これらの画像は多大な「プライバシーリスク」を子供たちにもたらすと報告されている。

人工知能モデルのトレーニングに使用されるブラジルの子供たちの数十億枚の画像

HRW 研究者の Hye Jung Han 氏は、公開 Web の Common Crawl スナップショットから構築されたデータセットである LAION-5B の一部 (0.0001% 未満) を分析した後、この問題を明らかにしました。そのデータセットには実際の写真は含まれておらず、2008年以降に公開された約60億枚の画像とキャプションから抽出された「画像テキストのペア」が含まれていたことが明らかになった。

ブラジルの10州の子供たちの写真が見つかり、そのほとんどには個人ブログや子育てブログにアップロードされた家族写真が含まれていた。報告書によると、これらはインターネットユーザーが容易に目にすることのできない画像だという。

こちらもお読みください:英国、性的に露骨なディープフェイクの作成は犯罪行為であると宣言

HRW は、データセットを作成したドイツの非営利団体LAIONと協力して、画像へのリンクを削除しました。リンクを削除するだけでは問題が完全に解決されるわけではないため、データセットが依然として世界中の子供たちの画像を参照している可能性があるという懸念が依然として残っています。

LAIONの広報担当ネイト・タイラー氏は、「これはより大きく、非常に憂慮すべき問題であり、全員ボランティアの団体として、私たちは支援に向けて自分たちの役割を果たすつもりだ」とアルスに語った。

子どもたちの身元は簡単に追跡できる

HRWの報告書はまた、データセットを構築したキャプションに名前と場所が使用されているため、多くのブラジル人の子供たちの身元を追跡できる可能性があることも明らかにした。また、少年たちが画像を露骨なコンテンツに使用される可能性がある一方で、いじめっ子の標的になるリスクにさらされる可能性があるという懸念も生じた。

「調査された写真は幼少期全体にわたる」と報告書の一部には書かれている。

「医師の手袋をはめた手で生まれた新生児や、誕生日ケーキのろうそくの火を吹き消したり、家で下着姿で踊ったりする小さな子供たちの親密な瞬間が捉えられています…」

HRW。

しかしハン氏は、「LAION-5Bの公開されているバージョンはすべて削除された」ため、ブラジル人の子供の写真が使用されるリスクは少なくなったと明らかにした。

HRW によると、LAION が報告されたすべてのコンテンツが削除されると確信するまで、データセットは再び利用できなくなります。この決定は、スタンフォード大学の報告書でも、児童性的虐待コンテンツの疑いのある3,000件以上の事例を含む「公共ウェブ上の違法コンテンツを指すリンクがデータセット内に発見された」ことを受けて行われた。

ブラジルの少なくとも85人の女子生徒も、クラスメートが人工知能を使用して「ソーシャルメディアコンテンツから撮影した写真に基づいて」性的に露骨なディープフェイクコンテンツを生成するという嫌がらせを受けたと報告している。

子供のプライバシーの保護

Arsによると、LAION-5B はおそらく OpenAI のデータセットを複製するために2022 年に導入され、最大の「自由に利用できるテキスト画像データセット」として宣伝されました。

HRWが画像についてLAIONに問い合わせたところ、同組織はプライバシーとセキュリティのリスクは認識しているものの、LAION-5Bで訓練されたAIモデルは「子どものデータをそのまま生成することはできなかった」と返答した。

その後、同組織は一部の画像の削除を開始したが、子供の個人写真をインターネットから削除する責任は親や保護者にもあったとしている。ハン氏は彼らの議論に反対し、次のように述べた。

「子供たちとその親は、基本的に防御が不可能なテクノロジーから子供たちを守る責任を負うべきではありません。それは彼らのせいではありません。」

ハンさん。

HRWは、新興テクノロジーから子どもの権利を守るため、ブラジルの議員らに緊急の行動をとるよう求めた。 HRWが推奨しているように、AIモデル内の子供のデータの破棄を禁止するには、新しい法律を採択する必要があります。

Enacy Mapakameによる暗号政治レポート