オープン AI、ニューヨーク タイムズはマイクロソフトに勝つことができるでしょうか?



オープン AI、ニューヨーク タイムズはマイクロソフトに勝つことができるでしょうか?

ニューヨーク・タイムズは、ChatGptを所有するOpenAIとマイクロソフトを著作権侵害で訴えている。ここだから。

新聞は決してニュースであってはならず、ニュースの媒体であるべきであると言われています。 MicrosoftとOpenAIに対して同時に訴訟を起こし、今年のニュース速報を開始したニューヨーク・タイムズにとっては大きな問題だ。つまり、人工知能は新聞から職業を奪い、民主主義に悪影響を及ぼします。この問題については、ニューヨーク州南部民事地方裁判所の陪審が間もなく決定を下すことになる。

問題となっているのは金ではなく、今日提出された69ページには今のところ数字については言及されていないが、知的財産と情報構造の防衛だけが問題である。タイムズ紙によると、検索エンジンBing! Microsoft と OpenAI は、1851 年以来自社の活動をカバーしてきたデジタル記事を悪用することで、今日競合するチャットボットをトレーニングするために数百万の新聞記事を無料で使用してきました。«被告は、ニューヨーク・タイムズの巨額投資から自由に乗りたいと考えています。彼らのジャーナリズムの中で」と私たちは読みました。同紙によると、OpenAIとマイクロソフトは「タイムズのコンテンツを無償で利用し、それに代わる製品を開発し、視聴者を奪っている」という。

テクノクラートの考えに反して、この場合は印刷メディアがデビッドです。 1,000 万人の購読者 (そしてその 10 倍の臨時読者) と 5,600 人の従業員 (うちジャーナリズム部門の 2,200 人) にもかかわらず、タイムズの時価総額は 80 億ドルにも満たない一方、マイクロソフト社だけでもオープン AI に 13 ドルを投資しています。同社の評価額は現在800億以上と推定されており、マイクロソフトが株式の75%を保有しているが、投資が返済されると49%に下がる予定だ。少なくとも経済力の点からすれば、アルゴリズムが今日のゴリアテであることは疑いの余地がありません。同紙は、訴訟を起こす前に、グーグル、メタ、アップルとすでに合意に達しようとしたが失敗に終わったと説明している。だからこそ、この大義は歴史を作る運命にあるのです。一方では、どんな犠牲を払ってでもテクノロジーを支持します。もう一方は、行われた仕事に対して報酬を受け取る権利だけでなく、何よりもニュースを収集し、検証し、配信する人々の役割を主張する人々です。

優れた記事と同様に、ストーリーは最初の段落ですべてが決まります。 「独立したジャーナリズムは私たちの民主主義にとって不可欠です。また、ますます希少で貴重なものとなっている」と同紙の弁護士は書いている。 「この仕事は常に重要でした。しかし、信頼性の低いコンテンツが氾濫する壊れた情報エコシステムの中で、タイムズのジャーナリズムは、信頼できる情報、事実の分析、解説を提供することで、視聴者にとってますます価値のあるサービスを提供しています。」記事からスタイルマニュアルに至るまで、タイムズ紙の資料が無料で使用されることで、無料の情報はますます持続可能ではなくなります。はっきり言っておきますが、イタリアで「純粋出版」と呼ばれるものは、それ自体が独立した活動であり、自立する必要があるのです。他の産業活動や金融活動からの補助金は受けていません。

タイムズ紙の訴訟は、トレーニング目的で本を「噛み砕かれた」有名作家、自伝が使用された著名人、さらにはゲッティイメージズのような写真大手さえも含まれるリストの最新のものにすぎない。まさにこのことから、ゲームの複雑さが理解できます。Getty は、OpenAI が、Getty が権利を保有する画像に触発されて作成されたデジタル画像を作成していると非難しています。ゲッティが、アーカイブに基づいて写真を作成するという Nvidia との 2023 年 9 月の合意を通じて目指している市場。この市場では、パブリック ドメインの写真 (NASA や米軍の写真を思い浮かべてください) を恣意的に見つけることも簡単です。 「吸収された」。

同紙によると、OpenAIは人工知能研究の目的を長い間放棄しており、テキストを編集するアプリケーションの中で最も有名なChatGPTのバージョンの有料使用のみを許可しているという。 2024 年の予想売上高は 10 億ドル程度です。 「この商業的成功は主にOpenAIの大規模な著作権侵害に基づいている」と同社の弁護士は率直に書いている。 «ChatGPT および関連製品の使用と販売を促進する中心的な機能の 1 つは、さまざまなスタイルで自然言語を生成するこの LLM [大規模言語モデル] の機能です。これを達成するために、LLM OpenAI は「トレーニング」において、Times の著作物の多数のコピーを作成しました。」数値的に言うと、ChatGPT-3 では 1,750 億のパラメータが使用され、ChatGPT4 ではさらに 1.8 兆のパラメータが使用され、インターネット全体のミラー コピー (したがって Startmag.it を含む) を含む巨大なデータベースによって強化されました。

この記事の執筆時点では、Microsoft および OpenAI からの正式な返答はありません。ただし、簡単な予測が 2 つあります。 1つ目は、この訴訟は最高裁判所に持ち込まれる予定で、デジタル生成機能を促進するために人間の精神によって作成された教材に関するトレーニングが、1787年にすでに例外的な先見性によって「著作者」に保証されている合衆国憲法に適合するかどうかを判断する必要があるということだ。 「および発明者」には、「それぞれの著作および発見に対する独占的権利」が連邦政府によって保護されます。 (第1条第8項)。

2つ目は、ChatGPT、LLM、AI全般が質の高いジャーナリズムの実現を困難にしているのであれば、コピー&ペーストのジャーナリズムはすでに死んだ人間であるということです。


これは、Wed, 27 Dec 2023 15:52:50 +0000 の https://www.startmag.it/mondo/new-york-times-microsoft/Start Magazine に公開された記事の自動翻訳です。