OpenAIはセキュリティ上の理由を理由に、新しい音声モード機能のリリースを延期した。同社は、ユーザーにリリースする前に、この機能についてさらなるセキュリティテストを実施する予定だ。同社は先月この機能を発表した。
こちらもお読みください: Coinbase、反仮想通貨の政治家に投票するために 2,500 万ドルを寄付
この音声モードは、その厄介なリアリズムと、スカーレット・ヨハンソンが映画「 Her 」で彼女のキャラクターを反映した声を開発するためにこの音声モードを使用したとの疑惑で物議を醸しました。同社は5月にChatGPTの表現力豊かな音声モード機能を初めてデモンストレーションした。また、表情を読み取り、リアルタイムで活発なチャットができることも実証しました。 AI 企業は、6 月までに ChatGPT Plus ユーザーの一部のグループを対象としたアルファ テストで音声機能をリリースする予定です。
オーディオ、ビジョン、テキストをリアルタイムで推論できる新しいフラッグシップ モデルである GPT-4o をご紹介します: https://t.co/MYHZB79UqN
テキストと画像の入力は今日から API で利用できるようになり、数週間以内に音声とビデオを使って ChatGPT で利用できるようになります。 pic.twitter.com/uuthKZyzYx
– OpenAI (@OpenAI) 2024 年 5 月 13 日
OpenAIが遅延の理由を明らかに
同社は、音声機能を完成させるには、秋にすべての Plus メンバーに展開するまでにさらに 1 か月必要だと述べた。おそらく音声機能は、最新の大規模言語モデル機能であるChatGPT-40とともに発表された、発表イベントでの最大の発表でした。 OpenAI の従業員は音声モードをデモンストレーションし、自然な会話を行いました。
発表時に同社は次のように述べた。「ChatGPT の高度な音声モードは、感情や非言語的な合図を理解して応答することができ、人工知能との自然なリアルタイム会話に近づけます。私たちの使命は、これらの新しい体験を丁寧にお届けすることです。」
プレゼンテーションでは、スカーレット・ヨハンソンが声を担当した仮想パートナーをフィーチャーした SF 映画「 Her 」と音声モードの比較が行われました。女優はすぐに、映画内で自分に似た声を使用したとしてOpenAIを訴えると脅迫した。同社は最終的に、その商品をカタログから削除すると発表した。どうやら、この法的脅迫が延期につながった理由の1つである可能性があります。
Spring Update でデモを行った高度な音声モードのアップデートを共有します。これは非常に楽しみです。
6 月末に ChatGPT Plus ユーザーの小グループにアルファ版の展開を開始する予定でしたが、リリースの目標レベルに達するにはさらに 1 か月かかります。
– OpenAI (@OpenAI) 2024 年 6 月 25 日
AI 企業はリリースを延期するさまざまな理由を述べていますが、その 1 つは、この機能が特定の会話を検出して拒否できるようにすることでユーザー エクスペリエンスを向上させることです。 OpenAIはまた、新しい音声機能の使用を計画している数百万人の会員に対応するためのインフラストラクチャを準備していると述べた。
「たとえば、特定のコンテンツを検出して拒否するモデルの機能を改善しています」とOpenAIは述べた。
ChatGPT ユーザーが不満を表明
ChatGPT Plus ユーザーの一部は、約束された機能を享受できないため、プレミアム サブスクリプションの価値に疑問を抱いていました。一部の批評家は、同社の過大な約束と過小な成果の歴史をすぐに指摘した。
実際、ChatGPT Plus メンバーの中には、プレミアム メンバーシップを終了するのに最適な時期だと示唆している人もいます。別のユーザーは、メンバーシップをキャンセルすることを選択したことを明らかにしました。 AI コミュニティの一部の観察者は、音声モードが数か月以内に利用可能になる可能性があると考えています。
Collins J. Okoth によるクリプトポリタンのレポート