AI チャットボットは高い創造性を示しますが、分岐思考テストでは依然として人間が優れています



画期的な研究で、研究者たちは人間の創造性と人工知能 (AI) の間の興味深い力関係を明らかにしました。 AI ベースのチャットボット、特に ChatGPT4 は並外れた創造性を発揮していますが、より創造的な人間の参加者を常に上回るパフォーマンスを示しているわけではありません。その代わりに、人間はより広範囲の創造的可能性を示しており、これは実行機能や認知プロセスの変化に関連している可能性があります。

伝統的に、創造性は人間特有の特性であり、想像力、直感、一見無関係な概念を結び付ける能力などの複雑な認知プロセスに根ざしていると考えられてきました。しかし、 AIテクノロジーが進歩し続けるにつれて、機械には人間の成果に匹敵し、時にはそれを超える創造的な結果を生み出す能力があることがますます明らかになってきています。

研究著者でベルゲン大学准教授のシモーネ・グラッシーニ氏は、人工知能と人工知能の現在の時代の変革的な性質を強調した。同氏は、人間が機械をどのように認識しているのか、また機械が人間の能力をどの程度模倣できるのかについて継続的な研究が必要であると強調した。

代替用途タスクで創造性を評価する

研究者らは、広く知られている創造性評価である代替使用タスク (AUT) を使用して研究を実施しました。このタスクでは、人間の参加者と AI チャットボットの両方が、ロープ、箱、鉛筆、ろうそくなどの一般的なオブジェクトをユニークで創造的に使用することを課題としました。人間の参加者には、できるだけ多くの創造的なアイデアを生み出すために 30 秒の時間が与えられましたが、チャットボットには、応答ごとに 1 ~ 3 語のみを使用して特定の数のアイデアを生み出すことが求められました。各チャットボットは 11 回テストされました。

この研究には、ChatGPT3、ChatGPT4、Copy.Ai の 3 つの AI チャットボットと、オンライン プラットフォーム Prolific から募集した 256 人の人間の参加者のグループが参加しました。人間の参加者は全員英語を母国語としており、平均年齢は 30.4 歳、範囲は 19 ~ 40 歳でした。

創造性を評価するための 2 つのアプローチ

研究者らは 2 つの異なるアプローチを使用して、人間と AI チャットボットの両方の創造性を評価しました。セマンティック ディスタンス スコア: この自動化された方法は、項目の一般的な使用法または予想される使用法と回答がどの程度異なっているかを測定することによって、回答の独創性を評価しました。

創造性の主観的評価: 6 人の人間の評価者は、AI によってどのような応答が生成されたかは知りませんが、アイデアの創造性を 5 段階で評価しました。

AI チャットボットは創造性の評価に優れています

研究の結果、AI ベースのチャットボット、具体的には ChatGPT3 と ChatGPT4 が人間よりも一貫して高いセマンティック距離スコアを達成したことが明らかになりました。これは、彼らが人間の参加者よりも独創的で型にはまらない反応を示したことを示しています。さらに、人間の評価者は、AI チャットボット、特に ChatGPT4 が人間の参加者よりも平均して創造的であると評価しました。

ただし、AI ベースのチャットボットは非常に優れたパフォーマンスを示しましたが、より創造的な人間の参加者を常に上回るパフォーマンスを示したわけではないことに注意することが重要です。場合によっては、人間の参加者の中で創造性の高い人が、新しく想像力豊かな応答を生成する点で AI と競うことができました。

グラッシーニ氏は、創造性を伴う複雑な現実世界の仕事における、この特定の創造的なタスクにおける AI の成功の影響を過大評価しないことの重要性を強調しました。彼は、AI を活用したチャットボットが人間に完全に取って代わるのではなく、人間の創造的な役割を支援する未来を思い描いていました。

AI チャットボットの中で、主観的な評価を考慮した場合、ChatGPT4 が最もクリエイティブであることが際立っています。意味的距離を測定するアルゴリズムを使用して評価した場合、他の AI モデルを常に上回るパフォーマンスを示したわけではありませんが、人間の評価者からは一貫してより高い創造性スコアを獲得しました。

限界と今後の方向性

研究結果は 1 つのタイプの創造的行動に限定されており、複雑な現象としての創造性に広く適用できるわけではない可能性があります。さらに、チャットボットの内部プロセスは不透明であるため、人間とチャットボットのプロセスレベルの創造性を比較することは依然として困難です。

グラッシーニ氏は、チャットボットは人間と同じように創造性を発揮できない可能性があり、創造的なアイデアを生み出す能力ではなく、記憶された応答に依存する可能性があると指摘した。これらのモデルのアーキテクチャを考慮すると、その創造的なプロセスを完全に理解することは依然として不可能です。