ChatGpt 3.5 ではもう十分ではないため



ChatGpt 3.5 ではもう十分ではないため

ここ数週間、名門スタンフォード大学とバークレー大学が署名した論文が議論を巻き起こし、提供される回答の質の点で ChatGpt は悪化していると結論付ける人もいます。 The Vortex創設者、アンドレア・ボスカロの介入

チューリング テストは、現代コンピューター サイエンスの父の 1 人である英国の数学者アラン チューリングによって 1950 年に提案された実験です。これは、機械が人工知能の一定のしきい値に達したかどうかを評価するために提案された最も有名な基準の 1 つです。裁判官が人間の対話者と機械を確実に区別できない場合、後者はチューリング テストに合格したことになります。 GPT (Generative Pre-trained Transformer) で定義された言語モデルを利用するツールが、チューリング テストだけでなく、昨年 11 月のChat GPT の出現以来、研究を続けてきた人々の期待にも見事に合格したことは疑いの余地がありません。あなたに近づきました。

しかし、ここ数週間で、名門スタンフォード大学とバークレー大学が署名した「 ChatGPT の動作は時間の経過とともにどのように変化しているのか?」というタイトルの記事が発表されました。これはいくつかの議論を引き起こし、チャット GPT が提供する回答の質が悪化していると結論付ける人もいます。

しかし、Lamini の CEO である Sharon Zhou のような人は、Chat GPT を管理する会社である OpenAI は、いわゆる「専門家の混合」アプローチを単純に利用しているため、入力された質問に応じて手段を講じていると考えています。から 16 の「ミニ GPT-4」まで、それぞれが訓練された情報のコーパスにより、正確な分野に特化しています。おそらくこの理由から、Chat GPT の有料版では、購読ユーザーの優先的な使用状況を明確に理解できるように「カスタム指示」が導入されました。

私たちの社会の経済システムや訓練システムにおいて、さまざまなレベルで人工知能の導入が行われているこのような段階でテストを実施することが正当であるならば、しかし、それをブランド化することはまったく無意味であることを繰り返し言わなければなりません。ツールがこのツールを「愚か」であると評価するのは、まさに彼の知性が専門用語の意味でのみ考慮されるべきであるためです。実際、これらのモデルは数学的ではなく、統計的です。プログラムされたルールから開始する電卓とは異なり、これらのモデルはむしろ「テキスト予測子」であり、確率的基準に基づいて答えを提供するようにトレーニングされた情報のコーパスから開始されます。この性質は、システムが引き起こす可能性のある「幻覚」を説明しており、集合的な形で時間の経過とともに評価することしかできません。

よく知られている制限を克服するために、Chat GPT の有料バージョンは、無料バージョンに存在する 3.5 バージョンの代わりに GPT-4 バージョンを採用しており、サードパーティのプラグインとの統合により改善されました。たとえば、Wolfram Alphaプラグインを使用して質問を作成すると、この恐るべき計算検索エンジンの精度を利用して、数学、物理学、化学だけでなく歴史や経済などの分野でも正しい答えを得ることができます。したがって、Chat GPT との統合により、情報の精度と言語モデルの構文が結合されます。

これらのプラグインは、回答の精度を向上させるだけでなく、GPT Chat が正確に回答できる質問の範囲を広げます。たとえば、最近の GPT-4 へのコード インタープリターの統合のおかげで、マルチモーダル プロンプトを作成できるようになりました。つまり、ユーザーは画像、スプレッドシート、ドキュメントを添付した質問をして、画像やグラフだけで構成される出力を取得できます。 、だけでなく、その詳細を導いた推論からも。

要約すると、コード インタープリターのようなプラグインを GPT-4 に統合することで、AI の適応性と能力が向上します。これらのツールを使用することで、GPT-4 はより正確で関連性の高い回答を提供できるだけでなく、新しく革新的な方法でユーザーと対話することもでき、全体的なエクスペリエンスを豊かにし、これまで以上に幅広い可能性を提供します。

GPT-4 の機能を拡張するプラグインはコード インタープリターだけではありません。追加の貴重な機能を提供するツールは他にもあります。これらの一部では GPT-4 がオンラインで閲覧できるため、応答が最新の情報で更新されます。ただし、他のプラグインは特殊な機能を追加し、モデルがテキスト生成以外のタスクを実行できるようにします。たとえば、米国では、Instacart と GPT-4 を統合するプラグインを使用することで、レシピを受け取るだけでなく、Instacart を使用して必要なすべての材料を直接購入することができます。 Chat GPT を旅行ガイドとして使用したい場合は、Kayak との統合によりオンラインで直接予約できます。利用可能な何百ものプラグインの中から、Golden との統合により、経済と金融に関連するさまざまなトピックに関する最新の回答が提供されます。株式市場のパフォーマンスを追跡する場合でも、最新の経済ニュースを把握する場合でも、Golden は GPT-4 を常に最新の情報を入手したい人にとって貴重なリソースとしています。

これらのプラグインを GPT-4 に統合することは、人工知能の進化における大きな前進を意味します。これは GPT-4 をより便利で多用途にするだけでなく、AI の将来の可能性も示しています。AI が単に質問に答えるツールではなく、日常のさまざまな活動を支援できるユビキタスなパーソナル アシスタントとなる未来です。 。

いずれにせよ有料版を購入したくない場合は、ここ数カ月間に登場した多くのツールの中でも、Bing.com と Perplexity.ai が有効な代替手段となります。そのハイブリッドな性質により、答えを与える AI ツールですが、また、最新の情報を利用し、使用した情報源を示す研究も含まれます。

ここ数カ月、人工知能に関する公の議論は、人工知能をゲームと考えるか、それとも黙示録への第一歩と考えるかの間で揺れ動いてきた。人工知能の性質、限界、機会を理解することは、人工知能の使用法を評価し、より意識的に毎日の生産性に導入するのに役立つだろう。そしてビジネスや組織の発展においても。


これは、Mon, 14 Aug 2023 05:37:28 +0000 の https://www.startmag.it/economia-on-demand/perche-chatgpt-3-5-non-e-piu-sufficiente/Start Magazine に公開された記事の自動翻訳です。