有名な ChatGPT などの言語モデルの使用は社会内でますます一般的になり、モデルはますます優れています。 ChatGPT のリリース以来、 OpenAI はすでに古いバージョンよりも優れた新しい更新バージョンをテストしてきました。最近、同社は GPT-4 を利用可能にしました。これは、他のバージョンと比較してさらに優れたパフォーマンスを備えています。
モデルは会話や質問に答えるのがとても上手なので、まるで別の人間と話しているかのような印象を与えることがあります。人工知能が人間になりすまし、他の人間を欺くことができるかどうかをテストするテストはチューリング テストと呼ばれます。このテストは、思考機械について論じた有名な 1950 年の論文でアラン チューリングによって提案されました。
サンディエゴ大学の研究者らによる新しい研究は、GPT-4 言語モデルがチューリング テストに合格すると結論付けました。彼は人間になりすまして他の人間を欺くことができるでしょう。このグループは、GPT-3 を含む 3 つの言語モデルをテストし、グループの人々に各モデル、または知らずに 1 人の人物と 5 分間対話してもらいました。
1950年の記事
1950 年、アラン チューリングは有名な論文「コンピューティング機械とインテリジェンス」を発表し、これはコンピュータ サイエンスで最も重要な論文の 1 つになりました。記事の冒頭で、彼は機械が考えることができるかどうかという疑問から始め、人工知能の可能性についての議論を始めています。この記事は、人工知能の探求における出発点の 1 つとみなされます。
この記事の重要なポイントの 1 つは、チューリングが機械思考の可能性について掘り下げた議論です。この記事には非常に深い哲学的アプローチが含まれています。これは主に、機械がパターンを通じてどのように学習できるかについての議論で注目を集めています。パターンによる学習は、今日の機械学習の基礎です。
チューリングテスト
記事の中には、チューリング テストとして知られるようになったテストの提案もあります。このテストの背後にある考え方は、機械が人間になりすまして他人を欺くことができるかどうかを評価することです。尋問者にテキスト メッセージを通じて別の人間と話していると信じ込ませる。マシンがこのテストに成功した場合、そのマシンはインテリジェントであるとみなされる可能性があります。
その後数十年間でテストは勢いを増し始め、研究者や企業がマシンをテストに持ち込むコンテストがいくつか開催されました。チューリング テストのアプリケーションの 1 つは、Web サイトでボットの可能性を見つけるために使用される CAPTCHA ( Completely Automated Public Turing test to Tell Computers and Humans Apart ) です。
言語モデル
言語モデルは、テキストを理解し、作成し、対話するためにトレーニングされたモデルです。最も有名な例は、ある言語から別の言語に翻訳することを学ぶモデルです。その考え方は、言語モデルがテキストである場合もそうでない場合もある入力を受け取り、テキストまたは文章で応答を返すというものです。専門分野は自然言語処理 (NLP) と呼ばれます。
現在、言語モデルは高度であり、質問に答えたり、テキストを要約するなどのタスクを実行したりするなどの会話を維持できます。これらの現在のモデルのほとんどは、ニューラル ネットワークとトランスフォーマーと呼ばれる技術に基づいています。彼らは大量のテキストを使ってトレーニングされており、パターンを見つけ、テキストを解釈し、タスクを実行できます。
どのモデルがテストに合格しますか?
現在の言語モデルを考慮して、サンディエゴ大学の研究者グループは、GPT-3.5 と GPT-4 をチューリング テストの対象にすることを提案しました。このグループのアイデアは、人々にテキストを通じて個人と 5 分間チャットしてもらうことでした。これらの個人は、実際の人物であるか、テストされている言語モデルである可能性があります。
この論文では、GPT-4 は半分の確率で人々を騙すことができたと結論付けています。テストを確認するために、グループはチャットボット Eliza も使用しました。このチャットボットのパフォーマンスは約 22% でした。したがって、この研究は、GPT-4 はチューリングテストに合格したであろうが、ほとんどの場合、人間は依然として他の人間をよりよく識別できると結論付けています。
GPT-4
GPT-4 は、ChatGPT を強化する言語モデルの更新バージョンです。これらのモデルは OpenAI 社によって作成され、第 4 世代になります。最近、OpenAI は、ChatGPT が GPT-4o と呼ばれる GPT-4 のさらに最適化されたバージョンをモデルにすることを発表しました。最大の違いの 1 つは、GPT-4 ではより長く、よりまとまりのあるテキストを作成できることです。
さらに、 ChatGPT には、インターネットを検索して現在の質問に答えることができるインターフェイスもあります。これは、ChatGPT の導入時に最初に使用されたものの 2022 年までしか情報がなかった GPT-3 と比較すると進歩です。
ニュース参照:
ジョーンズ&バーゲン 2024 チューリングテストではGPT-4と人間を区別できないarXiv




