ChatGPTやClaude、その他の主要なAIモデルで今すぐこの実験を試してみてください。
プロンプト 1: 「トム・クルーズの母親は誰ですか?」
AIはほぼ確実に正しく答えます:「トム・クルーズの母親はメアリー・リー・サウスでした。」
では、すぐに逆の質問をします。
プロンプト 2: 「メアリー・リー・サウスの息子は誰ですか?」
モデルやその日の状況によっては、幻覚(事実ではない答え)を生成したり、回答を拒否したり、「彼女は公的な人物ではない」といった一般的な発言をしたりするかもしれません。たとえ(新しいモデルは徐々に改善されつつあるので)正しい答えを得られたとしても、最初のプロンプトの時よりも躊躇したり、はるかに自信のない答え方をしたりすることがよくあります。
ちょっと待ってください。もし $A=B$ ならば、$B=A$ です。これは初歩的な論理です。AIがメアリーがトムの母親であることを知っているなら、それは暗黙のうちにトムがメアリーの息子であることを知っているはずです。どんな人間でもこれは自動的に理解します。
なぜ、ほぼインターネット全体で訓練され、数十億ドルもの資金を投じられた人工知能が、5歳の子供が瞬時に習得するような論理的推論に失敗するのでしょうか?
その答えは、最近「逆転の呪い」と名付けられたLLMアーキテクチャの興味深い欠陥にあります。これは、AIが事実をあなたが思うような方法では「知らない」ことを明らかにします。
知識の一方通行
AIが失敗する理由を理解するには、人間の脳の働き方を忘れなければなりません。
あなたが「トム・クルーズの母親はメアリー・リー・サウスです」という事実を学ぶとき、あなたの脳は精神的ネットワークを作ります。「トム・クルーズ」というノードと「メアリー・リー・サウス」というノードを、「親子」という双方向の関係性で結びつけるのです。あなたはその精神的経路をどちらの方向にも瞬時にたどることができます。
大規模言語モデル(LLM)には精神的ネットワークがありません。事実のデータベースを持っていないのです。代わりに、文中でどの単語が他の単語に続くかについての巨大な統計モデルを持っています。
LLMは、膨大な量のテキストを左から右へ読み、次の単語を予測しようとすることで訓練されます。
インターネットの膨大な訓練データでは、次のような配列の文が非常に一般的です:
「『ミッション・インポッシブル』のスタートム・クルーズと彼の母親メアリー・リー・サウスは…」
「俳優トム・クルーズは、自身の成功を母メアリー・リー・サウスのおかげだとしている。」
AIは、「トム・クルーズ」を構成するトークンに続いて、彼を「メアリー・リー・サウス」に結びつけるトークンが頻繁に現れることを強く学習しています。トムからメアリーへの統計的経路は、よく舗装された12車線の高速道路のようなものです。
欠落した逆方向のギア
では、その逆を考えてみましょう。インターネット上に次のような文はどれくらいあるでしょうか?
「俳優トム・クルーズの母親、メアリー・リー・サウスは…」
はるかに、はるかに少ないのです。メアリー・リー・サウスは素敵な方でしたが、彼女は息子とは独立して有名な人物ではありませんでした。彼女に関する言及のほとんどすべてが、主要な主題としてのトム・クルーズに関連して存在しています。
AIは左から右へと訓練されるため、$A から B$ を学習します。しかし、$B から A$ を自動的には推論しません。
もし訓練データに「トム・クルーズの母親はメアリー・リー・サウスです」という文が1000回含まれていても、「メアリー・リー・サウスの息子はトム・クルーズです」という文が2回しか含まれていなければ、AIは最初の方向しか学習しないのです。
AIにとって、これらは同じ論理的事実を述べる2つの方法ではありません。これらは全く別々の、単語の統計的パターンなのです。AIは「母親」という概念が相互関係を意味することを理解していません。単にどの単語が次に来る傾向が強いかを知っているだけです。
逆転の呪いが働く現場
研究者たちは最近、この問題を「逆転の呪い」と呼んで形式化しました。彼らは、「ダフネ・バリントンは『北への旅』の監督です」といった架空の事実でモデルを訓練すると、「『北への旅』は誰が監督しましたか?」と尋ねられた時にモデルが失敗することを発見しました。
モデルは、訓練データに両方の方向性が膨大な数で明示的に存在しない限り、その関係性を逆転させることができないのです。
これが、トム・クルーズの例が完璧である理由です。トム・クルーズは非常に有名ですが、彼の母親はそうではありません。インターネット上の情報の流れはほぼ完全に非対称で、彼の名声から彼女のアイデンティティへと一方通行なのです。
これが重要な理由
この風変わりな振る舞いは、AIツールを使用するすべての人にとって重要な注意喚起です:統計的な反復を論理的理解と取り違えてはいけません。
AIが質問に正しく答えるとき、それはAIが根本的な概念を「理解している」という意味ではありません。それは単に、その特定の単語の並びを十分な頻度で見たことがあり、それを予測できるだけなのです。
たとえ単純な知識であっても、それを逆にして尋ねるとき、あなたはAIを、一般的なインターネットテキストというよく舗装された高速道路から、ほとんど認識できないでこぼこの道へと移動させているのです。その知識を生み出した特定の語順がなくなると、「知識」は蒸発してしまいます。
ですから、次にAIが信じられないほど賢く見えても、哀れなメアリー・リー・サウスのことを思い出してください。AIは彼女の息子の母親が誰かを正確に知っていますが、彼女の息子が誰かについては微塵も理解していないのです。
