会話フランス語を学ぼうと決心したと想像してください。アプリをダウンロードし、数ヶ月練習し、やがて基礎をマスターします。さて、「Où est la bibliothèque?」(図書館はどこですか?)と言えるようになったまさにその瞬間、突然、自転車の乗り方を完全に忘れてしまうと想像してみてください。
人間にとって、これは奇妙なSF映画のプロットのように聞こえます。私たちの脳は、継続学習において驚くほど優れています。古いスキルを上書きすることなく、新しいスキルを頭の中のツールキットに追加することができるのです。
しかし、人工知能(AI)にとって、これは非常に現実的で、非常に苛立たしい職業病です。機械学習の分野では、この現象は非常に劇的な名前で呼ばれています:破滅的忘却(Catastrophic Forgetting)。
なぜAIは、過去の知識を台無しにすることなく、新しいことを学べないのでしょうか?その答えは、AIの「脳」を構成する繊細で相互接続された数学にあります。
1. ニューラルネットワークには「フォルダ」がない
AIの記憶喪失を理解するには、まずコンピューターの記憶装置についての考え方を捨てなければなりません。
新しいファイルをノートパソコンに保存するとき、それはフォルダに入ります。隣のフォルダにあるファイルには影響しません。何百万枚もの新しい写真を追加しても、古いワード文書は完全にそのまま残ります。
ChatGPTやClaudeのような大規模言語モデル(LLM)には、フォルダもハードドライブも、事実のデータベースもありません。LLMは、パラメータ(または重み)と呼ばれる数字の巨大なネットワークです。AIがインターネット全体で訓練されるとき、それは何十億ものこれらの数字を調整し、人間の言語を予測できる繊細な統計的バランスが形成されるまで続けます。
天井から吊るされた、何十億もの相互接続された糸でできた、巨大で完璧にバランスの取れたモビール(つり下げ飾り)を想像してみてください。
2. 上書き問題
さて、あらゆることを少しずつ知っている標準的なAIを、心臓病学の絶対的な専門家にしたいと決めたとします。何千冊もの医学教科書を読み込ませ、学習させます。
AIがこの新しい医学データを学ぶとき、それはモビールに「新しい糸を追加する」だけではありません。新しい統計的パターンのための場所を作るために、既存の糸を調整しなければなりません。
ネットワークは完全に相互接続されているため、ネットワークの「心臓病学」側を強く引っ張ると、構造全体がずれてしまいます。以前はPythonコードを書いたり、詩を生成したり、チェスをプレイしたりするために完璧に調整されていた数字が、形を歪められてしまうのです。
AIが天才的な心臓病学者になった頃、簡単な俳句を書いてくれと頼むと、医学的な意味不明な文章を出力するかもしれません。新しい知識が文字通り、古い知識を押しつぶして場所を空けたのです。それは自転車の乗り方を忘れてしまいました。
3. なぜ単に脳を大きくし続けないのか?
こう考えているかもしれません:「場所が足りなくなったら、AIを大きくすればいいだけじゃないか!」
残念ながら、大規模なAIモデルを一から訓練するには数千万ドルの費用がかかり、何ヶ月も稼働するGPUの巨大な倉庫が必要です。AIに新しいことを教えたいとき、毎回新しい脳を構築することはできません。
AI開発者は、ファインチューニングと呼ばれるプロセスに依存しています——事前に訓練されたモデルを取り、特定のトピックについて小さな復習コースを与えることです。しかし、このプロセスで新しいデータと一緒に古いデータを混ぜることに非常に注意を払わないと、破滅的忘却がほぼ即座に始まります。
4. どうやって解決するのか?(オープンブックテスト)
モデルを一から再訓練するのは高すぎ、ファインチューニングは破滅的記憶喪失のリスクがあるため、技術業界は主に、見事な回避策に移行しました:RAG(Retrieval-Augmented Generation:検索拡張生成)です。
開発者は、AIの中核となる脳の化学的性質を変えることで新しい情報を記憶させようとする代わりに、AIが読み取るための外部データベースを与えます。
- RAGなし(暗記): AIは医学教科書を学ぼうとし、内部の数字をかき乱し、フランス語の話し方を忘れてしまう。
- RAGあり(オープンブックテスト): AIは全くそのままの状態を保つ。医学的な質問をすると、システムは医学データベースを検索し、関連する段落を見つけ、それをAIに渡し、「この段落を読んで、ユーザーの質問に答えなさい」と言う。
RAGにより、AIは内部の重みを一切変えることなく、会社の非公開人事方針や今日のニュースのような新しいことを瞬時に「知る」ことができます。記憶を標準的な検索エンジンに外部委託することで、記憶喪失問題を完全に回避するのです。
破滅的忘却は、ニューラルネットワークが人間の脳にインスパイアされているにもかかわらず、根本的に異なる物理法則で動作していることを思い知らせる謙虚な戒めです。人間は順応性のある生涯学習者です。AIモデルは、その中核において、訓練された正確な数学の脆弱で凍結されたスナップショットに過ぎません。
研究者が、古い技を落とすことなく新しい技を学ぶ能力——真の「神経可塑性」——をAIに与える方法を解明するまで、これらの優れたスーパーコンピューターは一日を乗り切るためにオープンブックテストを必要とし続けるでしょう。
