AI失忆症:为何向大型语言模型传授新知识会使其遗忘旧识

Catastrophic Forgetting

想象一下,你决定学习法语会话。你下载了一个应用,练习了几个月,最终掌握了基础知识。现在,想象一下,就在你终于学会说“Où est la bibliothèque?”(图书馆在哪里?)的那一刻,你突然完全忘记了如何骑自行车。

对人类来说,这听起来像是离奇科幻电影的剧情。我们的大脑极其擅长持续学习。我们可以在心智工具箱中添加新技能,而不会覆盖旧的。

但对人工智能而言,这是一个非常真实、非常令人沮丧的职业风险。在机器学习领域,这种现象有一个极具戏剧性的名字:灾难性遗忘

为什么AI就不能在不摧毁过去所学的情况下学习新东西呢?答案在于构成AI”大脑”的精密、相互关联的数学结构。


1. 神经网络中没有”文件夹”

要理解AI的健忘症,我们首先必须摒弃对计算机存储的惯常思维。

当你将新文件保存到笔记本电脑时,它会进入一个文件夹。这不会影响旁边文件夹里的文件。你可以添加一百万张新照片,而旧的Word文档将完好无损。

像ChatGPT或Claude这样的大型语言模型没有文件夹、硬盘驱动器或事实数据库。LLM是一个由数字组成的巨大网络,这些数字被称为参数(或权重)。当AI在整个互联网上进行训练时,它会调整这数十亿个数字,直到它们形成一个精密的统计平衡,能够预测人类语言。

可以把它想象成一个从天花板上悬挂下来的、由数十亿条相互连接的细线构成的、完美平衡的巨大动态雕塑。

2. 覆盖问题

现在,假设你有一个对各方面都略知一二的标准AI,你决定要把它变成心脏病学的绝对专家。你给它输入成千上万的医学教科书,让它学习。

当AI学习这些新的医学数据时,它并不是简单地在动态雕塑上”添加一条新线”。它必须调整现有的线,以便为新的统计模式腾出空间。

因为网络是完全互联的,大力拉动网络”心脏病学”这一侧会导致整个结构发生偏移。那些先前被完美调校用于编写Python代码、创作诗歌或下棋的数字会变得扭曲变形。

等到AI成为心脏病学天才时,你可能要求它写一首简单的俳句,而它输出的却是医学胡话。新知识字面上压垮了旧知识以腾出空间。它忘记了如何骑自行车。

3. 为什么不直接让大脑继续生长?

你可能会想:“如果空间不够,就把AI做大一点!”

不幸的是,从头开始训练一个庞大的AI模型需要数千万美元,并且需要大量GPU仓库运行数月。你不能每次想教AI一个新技能时都重新建造一个大脑。

AI开发者依赖一个称为微调的过程——取一个预训练模型,就特定主题给它一个小的复习课程。但在此过程中,如果他们不够极其小心地将一些数据与数据混合在一起,灾难性遗忘几乎会立即发生。

4. 我们如何解决?(开卷考试)

由于从头开始重新训练模型成本太高,而微调又有灾难性遗忘的风险,科技行业已经很大程度上转向了一个巧妙的变通方案:RAG(检索增强生成)

开发者不是通过改变AI的核心”大脑化学”来强迫它记住新信息,而是给AI一个外部数据库供其读取。

  • 没有RAG(死记硬背): AI试图学习一本医学教科书,扰乱了其内部数字,结果忘记了怎么说法语。
  • 有RAG(开卷考试): AI保持原样。当你提出一个医学问题时,系统会搜索医学数据库,找到相关段落,交给AI,并说:“读这段文字,然后回答用户的问题。”

RAG使AI能够即时”知道”新事物——比如你公司的私人人力资源政策或今日新闻——而无需改变其内部权重。它通过将记忆外包给标准搜索引擎,完全绕过了遗忘问题。


灾难性遗忘是一个发人深省的提醒:神经网络尽管受人类大脑启发,但其运作基于根本不同的物理原理。人类是适应性强的终身学习者。而AI模型,究其核心,是其训练时所依据的精确数学的脆弱、冻结的快照。

在研究人员找到方法赋予AI真正的”神经可塑性”——即学习新技能而不丢弃旧技能的能力——之前,这些卓越的超级计算机仍将需要依靠开卷考试来度过每一天。