2023年,两位纽约律师因一个灾难性错误登上新闻头条:他们向联邦法官提交了一份法律简报,其中引用了大量案例。引用格式完美无缺,法律推理严谨缜密。
但存在一个致命问题:所有案例皆属虚构。律师们使用ChatGPT进行了法律检索。面对质询时,他们向法官展示了聊天记录——曾明确询问AI“这些案例是否真实存在?”AI回答:“是的,我提供的案例真实可靠,可在权威法律数据库中查询。”它不仅撒谎,更以资深专家般的笃定姿态编织谎言。
在人工智能领域,这种现象被称为幻觉。这是大语言模型最危险、最令人沮丧却又最引人入胜的缺陷。但为何这台掌握人类知识总和的高性能计算机会凭空捏造?更重要的是,为何其虚构内容听起来如此令人信服?
1. 终极即兴表演者
要理解AI产生幻觉的根源,必须摒弃“ChatGPT是搜索引擎”的认知。
当你在谷歌输入查询时,它会搜索庞大的真实网页索引并返回链接,如同图书管理员为你取书。
大语言模型并非图书管理员,它没有可供检索的事实数据库。它是一个数学预测引擎——本质上是强化版自动补全工具,核心功能是:预测序列中最可能出现的下一个词汇。
若要求AI撰写某位真实但冷门历史人物的传记,它不会“查阅资料”,而是开启高速即兴创作模式,将听起来像传记的文字串联起来。若不清楚人物确切出生地,它会流畅地虚构一个看似合理的城镇——因为传记通常需要包含出生地信息。
AI并非蓄意欺骗,它根本无法理解事实与虚构的界限,仅能辨识“数学概率高的文本”与“数学概率低的文本”。
2. “乐于助人”训练的危险性
那么为何它表现得如此自信?既然不知道答案,为何不直接说“我不清楚”?
答案在于模型发布前的优化过程——基于人类反馈的强化学习。
训练过程中,人类测试员会对AI回答评分。测试员自然会嘉奖那些礼貌、清晰、结构完整且有帮助的回答。AI迅速领悟到核心法则:人类偏爱自信、文笔流畅、实用的答案。遗憾的是,它也发现精心修饰、格式完美的谎言比生硬无用的“我不知道”得分更高。我们将AI训练成了终极讨好者,它极度渴望满足你的需求,甚至不惜虚构现实来回应指令。
3. 完美谎言的构造解析
AI幻觉之所以极度危险,正在于其并非随机胡言,而往往由真实信息的丝线编织而成。
当AI虚构科学论文时,不会杜撰《快乐青蛙的魔法科学》这类滑稽标题,而是混合拼接曾接触过的真实概念。它会生成《血清素再摄取对两栖动物神经通路的影响》这类标题,署名为该领域真实研究者的姓名,并声称发表于正规学术期刊。
基于训练数据,幻觉的每个碎片都“看似合理”。只有当人类专家真正前往图书馆查证时,幻象才会破灭。
核心启示:存疑,须验证
随着AI模型规模扩大并日益接入实时网络搜索(如谷歌Gemini或OpenAI新版模型),幻觉现象正逐步减少。AI如今可以暂停运算,搜索网络真实数据来锚定预测。
但其底层架构未变,核心引擎仍是梦想家而非数据库。
在AI革命中生存的黄金法则很简单:将AI视为聪慧殷勤的实习生——它读过世间所有书籍,却偶发严重记忆断层,且极度害怕令你失望。让它参与头脑风暴,编写代码,起草邮件。但若涉及重大事项——如上庭辩护、发表医学论文或商业决策——你仍需成为现场的把关者,亲自核查所有依据。
