机器之心:张拳石教授好,欢迎做客《智者访谈》。要说最近 AI 圈的热点,可能是全球科技界的热点,毫无疑问就是 DeepSeek 了。
DeepSeek-R1 在「深度思考」模式下,会把它的「思考过程」,也就是思维链(Chain-of-Thought, CoT)以文字的方式展示出来。这不仅大幅提升了用户的体验,也让模型的可说明性再一次成为关注的焦点。实际上,深度学习可说明性作为研究方向,在学界一直备受重视。它不仅关乎 AI 的应用,尤其是在医疗、自动驾驶等对于安全和可靠性极度敏感的行业的应用,更事关深度学习成为一门科学的基础。
您钻研深度学习的可说明性多年,并且开创了新的理论,也即使用数学的、严谨的、符号化的方式去说明深度神经网络的内在表征,可以说是对传统观点的一种挑战。非常高兴与您一同探讨 AI 可说明性这个话题。
具体来说,对于一个包含 n 个输入 token 的句子,存在 2n 种遮挡状态。大家证明,任何神经网络在这 n 个 token 上的输出置信度,都可以用符号化的「与或图模型」精确拟合。
「与或图模型」包含「与交互」和「或交互」的结构。以 “he is a green hand” 这个句子为例,“green hand” 就体现了「与交互」,它并非「绿颜色的手」,而是「新人」,这句话的意思是 “他是一位新人”。这种情况下,单个词的效用与两个词共同产生的效用,是 1 + 1 大于 2 的,也即涌现出新的意义,对输出结果的置信度会产生一个数值效应,比如说 0.2,当去掉 green 或 hand 任意一个,这个 0.2 得分就会消失。