谷歌发布了AlphaEvolve,一款引人注目的全新系统。这款系统在众多突破中,尤为突出地优化了一个困扰人类60年的著名数学难题的解法。
AlphaEvolve很特别,它或许很快会被比肩AlphaGo,和奠定现代人工智能基石的Transformer架构的发现,堪称人工智能领域的里程碑。
更重要的是,这款人工智能系统让我们不得不正视一个看似无可辩驳的事实:人工智能在科学发现中的应用可能是其最重大的贡献,而这一贡献,颇具讽刺意味的是,或许并不需要人工智能本身具备“智能”。

在充斥着虚假专家和晦涩术语的世界中,第一性原理分析与人工智能通常难以兼容。但在这里,它们却相得益彰。
人工智能与科学发现在人工智能行业中,鲜有人比谷歌DeepMind首席执行官戴密斯·哈萨比斯更具影响力。凭借AlphaFold——一款能够根据氨基酸序列生成蛋白质折叠结构的人工智能,他荣膺诺贝尔化学奖。他始终强调,人工智能最重要的应用场景是助力科学发现。
不是对话型人工智能助手,也不是编程代理,而是作为发现的工具。
AlphaEvolve正是这一愿景的最新结晶。
简而言之,AlphaEvolve是一个迭代搜索系统,它利用大型语言模型(LLMs,如Gemini)对代码进行迭代,探索给定开放性问题的新解法。
这是一个编排系统,接受人类设定的任务,运用大型语言模型或一组模型提出代码修改建议,评估修改质量并不断调整,形成一个递归自优化的循环,带来了令人瞩目的成果。
实例解析为了阐明这一点,我们来看一个实际案例。在介绍AlphaEvolve时,我提到它优化了一个近60年(确切地说是56年)未有突破的开放性问题。
这个问题涉及矩阵乘法,即寻找以最少计算量尽可能快速执行矩阵乘法的方法。
在AlphaEvolve出现之前,这一领域的桂冠属于1969年开发的Strassen算法。该算法通过巧妙的递归技巧,将矩阵乘法的计算量从朴素方法的64次减少到49次。
如今,AlphaEvolve将4×4复数矩阵的乘法计算量进一步降低至48次,这是56年来首次有新算法超越Strassen算法。
如果你不是数学爱好者,可能会觉得“这又如何?”我完全理解。但如果你了解内情,就会知道矩阵乘法无处不在。更重要的是,它是生成式人工智能的核心数学操作。
事实上,可以毫不夸张地说,ChatGPT的本质就是一堆矩阵乘法。
因此,加速矩阵乘法是一个备受深入研究的课题,而AlphaEvolve的突破再次证明了人工智能超越了人类的能力。
而这一切的幕后推手,再次是谷歌。令人意外的是,这家公司的市盈率在所有科技巨头中最低,甚至低于标普500的平均水平!
但AlphaEvolve的贡献远不止于加速矩阵乘法。
AlphaEvolve被应用于50个已知的数学开放性问题,这些问题都被认为是“最优解”(如Strassen算法的49次乘法,被认为是特定问题下的最佳构造)。
结果令人叹为观止:
在75%的问题中,AlphaEvolve至少达到了此前公认的最优结果,与现有最佳表现持平。在20%的问题中,AlphaEvolve创造了新的最优解。例如,谷歌利用AlphaEvolve优化了人工智能建模,通过改进矩阵分解为更小单元(称为“瓦片”)的方式,加速了矩阵乘法,带来了23%的速度提升,这对其自身的人工智能训练意义重大。
这一切无疑证明了人工智能在科学发现中的巨大潜力,用OpenAI首席执行官萨姆·奥特曼的话说,就是“推开无知的面纱,拓展发现的边界”。
但对我而言,AlphaEvolve的意义远超内核加速或减少矩阵乘法次数。它让我重新思考我们构建人工智能的目标。
无需“理解”即可“发现”当我们试图定义人工智能达到“通用人工智能”(AGI)或“超人类”水平时,总是以人类智能为锚点,潜意识里认为人工智能必须模仿人类智能才能称得上“智能”。
但果真如此吗?
戴密斯·哈萨比斯,一位神经科学家出身的研究者,长期以来挑战这一观点,而AlphaEvolve让我终于理解了他的深意。
要理解这一点,我们首先要承认人工智能的局限性:人工智能无法推理未知的事物,也无法提出未见过的内容。这是毋庸置疑的。
但如果它们不知道自己不知道什么,又如何能发现新事物呢?
答案很简单:通过搜索。AlphaEvolve的创造者们并未执着于人工智能的短板,而是聚焦于它们的优势——它们或许不知道未知,但知道如何发现未知。
用研究者的话说,AlphaEvolve的关键创新在于进化启发式搜索代码,而非直接进化发现本身。
这话听起来玄乎,究竟是什么意思?
想象一位厨师想要发明热量最低的食谱。
与其直接创造新菜肴(受限于已有知识),厨师构建了一个系统,设定一些启发式规则,如“每餐必须包含蛋白质、碳水化合物和健康脂肪”。这个自动化系统尝试不同的食材组合,测试结果,检查热量是否降低,然后调整搜索系统以进一步优化。
随着时间推移,系统学会了“减少脂肪通常能降低热量”之类的规律。于是,它更新自身,优先选择这些选项进行下一轮尝试。
最终,系统得出了一份不仅厨师本人,甚至全人类从未想过的食谱。更重要的是,连人工智能本身也不知道最终结果会是什么!
AlphaEvolve正是这样的系统,只不过它服务于数学和科学。
关键在于,人类并未干预这一搜索过程或搜索算法的优化,这完全是人工智能驱动的。
这就是核心启示:即使人工智能完全不知道最终结果是什么,它也能优化寻找结果的算法。
换句话说,AlphaEvolve中的大型语言模型并未直接提出具体的新解法(因为新解法显然不在其训练数据中),而是迭代优化搜索解法的代码。
这是一个极其巧妙的策略:
我们知道大型语言模型无法凭空创造新解法,但它可以调整寻找解法的搜索算法。它无需理解解法,就能发现解法。用更简单的语言表述:
大型语言模型不知道答案,但它知道如何编写可能找到答案的代码。
这就是我想传递的关键洞见:我们一直痴迷于让机器变得和人类一样聪明,具备适应性、序列化多步推理能力(如o3模型),以及第一性原理思考能力。
然而,人工智能历史上从未出现过模型能够超出其分布泛化的案例。
泛化:唯一的局限
历史上每一个人工智能模型的预测都完全基于它已见过的数据。
更严谨地说,人工智能所做的每一个“新事物”都是“已知”之间的组合插值。
我常举的例子是莎士比亚的iPhone诗。人工智能可以创作这样的诗,即便训练数据中不存在这类诗作,因为它能结合对莎士比亚诗歌和iPhone的知识。
但它能创造一种全新的诗歌形式,或设计一款全新的硬件产品吗?不能。
简单来说,如果不知道该做什么,人工智能就无能为力。
但问题在于:如果我们并不需要人工智能做到这一点呢?如果我们只需要它们去搜索呢?
搜索?搜索什么?
当人类不知道该做什么时,我们会寻找解决方案。与人工智能不同的是,我们能与环境互动,实时适应,并从新经历中学习。这是人类智能的基本原理。
因此,我们的搜索并非随机的。我们拥有直觉(即社会所谓的“常识”),这不过是基于过往经验的模式识别,实时缩小搜索范围。
但什么是直觉引导的搜索?
假设你在家里丢了车钥匙。你不会随机翻找每个角落(暴力搜索),而是先检查夹克口袋、厨房台面或玄关桌。
为什么?
因为你的直觉(基于经验的模式识别)告诉你,这些地方最有可能。这就是人类的搜索:受限、有据、高效,因为我们无法负担无尽的搜索。
人类的解法选择至关重要,因为我们受限于能量,必须快速思考、迅速行动。这是进化中的必然需求(例如,我们的祖先遇到狮子时必须迅速反应以求生)。
因此,谷歌本质上证明了:人工智能无需理解或知道某事物,就能发现它。
这是一条“非人类”的科学发现路径,而且它行之有效。
但为何称其为“非人类”?
如前所述,人类受限于能量、单一大脑和串行思维,搜索多种解法的能力极为有限。因此,我们进化出极为精明的候选选择能力。
人工智能则不受此限制,因此目标并非打造具备人类直觉的人工智能,而是实现“可扩展”的搜索。即找到一个“足够好”的搜索系统,然后投入大量算力。
AlphaEvolve正是这一理念的绝佳例证:它可能并不理解自己所做的许多发现,但依然做出了这些发现!
我们的目标或许错了人工智能无需理解即可发现;无需“智能”即可做出“智能发现”;它们只需要足够的算力和足够好的启发式规则。
用更悲观的视角看,人工智能的集体“愚笨智能”可能通过暴力搜索,超越更聪明却更受限的人类智能。
我不知道是否该称之为“新型智能”,但我终于理解了为何一些研究者质疑追求人类智能的必要性。这或许是一条歧路(也可能不是),但关键在于,即便没有人类水平的智能,人工智能依然可能改变世界。