Candlest 的博客

Back

公常路第一千早爱音Blur image

未来属于能随着计算规模增长而持续变强的方法#

《The Bitter Lesson》 举了棋类、计算机视觉和语音识别上的例子,凭借着人类先验知识的输入,某些方法能在短期取得优势。但是长期来看,这些「人工结构」都会被能够利用更大规模计算与数据的通用方法所击败。

长期来看,能利用好通用计算能力在 AI 上不断扩展的方法只有两种:

  • 用更多数据和计算,在参数空间中进行更充分的学习

  • 用更多计算,在解空间中进行更深/更广的搜索

学习和搜索,本质上都是利用计算在高维空间中逼近最优解,只是所处空间不同。

所以,请永远不要忘记我们出发的初心:我们不是去设计一个最强的人工结构跑出 SOTA,而是去设计一个能随着计算增长而高效改进的通用方法。

世界复杂到难以用简单的方法建模#

世界的动力学极其复杂,远超人类能够显式编码的程度。

在封闭和低维问题中,显式方法(如 PID、规则系统)依然有效,但在开放、复杂的任务中,这类方法往往难以扩展。人工的 switch-cases,手工特征,甚至是目前部分人尝试在深度学习里模拟「人类理解方式」的做法,往往难以扩展,或在规模增长后被更通用的方法取代。

我们应该教给 AI 的,不是建模世界,而是建模如何学习世界。AI 应该尽量减少对人类先验结构的依赖地发现特征与联系,而不是在我们的特征与联系下工作。因此,我们不应直接建模世界本身,而应构建能够从数据中自动学习表示与策略的通用方法。AI 的关键不在于执行我们已有的知识,而在于通过计算不断发现更好的表示与解。

在原文中,Sutton 的说法更加激进:

We have to learn the bitter lesson that building in how we think we think does not work in the long run.

AI 未来的发展,更像是将模型的约束,从显式的人类先验,逐步转移到由数据和计算驱动、能够自主学习的结构之中。

后记(或者说前言)#

折戟长城杯,意识到 ai 对网安领域的冲击还没有彻底铺开,这个领域这个行业将迎来一场漫长而彻底的变化。

前辈问我愿不愿意担起下一届校队的责任,我思考良久最终还是选择了拒绝。前辈们也许有些失望,但是依旧安慰我:「能有长期目标规划就行,不要一直纠结摇摆,那样很浪费时间」。

前几天,转网安群有一个很有趣的话题。大一学医的小登们很多想往外润,理由是不想这么早就决定未来十年二十年要跟这么一个高劳动强度,起薪低的行业高度绑定。前任群主点出了这个问题的核心:

你总要有一天梭哈某个方向,医学只是梭哈的比较早。计算机只是本科阶段比较open,但是不会让你持有的机会成本变低。

你们不要觉得只有医学才梭哈,学医确实会让你的可能性迅速收敛,年龄增大也会。但是学了计算机的,本科开始梭哈就业/科研的人,收敛的也很快。你很难换路了,要承担很大的沉没成本。

是的,之前大二上进组的时候老师问我,你平转还要尝试卷绩点,你有时间科研吗?

那个时候我还很自信地觉得我可以把各种各样的事务往我怀里揽,毕竟我相信我自己是一个热爱计算机的人,既然热爱就不会疲倦。

但是经过半年的实践我发现,那些我往怀里揽的事务,我一样都做不到顶尖。每一样都是马马虎虎,而不能成为在同龄人中亮眼的水平。

人的热爱并不能违背客观规律,人的精力是有限的,六边形战士很多但是却并不是我(我参数初始化和前 19 年攒的数值太低了),加点加不满。

尤其是 ai 时代,这个时代对样样还行的平均能力者的需求大幅减少,而是渴求在某一方面极其突出的人。

我必须做出决定了。半年前刚转到这个学院和班主任聊天就意识到了这个问题,班主任笑着和我说你还有时间探索。但是现在这个时间节点,我真的要做出决定了,我的数值有限,我的精力有限,到底要把点加在什么东西上?

我决定跟着老师,继续做 Embodied Intelligent,其他的优化目标,全部随缘。

The Bitter Lesson:ALL IN, 此刻启程
https://blog.candlest.cc/blog/ai/read-the-bitter-lesson
Author Candlest
Published at 2026年4月6日