2025 年 Data and AI 年终回顾
When a distinguished but elderly scientist states that something is possible, he is almost certainly right. When he states that something is impossible, he is very probably wrong. ——— Arthur C. Clarke
人类喜欢做阶段总结,这不,各路神仙都有自己的 2025 年度总结了。例如:Andrej Karpathy 的 2025 LLM year in review,https://karpathy.bearblog.dev/year-in-review-2025/,Andy Pavlo 的 Data 2025: The year in review with Mike Stonebraker & Andy Pavlo,https://www.dbos.dev/webcast-2025-in-review-with-mike-stonebraker-and-andy-pavlo 等。神仙们的总结自然很好,凡人的总结也不可或缺。我们先吸收点神仙的能量来壮壮胆。需要声明的是,以下大多数是我的总结和发挥,不代表神仙们的原始意见。
Andrej Karpathy 和 Andy Pavlo 的共同特点是愿意花很多时间做教学科普视频,不过前者更难能可贵,而后者本来就是网红教授。Andrej 说 2025 年大模型行业最重要的是六大技术要点:
-
Reinforcement Learning from Verifiable Rewards (RLVR),从之前的 Pretraining、Supervised Finetuning、Reinforcement Learning from Human Feedback 进化而来。
-
Ghosts vs. Animals / Jagged Intelligence,人类智能是为了生存而进行的生物进化,大模型像个考试或 Benchmarking 选手。所以,尽信榜则不如无榜。这么搞不像是 AGI 通用人工智能应该有的样子。
-
Cursor / new layer of LLM apps,LLM 公司自然想把一切都做到模型或模型服务里头,但是 Cursor 的成功说明应用可能大有可为,仅仅有 Chat 界面或 SDK 的大模型,没法适应人民群众日益增长的需要和无穷的创造力。
-
Claude Code / AI that lives on your computer,Code 是 Agent 的典型代表,把更多的功能放到了本地机器,结合本地上下文、工具调用和理解,可以做更多有实际意义的工作。这是为啥业界炒 Agent 元年的动力之一。
-
Vibe coding,Andrej 发明的这个词很快流行起来。通过自然语言普通人就能实现一定程度的编程,这确实是技术平民化、普及化的重大时刻。即使是我们这些专业技术人员,也有很多不熟悉的语言和工具,通过大模型也可以很快写出一次性的脚本。也许哪一天我们真的可以为每个任务搭积木、定制个数据库系统。
-
Nano banana / LLM GUI,谷歌 Gemini 的 Nano banana 是本年度最有意思的发布,它给大模型带来了图形用户界面 GUI。大模型的聊天窗口还主要是文本,类似计算机早期的命令行界面 CLI。未来的界面应该更像图形界面,提供多模态接口,才符合普罗大众的需求。我的文章封面大部分是 Nano 生成的。
相比之下,数据领域的发展就没有大模型这么激动人心了。但是社会的发展还是需要数据领域的从业者们踏踏实实工作,毕竟数据是一切的基础,要避免 Garbage In,Garbage Out,守住人类的底线。
Andy Pavlo 这次把数据库领域的祖师爷、Postgres 之父、图灵奖得主 Mike Stonebraker 也搞来直播来了。这师徒俩一个扮演比较保守的角色,一个扮演比较激进的角色。读书的时候,教授告诉我:When a distinguished but elderly scientist states that something is possible, he is almost certainly right. When he states that something is impossible, he is very probably wrong。所以我时时想起这句话,来提醒自己。
Andy 比较八卦,说了些公开或没那么公开的收购、合并、关闭等。不过,看起来比之前要谨慎一些了。大家都熟悉的可能是 Databricks 十亿美金收购 Neon 并且以 Lakebase 的名字发布新产品,最近其官方博客上也有个 Holiday Update 的产品发布。看起来对开源的投入再明显减少,可能是在尽全力整合产品。
2025 年,PostgreSQL 大火,Neon、Crunchy、Supabase 等很多基于它的系统被收购或投资。仿佛时间回到了 200X 年,不过那时国际上是 Greenplum、AsterData 等等一堆基于 Postgres 的 OLAP 系统;国内则是一堆基于 Postgres 的 OLTP 系统。估计这也是 Andy 这次把 Mike 老爷子请出来的原因吧。Mike 现在又搞了个公司 DBOS,要为未来的世界做一个基于 Database 的 OS。