数据与人工智能(Data and AI)

人工智能时代已经到来。不管我们是否认为人工智能存在巨大的泡沫,它都已经产生巨大的影响和价值。杨立昆也持有类似的观点,只不过通往通用人工智能之路仍然很不明朗。数据是训练大模型的基础输入,计算使得数据被消化吸收。那么,大模型是否会对数据系统尤其是数据库系统产生根本性的影响呢?

目前看来,数据库系统通过扩展 SQL 等查询语言,包装了对大模型推理 API 等的调用。但是数据量太大的时候,大模型调用的速度与数据库本身的处理速度相比,实在是太慢太贵了。而通过大模型等做数据库性能优化等内核改进看来离实用还遥遥无期。大模型辅助做 SQL 生成,就跟其他的代码辅助场景一样,有人在其中干预,叫做 Human-in-the-loop,确实在很多时候可以提高效率。不过全自动的 NL2SQL 还是存在巨大的挑战。

总之,数据与人工智能二者之间的关系,当下看起来还是后者占明显的上风,数据系统领域的研究人员和工程人员还需努力啊😓。

Written on November 10, 2025