二零二五年真是过得飞快。重新翻看日历,才意识到这一整年自己竟然做过这么多的事情。在赤道线上的小岛待久了,对时间流逝的感知也变得越来越迟钝。这里没有分明的春夏秋冬。在平凡的日子里,我靠着电子日历上每天填满的日程来提醒自己:生活并不是停在原地。
而真正能令我意识到时间在流动的,是那些离开小岛的日子。坐上六七个小时的长程航班,一路向北或是向南,看到那些熟悉或陌生的街道,大口呼吸当地的空气,吃上一顿惦记了很久的饭,而后好好地睡上一觉。只是回头看这一年,才发现这种流动和变化不止发生在自己的生活里。每天面对的工作、使用的工具,以及那些正在影响整个世界的技术,也都在悄悄改变。

出发,机器智能
人们在生活中开始强烈依赖 AI 去回答问题或是编写程序的时间可能还不到一年。2024 年底,最常用的编程大语言模型可能是 Anthropic 的 Sonnet 3.5,它在一项编程基准能力测试 SWE-bench Verified 上的准确率是 49%。而 2025 年底发布的开源大语言模型 GLM-4.7 在这一项上的准确率已经达到 73.8%。
二零二五年最让人感到惊喜的,是以中国科技公司为主的,发布开源大语言模型的热潮。这些大语言模型性能优异,显著缩小了开源模型与闭源模型之间的能力差距。它们的出现大幅降低了推理服务的平均成本,使更多人、更多场景能够使用或接入 AI 能力。这其中有代表性的是深度求索的 DeepSeek 系列模型、智谱的 GLM 系列模型,以及月之暗面的 Kimi 系列模型等。
量大管饱的 AI 模型比性能顶尖但是昂贵的模型在应用侧更有价值。2024 年底人们对于 AI 的认知或许只有基于网页的 ChatGPT。而随着 MCP 协议和生态的发展,再加上模型普遍支持思维链、工具调用与更大的上下文窗口,AI 的形式不仅限于基于文本框的知识问答,而是成为了能够与外部环境做交互,基于任务循环和多轮调用来解决复杂问题的人工智能体(AI Agent)。
其中一类复杂问题被称为程序设计。编写并调试程序不仅依赖知识和经验,在思考程序架构时还应考虑到业务背景和设计模式。解决这一类问题时,2025 年初的 AI 或许只有实习生的水平。而经过一年进化后的 AI 至少相当于拥有 3 年左右工作经验的全职工程师。
当然,程序设计只是其中一类复杂问题。正如前 OpenAI 研究员姚顺雨在那篇著名文章《下半场》中提及的那样,当模型在越来越多的测试中逼近甚至超越人类时,真正困难的或许不再只是提高测试成绩,而是定义值得解决的问题,并判断 AI 是否真正创造了现实价值。而这可能是 AI 能够给人类带来更大收益的方向。几乎有一多半软件在 2025 年都添加了 AI 功能模块。
我去年有一篇文章在介绍 n8n,这是一款具有良好用户界面的工作流自动化软件。用户明确定义的工作流确保了关键步骤一定会被执行。而未来的 AI Agent 大概率不但会贴近这种可靠性,还可针对不同场景灵活处理问题。OpenClaw 的流行说明用户开始接受完全以自然语言的形式定义任务和问题,并尝试授予权限并完全委托在本地运行的智能体解决问题。
问题解决者
程序员会失业吗——我不止听过一个人说出类似的担忧,尤其是在 AI 解决问题的能力突飞猛进,以一种不可想象的速度开始快速替代人类进行编程活动的大背景下。说实话,我对于这个问题并不是很担心。
这是因为软件工程师的职责不仅包括编写程序。在典型的一天的工作中,我投入编程这项任务的时间占比可能只有 30% 左右。他(她)是一名 “问题解决者”:这份工作的价值在于讨论并理解需求、提出有价值的解决方案,并最终落实该方案。这需要充分理解任务上下文,进行沟通以及管理进度和预期。而其中编程这一环节可能只是 AI 能完成的最简单任务之一。AI 可以按照要求撰写可运行的程序。但至少到现在,它还是不能为我的博客文章起一个令我满意的标题,也不能理解来自需求方的 “五彩斑斓的黑” 究竟想到达到什么目标。其中一些任务依赖情感支持而非纯粹技术。
另外,前端 / 后端程序员的边际也已不再清晰。在一些企业内部,就连产品经理和软件工程师的职责也已经开始模糊。几年之前在一些组织内,就已经开始要求程序员兼任软件测试工程师的职责。如今 AI 时代,人工智能能够写出更多行的代码,而审阅乃至完全理解这些代码确实增加了开发者的负担。特别是在为不熟悉的领域编写代码时,一些工程师开始放弃仔细阅读 AI 生成的代码。这些体积快速增长的代码仓库变得越来越难维护,同时也为软件测试和质量控制带来了更多挑战。
2025 年一年我不怎么亲自写代码。反之我将大量的精力投入到理解层出不穷的 AI 相关的新概念上。我尝试理解一些 Agent(人工智能体)框架的工作原理,反复比较各种模型在处理特定任务上的性能差异,以及深入探索结合这些最先进技术的实际使用场景。感到惭愧的是,我花了很多时间去努力当一名学生,而(至少 2025 年)没有什么可输出的东西。就连这篇年终总结博客,都是在 2026 年上半年就要结束的那个月才勉强写完。我希望至少能在 2026 年我能在博客中输出更多有价值的内容,争取恢复到以前的更新频率。
离开小岛的日子
很难给这一年下一个什么样的定义。当我为撰写这篇年终总结博客而翻看去年的日历时,我才意识到其实这一年也做了很多事情,去了很多地方。总之还算满意。依时间序的话,这一年我到过:新加坡、澳门、北京、陕西西安、安徽省、云南昆明、海南岛、普吉岛、香港、冲绳、天津、布里斯班、广东深圳、马来西亚新山,以及广西省。其中一些地方纯属由于图便宜买的转机机票带来的 “附带行程”,虽然时间短暂,给我们带来的印象却依然深刻。

我感激与 Minda 有始终和睦的夫妻关系。她总是能对与我相关的绝大多数事情保持包容,而这一点是难能可贵的。我们互相为对方考虑,然而实际上她为我考虑的总比我为她考虑的多出很多。相处过程中的很多事情我之前从未意识到,但我争取以后在每个合适的节日或纪念日都不忘对她表达我的感激。并且在下次决定买花回家之前,先考虑家里应至少有一个花瓶的问题——不能再用空的酱油瓶来盛花了。我必须感谢我的好友刘其然在这几点上向我传授她的深刻理解。
上学的时候,总盼着能快一点毕业。可到了这几年,却又希望时间能过得慢一些。我习惯给一年中的每一周编号,并在工作目录里按周归档我的文件。2025 年的目录里渐渐排满一个又一个文件夹,直到有一天,下一个文件夹不再属于这个目录。稍感欣慰的是,每次回看这些年写下的年终总结,我都能发现,自己仍在不同角度体验和观察这个世界。只要还有新的感受、新的认识,这一年便不算白过。
2025 年末,我请了一周的年假,与 Minda 在广西自驾。宽阔的高速公路上几乎看不见别的车,轮胎碾过路面的低沉声响与广播里的音乐混在一起,窗外的群山和田野正在被落日染成金黄。我尝试记住这一瞬间,却不由得起了一身鸡皮疙瘩。太阳完全落下山,导航没有及时提示出口,我们就这样错过了下高速的路口,而下一个出口还在二三十公里以外。Minda 安慰我说,没事儿,走哪条路都能到,不过是多绕一段路。于是我们继续沿着漆黑的高速向前开,路还很长,但好在还有时间。