那就再开一次落日飞车——我的二零二五年

二零二五年真是过得飞快。重新翻看日历，才意识到这一整年自己竟然做过这么多的事情。在赤道线上的小岛待久了，对时间流逝的感知也变得越来越迟钝。这里没有分明的春夏秋冬。在平凡的日子里，我靠着电子日历上每天填满的日程来提醒自己：生活并不是停在原地。

而真正能令我意识到时间在流动的，是那些离开小岛的日子。坐上六七个小时的长程航班，一路向北或是向南，看到那些熟悉或陌生的街道，大口呼吸当地的空气，吃上一顿惦记了很久的饭，而后好好地睡上一觉。只是回头看这一年，才发现这种流动和变化不止发生在自己的生活里。每天面对的工作、使用的工具，以及那些正在影响整个世界的技术，也都在悄悄改变。

一张阳朔山顶观景台的广角全景照片。夕阳悬在薄雾笼罩的喀斯特峰林上方，金色光线洒向远处层叠的石灰岩山峰。前景有许多游客在观景平台和岩石边拍照、休息、欣赏日落景色。 — 游客在拍摄桂林阳朔的千里江山落日，全景拍摄，2025 年冬季

出发，机器智能

人们在生活中开始强烈依赖 AI 去回答问题或是编写程序的时间可能还不到一年。2024 年底，最常用的编程大语言模型可能是 Anthropic 的 Sonnet 3.5，它在一项编程基准能力测试 SWE-bench Verified 上的准确率是 49%。而 2025 年底发布的开源大语言模型 GLM-4.7 在这一项上的准确率已经达到 73.8%。

二零二五年最让人感到惊喜的，是以中国科技公司为主的，发布开源大语言模型的热潮。这些大语言模型性能优异，显著缩小了开源模型与闭源模型之间的能力差距。它们的出现大幅降低了推理服务的平均成本，使更多人、更多场景能够使用或接入 AI 能力。这其中有代表性的是深度求索的 DeepSeek 系列模型、智谱的 GLM 系列模型，以及月之暗面的 Kimi 系列模型等。

量大管饱的 AI 模型比性能顶尖但是昂贵的模型在应用侧更有价值。2024 年底人们对于 AI 的认知或许只有基于网页的 ChatGPT。而随着 MCP 协议和生态的发展，再加上模型普遍支持思维链、工具调用与更大的上下文窗口，AI 的形式不仅限于基于文本框的知识问答，而是成为了能够与外部环境做交互，基于任务循环和多轮调用来解决复杂问题的人工智能体（AI Agent）。

其中一类复杂问题被称为程序设计。编写并调试程序不仅依赖知识和经验，在思考程序架构时还应考虑到业务背景和设计模式。解决这一类问题时，2025 年初的 AI 或许只有实习生的水平。而经过一年进化后的 AI 至少相当于拥有 3 年左右工作经验的全职工程师。

当然，程序设计只是其中一类复杂问题。正如前 OpenAI 研究员姚顺雨在那篇著名文章《下半场》中提及的那样，当模型在越来越多的测试中逼近甚至超越人类时，真正困难的或许不再只是提高测试成绩，而是定义值得解决的问题，并判断 AI 是否真正创造了现实价值。而这可能是 AI 能够给人类带来更大收益的方向。几乎有一多半软件在 2025 年都添加了 AI 功能模块。

我去年有一篇文章在介绍 n8n，这是一款具有良好用户界面的工作流自动化软件。用户明确定义的工作流确保了关键步骤一定会被执行。而未来的 AI Agent 大概率不但会贴近这种可靠性，还可针对不同场景灵活处理问题。OpenClaw 的流行说明用户开始接受完全以自然语言的形式定义任务和问题，并尝试授予权限并完全委托在本地运行的智能体解决问题。

问题解决者

程序员会失业吗——我不止听过一个人说出类似的担忧，尤其是在 AI 解决问题的能力突飞猛进，以一种不可想象的速度开始快速替代人类进行编程活动的大背景下。说实话，我对于这个问题并不是很担心。

这是因为软件工程师的职责不仅包括编写程序。在典型的一天的工作中，我投入编程这项任务的时间占比可能只有 30% 左右。他（她）是一名 “问题解决者”：这份工作的价值在于讨论并理解需求、提出有价值的解决方案，并最终落实该方案。这需要充分理解任务上下文，进行沟通以及管理进度和预期。而其中编程这一环节可能只是 AI 能完成的最简单任务之一。AI 可以按照要求撰写可运行的程序。但至少到现在，它还是不能为我的博客文章起一个令我满意的标题，也不能理解来自需求方的 “五彩斑斓的黑” 究竟想到达到什么目标。其中一些任务依赖情感支持而非纯粹技术。

另外，前端 / 后端程序员的边际也已不再清晰。在一些企业内部，就连产品经理和软件工程师的职责也已经开始模糊。几年之前在一些组织内，就已经开始要求程序员兼任软件测试工程师的职责。如今 AI 时代，人工智能能够写出更多行的代码，而审阅乃至完全理解这些代码确实增加了开发者的负担。特别是在为不熟悉的领域编写代码时，一些工程师开始放弃仔细阅读 AI 生成的代码。这些体积快速增长的代码仓库变得越来越难维护，同时也为软件测试和质量控制带来了更多挑战。

2025 年一年我不怎么亲自写代码。反之我将大量的精力投入到理解层出不穷的 AI 相关的新概念上。我尝试理解一些 Agent（人工智能体）框架的工作原理，反复比较各种模型在处理特定任务上的性能差异，以及深入探索结合这些最先进技术的实际使用场景。感到惭愧的是，我花了很多时间去努力当一名学生，而（至少 2025 年）没有什么可输出的东西。就连这篇年终总结博客，都是在 2026 年上半年就要结束的那个月才勉强写完。我希望至少能在 2026 年我能在博客中输出更多有价值的内容，争取恢复到以前的更新频率。

离开小岛的日子

很难给这一年下一个什么样的定义。当我为撰写这篇年终总结博客而翻看去年的日历时，我才意识到其实这一年也做了很多事情，去了很多地方。总之还算满意。依时间序的话，这一年我到过：新加坡、澳门、北京、陕西西安、安徽省、云南昆明、海南岛、普吉岛、香港、冲绳、天津、布里斯班、广东深圳、马来西亚新山，以及广西省。其中一些地方纯属由于图便宜买的转机机票带来的 “附带行程”，虽然时间短暂，给我们带来的印象却依然深刻。

一张侧拍照片。一名长发人士穿着米色夹克，倚在一座带有精致雕刻的弧形灰色石桥栏杆上，目光向右上方望去。背景是淡蓝色的清晨天空，左侧有几株落叶的垂柳，远处可见模糊的城市建筑群，光线柔和。 — 游览西安世博园，2025 年农历春节

我感激与 Minda 有始终和睦的夫妻关系。她总是能对与我相关的绝大多数事情保持包容，而这一点是难能可贵的。我们互相为对方考虑，然而实际上她为我考虑的总比我为她考虑的多出很多。相处过程中的很多事情我之前从未意识到，但我争取以后在每个合适的节日或纪念日都不忘对她表达我的感激。并且在下次决定买花回家之前，先考虑家里应至少有一个花瓶的问题——不能再用空的酱油瓶来盛花了。我必须感谢我的好友刘其然在这几点上向我传授她的深刻理解。

上学的时候，总盼着能快一点毕业。可到了这几年，却又希望时间能过得慢一些。我习惯给一年中的每一周编号，并在工作目录里按周归档我的文件。2025 年的目录里渐渐排满一个又一个文件夹，直到有一天，下一个文件夹不再属于这个目录。稍感欣慰的是，每次回看这些年写下的年终总结，我都能发现，自己仍在不同角度体验和观察这个世界。只要还有新的感受、新的认识，这一年便不算白过。

2025 年末，我请了一周的年假，与 Minda 在广西自驾。宽阔的高速公路上几乎看不见别的车，轮胎碾过路面的低沉声响与广播里的音乐混在一起，窗外的群山和田野正在被落日染成金黄。我尝试记住这一瞬间，却不由得起了一身鸡皮疙瘩。太阳完全落下山，导航没有及时提示出口，我们就这样错过了下高速的路口，而下一个出口还在二三十公里以外。Minda 安慰我说，没事儿，走哪条路都能到，不过是多绕一段路。于是我们继续沿着漆黑的高速向前开，路还很长，但好在还有时间。