2025 AI 年度回顾
写在前面
2025 年是 AI 领域井喷式爆发的一年。从年初 DeepSeek 的横空出世,到 3 月 Manus 的发布,再到年中 Claude 的更新,以及年末 Agent Skills 的问世——整个行业经历了一轮飞速的迭代与进化。
站在新年的起点,我想对过去一年做个简单总结,并对未来稍作展望。
DeepSeek
2025 年初,DeepSeek 横空出世,成为 AI 领域的一股新势力。它标志着国人在 AI 领域从跟随者转向创新者。V3 模型在未见工具上的泛化能力和复杂多步骤任务的执行鲁棒性方面表现突出,大幅缩小了与闭源模型的差距;在硬件层面,它通过完整的软硬件协同设计方法论,为行业在高性能、低成本训练与部署超大规模模型上提供了宝贵路径,加速了国产算力生态的成熟。
2026 年初发布的新论文令人振奋,让我对 V4 充满期待。V4 模型有望再次改变 AI 市场格局,在编码、长文本、ToB 等领域都有更大的潜力。
DeepSeek 可能是我见过最低调的 AI 公司——几乎找不到任何公开采访。但他们的愿景非常远大,特别是与国产芯片的深度结合,让我国在 AI 领域拥有了更强的自主创新能力。
有趣的是,我只在 Twitter 上见过他们的一位前端工程师发布的招聘信息,也就是 Naive UI 的作者 07akioni。
Anthropic
Anthropic 今年推出的 Claude Code 打开了 AI 编程的新大门,让 TUI 与 AI 结合有了更多可能,不再受限于 Cursor 等编辑器的垄断。它的开放性也做得更好——支持自定义模型,而 Cursor 必须是付费会员才能使用。现在在公司里,我几乎每天都在使用 Claude Code。
Anthropic 在编程工具生态上也有其他贡献:2024 年底发布了 MCP 协议,2025 年底推出了 Agent Skills。说实话,MCP 发布时我并不特别看好,主要是因为内部实现像个黑盒。但 Skills 发布后,我明显感受到了它的潜力,尤其是在编程领域——如今各大厂都已经接入了 GitHub、Codex 等服务。
当然,这家公司的一些操作也令人费解,让人又爱又恨,某些行为与 OpenAI 如出一辙。
Manus
Manus 刚发布时我没什么感觉;直到最近我才意识到,它有一套独特的沙盒机制,让 Agent 直接运行在 Sandbox 中,解决了 Claude Code 和 Chatbot 那种占用本地资源或浏览器的痛点。这套打法成功从 OpenAI Chatbot 手中抢占了用户,并在专业领域获得了青睐——至今仍无人超越,称得上是目前最好的通用 Agent。
特别推荐大家看 B 站上采访 Manus 成员季逸超的视频:《Manus决定出售前最后的访谈:啊,这奇幻的2025年漂流啊…》。这 3 个半小时的访谈我看了大概 3 遍,里面的一些观点非常有意思:
- 在 AI 时代,不要为一个创意浪费太多时间——直接做,然后去市场找反馈
- 互联网时代的稳定点,是用户时间被瓜分完毕;但 AI 时代不同,所有 Agentic Hours 都可以在后台运行,那稳定点到底在哪里?
- 垂直领域未来会百花齐放,但拼的还是最后一公里的体验
- 很多人没有乔布斯的命,却得了乔布斯的病
- 只要问题能被定义,问题就能被解决
- 评价 AI 团队或产品的重要指标,不仅包括模型基准测试(Benchmarks),还包括对人的激励
- AI 更像制造业
比较可惜的是,他们被 Meta 收购了,而且不服务国内用户。不过我也能理解——国内愿意为这类产品付费的用户太少了。作为小公司,不出海确实很难生存。

关于我的工作与业务思考
2025 年,我也负责了公司 AI 通用智能体(Agent)方面的探索。过程中遇到了一些问题:团队配置不足,没有专业做AI领域的专家,迭代速度远不如开源社区。更常见的是,需求方往往天马行空,认为 AI 无所不能,于是提出很多离谱的需求。我印象中最搞笑的一个需求是:实现某个业务时让 Agent 能够自我进化——我当时内心的 OS 是:他们要的是数码宝贝吗?
值得庆幸的是我们还是落地了几个项目
硬件方面,正如前面所说,AI 更像制造业,本质就是堆 GPU。而且模型每半年就有大版本更新,很多旧打法在新场景下可能不再适用。我们也去现场部署过,GPU 和模型的部署复杂度比普通应用高出一个量级。
在公司编程方面,Lanz 确实能帮上忙,但成本仍由公司承担。这和制造业的逻辑一样——用的人多,就会崩溃。我怀疑公司未必能持续承担这个成本。
国内的付费用户还是太少。如果真的想用好 AI,应该去订阅一些付费服务,这对工作和生活都有很大帮助。不要只用 Chatbot——Lanz 的 Chatbot 已经是 OpenAI 三年前就有的东西了。
2025 AI 产生的费用
那就直接聊下我这个付费用户每年的开销吧。
大概 3 年前吧,我只能使用 Github Copilot ,那时候一年大概 200 美刀,大概是我全年 AI 的投入吧。
24年的时候我开始使用 cursor 以后,就退订 Github Copilot 了,应该也是 一年 240 美刀 吧。
不过2025年就不一样了,已经是百花齐放了,不管是编辑器还是外网 maas,包括工具什么的,我已经无法统计出来了我花了多少;我只能列一下我大概花了哪些地方
- 编辑器的话 cursor 和 trae 我反复横跳,最近稳定使用 trae 国际版,主要还是 cursor 的一些网络限制(这里我感觉不是公司限制而是 curosr 对中国的限制)
- 买了智谱 AI 的包月流量,这个其实也是公司的 lanz 经常会不通,特别是长文本任务上
- 经常使用 AI 网页翻译,用的是 沉浸式翻译 一款插件,主要是用 youtube 视频的实时翻译功能
- 偶尔会使用 bibigpt ,主要是总结一些 b 站视频的,主要是有点长
- 偶尔会使用 AI 制作 ppt,买过 豆包 和 科大讯飞的
- 偶尔会使用 AI 制图,买过 可灵和 nano banana
- 硅基流动,不过 hikmaas 基本都有,但想体验新模型的话,我一般还是用这个
现在真的是,AI 工具的甜蜜时刻,可选的太多了;不过我已经不会像以前一样包年了,都是按月或者按季度买了
我们组内也有不少同事充值了一些 AI 编辑器的订阅,充钱玩家肯定是比免费玩家有更好的编码体验。
其他领域
其他方面其实还有很多,比如,AI Infra 领域 AI 智能手机电脑, 机器人方向,年末的王力宏演唱会表演韦伯斯特空翻。
AI 数字人也有很多很出圈的,有些已经发专辑并且主持一些大型活动,体现了商业价值
在音乐领域也有一些,可以搜索B站的up主,漫游会议室,不过这块我研究了不太深
2026 展望
我就提出我的一些个人预测吧,看下年底有哪些可能会中,当然不中就不中了
- Deepseek V4 模型有望再次改变 AI 市场格局,在编码、长文本、ToB 等领域都会产生大量的变革
- AI 基线开源生态将会超越闭源,很多底层的技术都会出现开源替代品,而且更容易被开发者使用
- Agentic ,Muti-Agent 是 26 年的主打的方向,而对应的 AI Sandbox 将会崛起,而且 Agent to Agent 通信协议也会成为热点
- 模型成本会比今年小 1/5 (老黄说的),更多小模型会涌现,会更容易部署。
总结
我只写了几个我个人看好的公司与产品,实际上还有无数小产品如雨后春笋般涌现。在 AI 时代,大厂抄袭小厂已成常态,这对普通人来说可能意味着更多机会。
今年 DeepSeek V4 发布后,又将是一个变革之年。不过不用怕——只要问题能被定义,问题就能被解决。
最后 ai 做了个本文总结的视频(自带声音)