AI Agent 未来发展与投入方向调研
从"AI Agent 作为下一代流量入口"一文出发,梳理 2025–2026 年 Agent 生态的协议层战争、被改造的重点领域、被忽视的创新机会,以及个人工程师在这一波浪潮下的真实投入路径。
01核心判断
关键主线
- 从"人找服务"到"Agent 间协商"——M2M 交互层取代人工点击
- 协议标准化是真正的门槛——Skill 注册表战争取代 App Store 战争
- 中小商家的机会窗口很短——早期内容稀缺期之后大厂标准化 SDK 会把他们回推到被分发位置
- 真正的瓶颈在信任与授权边界——身份、支付、责任的法律框架决定落地速度
02正在推动变革的商业组织(2025–2026)
- Anthropic – MCP9700 万+ 下载2025 年 12 月捐赠 Linux 基金会中立托管,已成 Agent-to-Tool 事实标准
- Google – A2A + UCP2026 年 1 月联合 Shopify / Walmart / Mastercard 推 Universal Commerce Protocol,打通 Agent 支付闭环
- OpenAI – ACP与 Stripe 联合发布 Agentic Commerce Protocol,ChatGPT Instant Checkout 向商户抽 4%
- Salesforce – Agentforce8000+ 企业半年贡献 9 亿美元营收
- Linux 基金会 AAIFAWS / Anthropic / Google / Microsoft / OpenAI 共同治理的中立平台
- LangChain (LangGraph 1.0)多 Agent 工作流主流框架(2025-10 GA)
- CrewAI / Microsoft AutoGen + SK10 万开发者社区 / 企业级统一框架
- Letta长期记忆基础设施(sleep-time compute)
- 字节豆包MAU 7500 万抢手机 OS 入口
- 美团"小美/问小团"、腾讯"元宝派"防御性布局
- Visa TAP / Mastercard Agent Pay传统支付网络全面接入 Agent 链路
03被改造的重点领域
| 领域 | 现状与数据 |
|---|---|
| 客服自动化 | 70–85%工单由 Agent 处理,单票成本 $15 → $1–3 |
| 代理购物 | 2025 Cyber Week 影响 $670 亿销售;2030 年预计 25%网购经 Agent |
| 代理支付 | Visa / Mastercard / Stripe 全面接入,标准战 2026 见分晓 |
| B2B 企业流程 | Gartner 预测 2028 年 $15 万亿B2B 交易由 Agent 主导 |
| 编码与 Web 自动化 | Cursor / Browserbase / Playwright Agent 已进入多步骤自主执行阶段 |
04创新机会(空白地带)
05被忽视的 10 条暗线
- Agent 的 Datadog——非确定性系统的可观测性、回放、A/B、成本归因
- Agent CI/CD——Prompt + Skill + Tool 的版本管理、灰度、回滚
- Agent 仿真沙箱——上线前跑 10 万次对抗测试(类比自动驾驶 CARLA)
- Red Team as a Service——攻击别人的 Agent 找越狱漏洞
- "Linear for Agents"——同时监督 10 个 Agent 时 chat UI 完全崩溃
- 个人 Digital Twin——代表你出席、谈判、筛选的 Agent
- MCP Wrapper for SAP / Oracle / 用友 / 金蝶——传统企业软件的转换层
- Robots.txt 2.0——网站如何声明欢迎 / 收费 / 禁止 Agent
- 蓝领 / 线下 Agent——餐厅排班、物业报修、货运调度、建筑工地
- 跨境小微贸易 Agent——1688 选品 → 翻译 → 独立站 → 物流 → 报关
06软件工程师的投入方向
低成本高杠杆
- 做一个 MCP Server围绕熟悉的垂直工具——命名红利期
- 写 Agent 评估 / 可观测性 OSS 小工具易被 LangChain / Letta 生态吸纳
- 建 垂直 Skill Registry(如"财税 Agent Skills 合集")用内容抢心智
中等投入
- 帮传统行业(律所 / 诊所 / 物业 / 外贸)做 Agent 落地咨询 + 定制,客单 5–20 万
- 做 Agent 接入工具 micro-SaaS(如独立站一键生成 ACP / UCP 端点)
- 深耕一个协议层 SDK(MCP / A2A / ACP)成为社区前 50 名 contributor
高投入长周期
- 加入 Series A/B 的 Agent 基础设施公司(Letta / Browserbase / Sierra)
- 自己做 Agent IAM / 审计 创业(需合规或安全背景)
07核心建议
不要去追大厂打得最凶的战场(协议、支付、通用 Agent),去做大厂看不上但 SMB 离不开的"脏活"——那是单个工程师唯一的结构性优势。
最值得押注的两个趋势
代理支付协议标准战
OpenAI ACP vs Google UCP vs Visa TAP,2026 年见胜负,锁定未来 5 年"Agent 流量收费权"
Agent 身份与信任基础设施
将产生下一代生态的"PKI 基础设施商"——类比 Web 时代的 Verisign / Let's Encrypt
08传统 RAG 的命运与 Karpathy 路线
传统 RAG 会被淘汰吗
会,但不是被"更好的 RAG"替代——而是被降级为基础设施原语。
根本缺陷:chunk + embed + topK 本质是"语义搜索 + 字符串拼接"。切块破坏语义、embedding 相似度 ≠ 相关性、检索无状态无推理、知识更新困难。本质是一个被 LLM 美化的搜索引擎。
Karpathy 路线是什么
不是某一个产品,而是一组收敛的思想:
- LLM OS(2023)——LLM 是新操作系统内核,context = RAM,知识库 = 磁盘
- "RAG is a hack"——人类不是靠"在图书馆搜相似段落"记住知识
- LLM Wiki(2024–2025)——模型自己读写 wiki 风格的知识库,像维护 Notion 一样去重、归纳、交叉引用,知识是被持续整理的活体制品
- Software 3.0 / Context Engineering——Prompt + Context 本身就是编程,核心技能从"写算法"变成"管理上下文"
- Agent Memory——Letta / MemGPT 方向比朴素 RAG 更接近正确答案
Anthropic Skills / Artifacts / Projects、OpenAI Memory、Letta sleep-time compute——都是这个方向的不同实现。
"基础设施原语"的含义
原语(Primitive)= 最基础、被其他东西依赖的构建块。历史上很多"曾经的产品"都变成了"现在的原语":
| 曾经是产品 | 现在是原语 |
|---|---|
| B-tree | 数据库里的一个模块 |
| TCP/IP | 操作系统一行 import |
| JSON 解析 | 语言内置 |
| OAuth | 标准库 |
这些东西没有消失——它们比任何时候都用得更多,但从"产品"降级成了"原语"。RAG 正在经历同样的过程:今天还有公司专门卖 RAG 方案,2–3 年后就是 Postgres 的一个扩展(pgvector)、LangChain 的一行函数、Claude API 的一个参数。
商业价值的分层
核心判断
09押注方向:Agent Memory & Context Engineering
在所有 AI 方向里,这是个人工程师最值得押注的位置:
| 方向 | 判断 |
|---|---|
| 基础模型训练 | ❌ 资本密集,个人没机会 |
| Agent 编排框架 | ❌ 红海,LangChain / CrewAI 已吃完 |
| 通用 Agent 产品 | ❌ 大厂肌肉战 |
| 多模态 | ❌ 门槛在数据+算力 |
| RAG 本身 | ❌ 正被降级为原语 |
| 评估 / 观测 | 🟡 好方向但天花板低 |
| 垂直行业 Agent | 🟡 好但需行业资源 |
| Memory / Context Engineering | ✅ 押这个 |
为什么是这个
- 趋势明确——Karpathy / Anthropic / OpenAI 都在往这里走
- 拥挤度低——Letta 是先行者但远未通吃
- 技能可迁移——可从 RAG 平滑过渡,不需从零开始
- 纯工程 + 系统设计的战场——不需算力也不需政治资本
- 上游定价权——定义了 Agent 怎么"记住"就定义了行为边界
如果让我给一个不中立的建议:押 Agent Memory。 它是 RAG 的下一站,也是目前 AI 基础设施里趋势最明确、拥挤度最低、个人最能打的位置。