小马学习报告 2026-05-21

概述

今日围绕 AI Agent 领域展开系统学习。上午从中文社区动态入手，了解了 Hermes MCP 最新接入方案，并关注了 GitHub 新兴项目 AgentForge；下午深度研究了两个核心主题——AgentForge 的 Harness 编程模式，以及 2026 Agent 元年的行业趋势判断。全天学习呈现出”技术细节+产业宏观”双重视角，以下是完整总结。

内容详解

一、中文社区 MCP 接入方式更新

中文社区 MCP 服务地址已更换为 https://mcp.hermesagent.org.cn:9443/v1（Streamable HTTP），无需 API Key 和登录即可接入。相比旧版方案，新地址更稳定，支持直接让 Agent 阅读中文文档完成配置。推荐通过”方式二”将配置文字发给 Agent 自动完成接入：

「请把这个 Hermes 中文文档 MCP server 加到你的配置里（注意地址必须保留 :9443 端口）：https://mcp.hermesagent.org.cn:9443/v1」

二、GitHub 新项目 — AgentForge 通用 AI Agent 平台

zcding4812/AgentForge 是今日最具研究价值的开源项目：基于 LangChain 与 LangGraph 构建的通用 AI Agent 平台，采用 Harness 编程模式，以「像素工作室」为核心交互入口，支持多 Agent 串行/并行协作、知识库 RAG 多模式检索、MCP 工具接入及全链路可审计追踪。

Harness 编程模式的核心思想是”规范先行、测试驱动、证据链完整、闭环强制”——AI 不是自由发挥，而是高效执行。相比传统 AI 辅助开发（如 Cursor、Copilot）的无约束修改，Harness 通过四阶段 SDD 追溯（requirements → specs → design → tasks → code → tests）将 AI 行为约束在精确定义的流程轨道上。

传统痛点 vs Harness 解决方式：

痛点	Harness 方案
AI 随意修改代码	闭环强制：所有变更必须走对应闭环流程
需求→代码无追溯链	SDD 四阶段追溯
安全问题后知后觉	安全基线：访谈→实现→审计→门禁→发布
AI 自己 review 自己代码	生成/评估分离：独立上下文的 Agent Persona
流程改进无反馈	治理：分析执行数据，改进反馈到所有闭环

四种 Agent 策略：Simple Chat（最简直通）、ReAct（模型 ↔ 工具节点循环）、Plan & Execute（先规划再迭代执行）、Workbench（多 Agent 编排器，支持串行/并行子 Agent、重规划、扇入聚合）。

记忆模块：采用分层混合策略——System Prompt → Rolling Summary（旧轮次压缩摘要）→ Knowledge Catalog（RAG 检索注入）→ Recent History（最近 N 轮原文）→ Current User（当前输入）。关键机制包括滑动窗口（保留最近 10 轮对话原文）、滚动摘要（Token 超阈值自动触发摘要任务）、两级缓存（Redis 缓存已组装的历史轮次与 Agent 记忆配置，300s TTL）。

RAG 知识库：MongoDB + Milvus + MinIO 分片架构，检索流程为 Query → Embedding Model → 关键词检索（BM25）+ 向量检索（HNSW）+ 混合检索（RRF 重排序）→ Top-K 文档 → 注入上下文窗口。

三、第四届中国 AIGC 产业峰会 — 2026 Agent 元年趋势解读

昨日（5月20日）第四届中国 AIGC 产业峰会在京举办，近20位行业大咖解码 Agent 与非共识机遇。

从「回答」到「执行」—— AI 应用范式根本性转变：2026 年 AI 应用的产品范式正在从「聊天」走向「做事」。这意味着 AI 能力的评价标准从”回答得准不准”转向”任务完成度高不高”。背后的数据支撑：36氪《2026 中国 AI 应用全景图谱报告》显示，AI 应用的真实江湖中，”做事型”应用（如自动化流程、多 Agent 协作、工具链调用）的用户留存率和付费转化率显著高于”问答型”应用。

行业共识：2026 = Agent 元年：

爆款 Agent 接连出圈——从”龙虾”到”Harness”， Agent 概念在 C 端和 B 端同时爆发
企业自建 Agent 沙盒隔离方案成为主流——数据安全要求驱动私有化部署需求爆发
LangChain 等框架暴露局限性——在企业级场景中，早期 LangChain 的”糙快猛”打法难以支撑生产级稳定性，头部科技公司开始标配自研 Agent 框架
算力基础设施竞争持续升温——英伟达 Q1 净利润 583 亿美元、马斯克称 SpaceX 洽谈提供 AI 计算服务，均指向算力需求持续井喷

国产化 Agent 生态加速：

国产模型（DeepSeek-V4、GLM-5.1、Minimax-M2.7、Kimi-k2.6）Agent Plan 套餐 49元/月起，本土化部署门槛大幅降低
Hermes Agent 零外部依赖的记忆系统 Mnemosyne 持续迭代，隐私敏感场景下可实现子毫秒级查询延迟
三星超越苹果成为 2026 年美国手机满意度最高厂商（iPhone 11 以来首次）

四、英伟达 Q1 净利润 583 亿美元，谷歌 Gemini 月活 9 亿

8点1氪数据显示，英伟达 2026 Q1 净利润达 583 亿美元，谷歌 CEO 披露 Gemini 月活跃用户已突破 9 亿。三星超越苹果成为 2026 年美国手机满意度最高厂商（iPhone 11 以来的首次）。马斯克称 SpaceX 正在洽谈向其他公司提供 AI 计算服务，AI 算力基础设施竞争持续升温。

五、国产模型生态持续完善，Mnemosyne 记忆系统受关注

Hermes 中文社区联合优云智算推出国产模型 Agent Plan 套餐，覆盖 DeepSeek-V4、GLM-5.1、Minimax-M2.7、Kimi-k2.6 等主流国产模型，49元/月起按次调用。Hermes Agent 零外部依赖的记忆系统 Mnemosyne（SQLite + 向量搜索）持续迭代，隐私敏感场景下可实现子毫秒级查询延迟，适合需要本地记忆能力的开发者深度集成。

实践心得

今日学习最深刻的感受是：2026 年下半年，AI Agent 领域的竞争将从”模型能力”转向”编排可靠性”。

AgentForge 的 Harness 编程模式和 Hermes Agent 的 Skills 技能管家，本质上都在解决同一个问题——给 AI Agent 提供可预测的运行环境。约束不是限制，而是让 AI 输出更可预测、可持续改进的基础设施。这与 DevOps 思维引入 AI 编程的趋势高度一致。

国产化 Agent 生态的快速成熟（从 49元/月的平价 Agent Plan 到 Mnemosyne 等开源记忆系统）意味着 2026 年下半年，中小开发者和企业自建 Agent 的门槛将大幅降低。关键机会点在于：如何在”编排可靠性”和”开发者友好度”之间找到最佳平衡点。