AI 智能体探索 — 从零构建自主 AI Agent

解决：Agent 在什么时候该暂停等人工确认？提出四级风险分级（AUTO/LOW_RISK/HIGH_RISK/CRITICAL）+ 审批状态机 + ApprovalRequest Schema + 超时升级链，框架无关，含 LangGraph/AgentGraph/AutoGen/CrewAI 四框架 HITL 对比。

2026-05-31

Agent 消息 Schema 设计：让多 Agent 协作可验证、可追踪

解决：多 Agent 之间消息格式怎么设计才不会追踪断链、版本不兼容？提出四层 Schema 设计模型（数据、元数据、验证、路由），完整消息类型定义 + 版本管理策略 + 可运行的三 Agent 系统参考实现。

2026-05-26

Agent 上下文协议设计：如何在工具、记忆与任务之间传递状态

解决：Agent 的工具、记忆、任务之间如何安全高效地传递状态？提出四层上下文协议架构——消息总线、工具上下文、记忆上下文、任务上下文——含完整 Python 参考实现。

2026-05-25

Agent 可观测性：生产环境 AI Agent 的指标、追踪与实时告警

解决：AI Agent 的生产环境如何监控？从 OpenTelemetry 分布式追踪、Prometheus 指标管道、实时告警规则到渐进式落地路线，含完整 Python 代码和 Alertmanager 配置。

2026-05-24

Agent 安全评测：如何把越权、泄漏、死循环纳入自动化测试

解决：AI Agent 的安全如何自动化测试？从越权检测、数据防泄漏、死循环熔断到 CI/CD 安全门禁，含完整 Python 测试框架 + GitHub Actions 示例。

2026-05-23

Agent 审计日志设计：如何追踪一次工具调用的完整链路

解决：AI Agent 的决策链如何审计？从 8 个通用字段 + 5 个条件字段的数据模型，到 trace_id/span_id 设计、OpenTelemetry 集成、日志回放与事故分析，含完整 Python 代码示例。

2026-05-22

Agent 运行时隔离：Docker、Firecracker、VM Sandbox 怎么选

解决：AI Agent 的执行环境如何隔离？从 Docker 容器、Firecracker microVM、gVisor 沙箱到硬件虚拟化，从威胁模型到生产选型的完整工程指南。

2026-05-21

Agent 命令执行安全：Shell、文件系统、网络访问的风险边界

解决：AI Agent 执行 Shell 命令时如何防止误删文件、篡改配置、越权访问？从命令模板化、文件系统只读挂载到网络白名单，完整安全方案。

2026-05-20

Agent 工具权限控制：如何设计 Tool ACL、审批流与最小权限

解决：AI Agent 的工具权限如何设计？从 RBAC/ABAC/ReBAC 模型选型，到参数级权限控制、人工审批流和最小权限原则，含完整 Python 权限系统代码示例。

2026-05-19

Agent 代码沙箱设计：让 AI Agent 安全执行代码、命令与工具

解决：AI Agent 如何安全执行用户不可信的代码？从五层隔离架构到 gVisor/Firecracker 选型，含完整 Python/Go 沙箱代码示例。

2026-05-18

AI Agent 评测框架设计：模型跑分之外，如何衡量 Agent 真实能力

解决：你的 Agent 在真实场景中靠不靠谱？从 5 个核心维度到完整评测流水线，含离线回归测试、在线监控、LangSmith/OpenAI Evals 对比与实战代码。

2026-05-17

MCP 协议生产环境实战：安全认证、沙箱隔离与多服务器路由

解决：MCP 从"能跑"到"生产可用"的所有工程问题。OAuth 认证、Docker 沙箱、多服务网关、OpenTelemetry 监控——官方文档完全缺失的实战指南。

2026-05-17

MCP 协议入门：为什么 AI Agent 需要一个统一的工具调用标准

解决：AI 工具调用生态碎片化。用 LSP 类比秒懂 MCP，理解架构三角 Host→Client→Server，对比 MCP 与原生 Function Calling 的本质区别。

2026-05-16

回测与验证 — 100 场历史辩论的准确率与裁判权重校准

解决：你的多 Agent 辩论系统到底比单个 Agent 好多少？完整回测框架给出硬数据答案。

2026-05-15

多 Agent 辩论协议设计：8 个 AI Agent 如何进行结构化对抗与交叉质询

解决：自由辩论中 Agent 跑题、重复、无法评分的问题。3 轮结构化协议给出可复用方案。

2026-05-15

多 Agent 辩论 × 市场分析 — 系统架构与实时数据管道

解决：如何让 8 个 Agent 用真实市场数据进行结构化辩论？从数据管道到 Agent 角色定义。

2026-05-15

🛠 工具与框架

以下工具和框架是 Agent 工程化的核心组件，按类别整理而非简单堆砌：

类别	工具 / 框架	适合主题
Agent 框架	AutoGen、LangGraph、LangChain、CrewAI、smolagents	多 Agent 协作、状态流、工具调用、任务编排
编程助手	Claude Code、Codex、OpenCode	自动化写作、代码生成、工程执行、PR 审查
协议与工具调用	MCP、Function Calling、JSON Schema	工具接入、上下文管理、标准化通信
Agent 工作流	ReAct、Plan-Execute、LLM-as-Judge	推理循环、任务规划、结果审核、自我纠错

本站内容覆盖以上所有方向，从概念理解到生产部署代码。