AI Agent 生产工程系列

这个系列解决什么问题

把 AI Agent 从 Demo 推向生产环境,需要解决一个核心问题:安全。本系列 6 篇文章按工程层级递进——从最底层的代码沙箱开始,逐层向上构建权限控制、命令安全、运行时隔离、审计日志,最后用自动化测试验证所有防护是否持续有效。每篇可独立阅读,也可按顺序构建完整知识体系。

阅读路线

📦 第 1 篇 · 入门

Agent 代码沙箱设计:让 AI Agent 安全执行代码、命令与工具

AI Agent 执行 LLM 生成的代码时如何保护主机安全?从五层边界架构(内核/文件系统/网络/进程/资源)出发,设计可落地的沙箱方案。涵盖 Docker、gVisor、seccomp 的选型对比与实施路线。

⏱ ~25 分钟 · 难度 入门

🔐 第 2 篇 · 中级

Agent 工具权限控制:如何设计 Tool ACL、审批流与最小权限

Agent 拥有全部工具访问权限是安全噩梦。从 RBAC 起步,叠加 ABAC 实现上下文感知的精细化授权,配合审批流在人机之间分配决策权。实现最小权限原则的工程方案。

⏱ ~30 分钟 · 难度 中级

🛡️ 第 3 篇 · 中高级

Agent 命令执行安全:Shell、文件系统、网络访问的风险边界

rm -rf、curl | bash、eval 注入——AI Agent 执行命令的真实事故与防御体系。从危险命令黑名单、参数化执行、路径沙箱到网络出口控制,建立多层命令安全防线。

⏱ ~30 分钟 · 难度 中高级

🏗️ 第 4 篇 · 中高级

Agent 运行时隔离:Docker、Firecracker、VM Sandbox 怎么选

Docker 共享内核不够安全?gVisor、Firecracker、Kata 怎么选?从隔离光谱到决策框架,对比不同隔离级别的安全边界、启动延迟与资源开销,给出生产环境选型建议。

⏱ ~30 分钟 · 难度 中高级

📋 第 5 篇 · 中级

Agent 审计日志设计:如何追踪一次工具调用的完整链路

设计 Agent 审计日志:用 trace_id 串联 LLM 决策、工具调用、审批与回放,覆盖数据模型、存储策略、查询模式与合规要求。让每一次 Agent 行为都有据可查。

⏱ ~25 分钟 · 难度 中级

✅ 第 6 篇 · 高级

Agent 安全评测:如何把越权、泄漏、死循环纳入自动化测试

构建 Agent 安全自动化测试体系:基于 pytest 的测试框架 + 越权调用/数据泄漏/死循环三大测试用例 + CI/CD 安全门禁。让安全测试成为每次 PR 的必经关卡——人工审查无法规模化。

⏱ ~35 分钟 · 难度 高级

📖 从第 1 篇开始

Agent 代码沙箱设计 →