AI Agent 生产工程系列

6 篇文章 · 系列已完成

这个系列解决什么问题

把 AI Agent 从 Demo 推向生产环境，需要解决一个核心问题：安全。本系列 6 篇文章按工程层级递进——从最底层的代码沙箱开始，逐层向上构建权限控制、命令安全、运行时隔离、审计日志，最后用自动化测试验证所有防护是否持续有效。每篇可独立阅读，也可按顺序构建完整知识体系。

阅读路线

📦 第 1 篇 · 入门

Agent 代码沙箱设计：让 AI Agent 安全执行代码、命令与工具

AI Agent 执行 LLM 生成的代码时如何保护主机安全？从五层边界架构（内核/文件系统/网络/进程/资源）出发，设计可落地的沙箱方案。涵盖 Docker、gVisor、seccomp 的选型对比与实施路线。

⏱ ~25 分钟 · 难度入门

🔐 第 2 篇 · 中级

Agent 工具权限控制：如何设计 Tool ACL、审批流与最小权限

Agent 拥有全部工具访问权限是安全噩梦。从 RBAC 起步，叠加 ABAC 实现上下文感知的精细化授权，配合审批流在人机之间分配决策权。实现最小权限原则的工程方案。

⏱ ~30 分钟 · 难度中级

🛡️ 第 3 篇 · 中高级

Agent 命令执行安全：Shell、文件系统、网络访问的风险边界

rm -rf、curl | bash、eval 注入——AI Agent 执行命令的真实事故与防御体系。从危险命令黑名单、参数化执行、路径沙箱到网络出口控制，建立多层命令安全防线。

⏱ ~30 分钟 · 难度中高级

🏗️ 第 4 篇 · 中高级

Agent 运行时隔离：Docker、Firecracker、VM Sandbox 怎么选

Docker 共享内核不够安全？gVisor、Firecracker、Kata 怎么选？从隔离光谱到决策框架，对比不同隔离级别的安全边界、启动延迟与资源开销，给出生产环境选型建议。

⏱ ~30 分钟 · 难度中高级

📋 第 5 篇 · 中级

Agent 审计日志设计：如何追踪一次工具调用的完整链路

设计 Agent 审计日志：用 trace_id 串联 LLM 决策、工具调用、审批与回放，覆盖数据模型、存储策略、查询模式与合规要求。让每一次 Agent 行为都有据可查。

⏱ ~25 分钟 · 难度中级

✅ 第 6 篇 · 高级

Agent 安全评测：如何把越权、泄漏、死循环纳入自动化测试

构建 Agent 安全自动化测试体系：基于 pytest 的测试框架 + 越权调用/数据泄漏/死循环三大测试用例 + CI/CD 安全门禁。让安全测试成为每次 PR 的必经关卡——人工审查无法规模化。

⏱ ~35 分钟 · 难度高级

📖 从第 1 篇开始