MCP 协议推动 AI Agent 自主执行任务,安全风险飙升,MSB 基准筑牢防线

张开发
2026/4/16 23:11:23 15 分钟阅读

分享文章

MCP 协议推动 AI Agent 自主执行任务,安全风险飙升,MSB 基准筑牢防线
Agent 背后的 MCP 安全风险MCP 极大地拓展了 Agent 的能力同时也显著扩大了攻击范围。在 MCP 体系下Agent 的工具调用流程通常包含任务规划、工具调用、响应处理三个阶段每一个阶段都有可能成为新的攻击入口。MSB 覆盖完整的 MCP 工具调用阶段专门用于评估基于 MCP 工具使用的 Agent 安全性具有 MCP 攻击分类体系、基于真实环境的执行套件、平衡性能与安全的指标 NRP 三大核心亮点。所有攻击方式均有效研究团队使用 MSB 对 GPT - 5、DeepSeek - V3.1、Claude 4 Sonnet、Qwen3 等 10 款主流模型进行大规模测试所有攻击方式均表现出有效性总体平均 ASR 为 40.35%。MCP 引入的新型攻击更具侵略性混合攻击展现出协同增强效果。越强大的模型反而越脆弱不同指标间的关系揭示能力越强的模型往往更容易受到攻击。在 MSB 中具有更高实用性的 LLM 因更出色的工具调用和指令遵循能力表现出更高的 ASR揭示了 MCP 安全漏洞的巨大实际风险。全阶段、多工具环境侵害从 MCP 工作流程和工具配置角度分析在 MCP 的所有阶段 Agent 都易遭受攻击工具调用阶段模型安全性最低。即便在包含无害工具的多工具环境中攻击依然有效。总结OpenClaw 的火爆让人们看到 Agent 的未来MSB 系统揭示 MCP 生态潜在攻击面为 Agent 安全研究提供可复现、可量化的系统评测基准表明攻击面正从文本空间扩展到工具生态安全成为技术跃迁必须跨越的门槛。

更多文章