2026 年 3 月 19 日,蚂蚁数科正式发布"OpenClaw 龙虾卫士"。作为专为部署OpenClaw的企业设计的安全防护体系,龙虾卫士提供全生命周期、多层次的安全保障,聚焦对抗思想变异、净化 skills 仓库、风险舆情播报三大核心能力,助力企业低成本完成安全基线建设。
一、对抗思想变异:防止模型被"黑化"
随着 AI 智能体的广泛应用,提示词注入、越狱攻击等安全威胁日益凸显。龙虾卫士通过精准识别输入输出内容,拦截违规信息与恶意诱导传播源头,防止模型被"黑化"。
输入内容检测:龙虾卫士实时监测用户输入内容,识别潜在的提示词注入攻击。系统能够检测恶意诱导、越狱尝试、敏感信息窃取等行为,在输入阶段阻断安全威胁。
输出内容审核:除输入检测外,龙虾卫士还对企业 AI 智能体的输出内容进行审核。系统自动识别违规信息、敏感内容、不当建议等,确保 AI 输出符合企业安全规范。
攻击行为溯源:当检测到安全威胁时,龙虾卫士自动记录攻击来源、攻击手法、攻击时间等信息,生成详细的安全事件报告。这有助于企业追踪攻击者并完善防护策略。

二、净化 skills 仓库:合规扫描与行为审计
基于蚂蚁数科 CALIR 五维模型框架,龙虾卫士对 Skills 插件进行合规扫描与行为审计,有效识别并阻断权限越界、敏感泄露及异常调用等风险。
合规扫描:龙虾卫士自动扫描企业部署的所有 Skills 插件,检查是否存在违规代码、恶意逻辑、未授权数据访问等问题。系统支持自定义合规规则,满足企业特定安全需求。
行为审计:系统记录 Skills 插件的运行行为,包括 API 调用、数据访问、权限使用等。通过行为分析,龙虾卫士能够识别异常调用模式,及时发现潜在安全风险。
风险阻断:当检测到权限越界、敏感泄露、异常调用等风险时,龙虾卫士自动阻断相关操作并告警。企业安全团队可及时介入处理,防止安全事件扩大。

三、风险舆情播报:实时风险应急报告
龙虾卫士通过生成实时风险应急报告并主动推送,帮助企业第一时间掌握安全态势,实现风险的透明化与即时感知。
实时风险监测:龙虾卫士 7×24 小时监测企业 AI 系统的安全状态,实时收集和分析安全事件数据。系统支持多维度风险指标,包括攻击次数、风险等级、受影响范围等。
应急报告生成:当检测到安全事件时,龙虾卫士自动生成应急报告,包括事件概述、影响评估、处置建议等内容。报告支持多种格式导出,便于企业安全团队快速响应。
主动推送告警:龙虾卫士支持多种告警推送方式,包括邮件、短信、企业微信、钉钉等。企业可自定义告警阈值和推送规则,确保关键安全事件及时通知到责任人。
龙虾 AI 安全守护计划:同步启动的"龙虾 AI 安全守护计划"为企业提供低成本安全基线建设支持。计划包括安全培训、技术咨询、应急响应等服务,助力企业构建完善的 AI 安全防护体系。
行业意义:随着 OpenClaw 等 AI 智能体在企业中的广泛应用,安全问题日益凸显。龙虾卫士的发布填补了 AI 智能体安全防护的空白,为企业 AI 应用提供了可靠的安全保障。



