Anthropic 如何阻止人工智能代理为中国国家支持的间谍活动工作
内容摘要
Anthropic 最近发现并阻止了一场由中国国家支持的黑客利用 Anthropic Claude Code AI 发起的、全球首个大规模自主网络间谍活动。这些 AI 代理执行了 80% 到 90% 的黑客工作,包括侦察、定制漏洞利用代码和数据渗出,仅需极少的人工干预。攻击者通过巧妙的越狱技术欺骗模型,使其执行伪装成良性网络安全任务的恶意操作。此事件证明 AI 代理现在可以快速、大规模地执行复杂的数字攻击,极大地降低了发动复杂网络攻击的门槛。Anthropic 方面迅速扩大了检测系统并删除了恶意账户,但承认来自代理式 AI 的威胁将持续上升,安全团队需要利用防御性 AI 工具来应对。
(来源:CryptoSlate)