Claude Mythos、AI が解決できなかった専門家サイバータスクの 73% を突破
概要
英国の AI セキュリティ研究所 (AISI) による評価によると、Anthropic の Claude Mythos Preview AI は、完全なシミュレーションされた企業ネットワーク攻撃を完了した最初の AI となりました。このモデルは、これまでどの AI も解決できなかった専門家レベルのキャプチャー・ザ・フラッグタスクで 73% の成功率を達成しました。32 ステップの企業ネットワーク攻撃シミュレーションでは、Mythos Preview は平均 22 ステップを完了し、Claude Opus 4.6 を大幅に上回りました。Anthropic はまた、Claude Mythos Preview が指示された場合にゼロデイ脆弱性を検出し、悪用できると報告しています。その高度な機能のため、Anthropic はこのモデルを一般公開せず、代わりにセキュリティ研究に使用しています。これらの発見は、米国財務長官スコット・ベッセント氏と連邦準備制度理事会議長ジェローム・パウエル氏が主要銀行の CEO と会談し、潜在的なサイバーリスクについて警告するなど、ハイレベルな議論を促しました。AISI は、組織が基本的なサイバーセキュリティ対策を優先することを推奨しています。
(出典:BeInCrypto)