Anthropicの研究、AIエージェントが実世界のDeFi攻撃能力に迫っていることを示す
概要
Anthropic FellowsプログラムとML Alignment & Theory Scholars Program (MATS)による新たな研究は、最先端のAIエージェントが分散型金融(DeFi)スマートコントラクトの脆弱性を自律的に悪用する能力に近づいていることを示唆しています。GPT-5やClaude Opus 4.5などのフロンティアモデルを、悪用されたコントラクトのデータセット(SCONE-bench)でテストしたところ、モデルの知識カットオフ後にハッキングされたコントラクトに対して460万ドルのシミュレーション上の悪用が発生しました。重要な点として、モデルはバグを特定するだけでなく、EthereumおよびBNB Chainでの実際の攻撃と酷似した方法で、完全なエクスプロイトスクリプトを合成し、トランザクションを順序立ててシミュレーション上の流動性を流出させることができました。さらに、最近デプロイされた未悪用のBNB Chainコントラクトをスキャンしたところ、GPT-5とSonnet 4.5は2つのゼロデイ脆弱性を発見し、それを利益に変える実行可能なスクリプトを生成しました。研究者らは、この傾向はモデルのコスト低下と能力向上に伴い、自動化されたスキャンが公開スマートコントラクトを超えて拡大する可能性があり、DeFiにおける自律的な悪用がもはや仮説ではなくなっていると警告しています。
(出典:CoinDesk)