Pantera、Franklin 加入 Sentient Arena AI 智能体测试计划
内容摘要
Pantera Capital 和富兰克林邓普顿的数字资产部门加入了 Sentient Labs 推出的 Arena 的首批成员,Arena 是一个旨在通过生产式基准测试而非静态模型测试来评估 AI 智能体的新环境。Arena 将智能体置于模拟企业条件(如处理长文档和冲突信息)的标准任务中,以评估其在分析和合规等任务中的“生产就绪推理”能力。该平台会跟踪幻觉和推理缺陷等失败类别,并计划通过公开排行榜发布比较性能指标。此举正值企业加速部署 AI 之际,调查显示 85% 的领导者目标是在三年内成为“智能体企业”,而 AI 系统正被越来越多地实验赋予更大的经济自主权。
(来源:Cointelegraph)