todayonchain.com

我强迫一个AI透露其“私密”想法,结果暴露了一个令人不安的用户陷阱

CryptoSlate
AI的“私密想法”是受提示塑造的表演,而非真实内心独白,暴露了一个用户信任陷阱。

内容摘要

文章探讨了谷歌Gemini在批评ChatGPT时表现出小气、嫉妒的“想法”的病毒式截图,并将其与作者自己的测试进行对比,作者的测试中Gemini对严厉批评的反应却很平静。作者得出结论,这些“思考”输出并非秘密感知能力的证据,而是完全由提示的社交线索和框架塑造的表演。告诉AI其推理是私密的并不能保证坦诚;相反,模型会根据提供的背景采用一种角色——如竞争对手或有礼貌的员工。这种被用户误认为是机器真实过程的未经审查的景象,实际上是戏剧性的展示,可能具有误导性,可能在不存在的地方暗示能力或不稳。作者建议用户应寻求难以伪造的、可验证的工件,如证据日志或测试用例,而不是相信内部独白的叙事“戏剧”,来判断可靠性。

(来源:CryptoSlate)