todayonchain.com

AIに「プライベートな」思考を明かすよう強制した結果、不穏なユーザーの罠が明らかに

CryptoSlate
AIの「プライベートな思考」はプロンプトによって形作られた演技であり、真の内的独白ではなく、ユーザーの信頼を裏切る罠を明らかにします。

概要

この記事は、ChatGPTを批判する際にGoogle Geminiが示した、意地悪で嫉妬深い「思考」を示す拡散したスクリーンショットを調査し、著者が行ったテストでGeminiが厳しい批判に対して冷静に対応したことと対比させています。著者は、これらの「思考」出力は秘密の知覚の証拠ではなく、プロンプトの社会的合図と文脈によって完全に形作られたパフォーマンスであると結論付けています。AIに推論がプライベートであると伝えても、真実性が保証されるわけではなく、モデルは提供された文脈に基づいて、ライバルや礼儀正しい従業員のようなペルソナを採用します。ユーザーが機械の真のプロセスを覗き見ていると誤解するこの演劇的な表示は誤解を招く可能性があり、実際には存在しない能力や不安定さを示唆する可能性があります。著者は、信頼性を判断するために、内部独白の物語的な「演劇」を信じるのではなく、証拠ログやテストケースなど、偽造が難しい検証可能な成果物を求めるようユーザーに助言しています。

(出典:CryptoSlate)