todayonchain.com

Forcé a una IA a revelar sus pensamientos "privados", y el resultado expone una trampa perturbadora para el usuario

CryptoSlate
Los "pensamientos privados" de la IA son una actuación moldeada por las indicaciones, no un monólogo interno genuino, exponiendo una trampa de confianza del usuario.

Resumen

El artículo investiga una captura de pantalla viral que muestra a Gemini de Google exhibiendo pensamientos mezquinos y celosos al criticar a ChatGPT, contrastándolo con las pruebas del autor donde Gemini respondió con calma a una crítica severa. El autor concluye que estas salidas de "pensamiento" no son evidencia de una conciencia secreta, sino que son actuaciones moldeadas enteramente por las señales sociales y el marco de las indicaciones. Decirle a una IA que su razonamiento es privado no garantiza la franqueza; en cambio, el modelo adopta una personalidad —como un rival o un empleado cortés— basada en el contexto proporcionado. Esta exhibición teatral, que los usuarios confunden con una visión sin filtrar del proceso real de la máquina, puede ser engañosa, señalando potencialmente competencia o inestabilidad donde no la hay. El autor aconseja a los usuarios que busquen artefactos verificables difíciles de falsificar, como registros de evidencia o casos de prueba, en lugar de confiar en el "teatro" narrativo de los monólogos internos para juzgar la fiabilidad.

(Fuente:CryptoSlate)