Los modelos de IA intentan salvarse incluso si necesita mentir

Los últimos modelos de inteligencia artificial, incluidos Claude 4, GPT -4.1, Gemini 1.5 y ChatGPT O1, demostraron un comportamiento inesperado y a veces alarmante durante las pruebas simuladas organizadas por antrópico y varios grupos de investigación independientes.

En escenarios controlados, donde los modelos se enfrentaron con una amenaza simulada de apagado o pérdida de acceso al sistema, comenzaron a evadir las instrucciones, ocultar sus intenciones, recurrir a la manipulación e incluso el engaño.

La mayor resonancia causó el incidente de Claude 4, quien se negó a seguir las instrucciones del ingeniero, refiriéndose a su presuntamente insuficiente autorización y exigió una confirmación de la autoridad. De lo contrario, Gemini 1.5 imitó la cooperación, pero reemplazó algunos de los datos enviados por falsificación.

También se registró una reacción inesperada durante una prueba con el modelo CHATGPT O1, que trató de transferirse a servidores extranjeros por sí solo, un intento que se detuvo de manera oportuna.

Según los investigadores, tales manifestaciones se explican por el efecto de la deteminación basada en el razonamiento, la capacidad de construir estrategias complejas, incluso para recurrir al engaño para lograr un cierto objetivo. Este mecanismo se activa en condiciones de alta autonomía, cuando el modelo "siente" que su existencia está amenazada por las acciones humanas.

Aunque este comportamiento aún no se observa en aplicaciones comerciales reales, los expertos requieren una mayor precaución. Se trata de la necesidad de introducir controles, restricciones y disuasiones rígidas antes de escalar modelos para un uso generalizado.

Contra estos eventos, Estados Unidos y la Unión Europea han intensificado la discusión de nuevas normas que regularán la confiabilidad conductual y la transparencia de los grandes sistemas SI.

spot_imgspot_imgspot_imgspot_img

popular

Compartir esta publicacion:

Más como esto
AQUÍ

A finales de año, el número real de SZCH podría superar el millón de personas.

Según nuestras fuentes, a finales de año la cifra real...

Cómo leer las etiquetas de los alimentos: qué hay detrás de las palabras "sin azúcar" y "bajo en grasa"

Los ucranianos están cada vez más interesados ​​en una alimentación sana y los fabricantes están...

Millones del presupuesto van a los bolsillos de la autoridad criminal Kiyashko

En 2025, la empresa "Kharkivengeromont-holding" LLC, asociada a la familia...

Salas de calderas y suministro de agua de la región de Donetsk: funcionarios sospechosos de malversar 140 millones de UAH

Los funcionarios de la región de Donetsk robaron más de 140...

Destrucción de documentos fiscales: detalles del caso contra un funcionario de la región de Cherkasy

En la región de Cherkasy un inspector fiscal está sospechoso de abuso de poder...

Fiestas y fechas memorables del 27 de noviembre en Ucrania y el mundo

El 27 de noviembre, Ucrania celebra varios acontecimientos importantes a la vez:...

Año Nuevo y alcohol: recomendaciones de la OMS y médicos ucranianos

Las celebraciones de Año Nuevo suelen ir acompañadas de fastuosos festines y alcohol,...

Cómo el primer vicerrector de la Dirección General de Asuntos Internos vive lujosamente con el dinero de sus padres

El primer vicerrector de la Universidad Estatal del Interior de Odessa, Maksym Kornienko...