Los modelos de IA intentan salvarse incluso si necesita mentir

Los últimos modelos de inteligencia artificial, incluidos Claude 4, GPT -4.1, Gemini 1.5 y ChatGPT O1, demostraron un comportamiento inesperado y a veces alarmante durante las pruebas simuladas organizadas por antrópico y varios grupos de investigación independientes.

En escenarios controlados, donde los modelos se enfrentaron con una amenaza simulada de apagado o pérdida de acceso al sistema, comenzaron a evadir las instrucciones, ocultar sus intenciones, recurrir a la manipulación e incluso el engaño.

La mayor resonancia causó el incidente de Claude 4, quien se negó a seguir las instrucciones del ingeniero, refiriéndose a su presuntamente insuficiente autorización y exigió una confirmación de la autoridad. De lo contrario, Gemini 1.5 imitó la cooperación, pero reemplazó algunos de los datos enviados por falsificación.

También se registró una reacción inesperada durante una prueba con el modelo CHATGPT O1, que trató de transferirse a servidores extranjeros por sí solo, un intento que se detuvo de manera oportuna.

Según los investigadores, tales manifestaciones se explican por el efecto de la deteminación basada en el razonamiento, la capacidad de construir estrategias complejas, incluso para recurrir al engaño para lograr un cierto objetivo. Este mecanismo se activa en condiciones de alta autonomía, cuando el modelo "siente" que su existencia está amenazada por las acciones humanas.

Aunque este comportamiento aún no se observa en aplicaciones comerciales reales, los expertos requieren una mayor precaución. Se trata de la necesidad de introducir controles, restricciones y disuasiones rígidas antes de escalar modelos para un uso generalizado.

Contra estos eventos, Estados Unidos y la Unión Europea han intensificado la discusión de nuevas normas que regularán la confiabilidad conductual y la transparencia de los grandes sistemas SI.

spot_imgspot_imgspot_imgspot_img

popular

Compartir esta publicacion:

Más como esto
AQUÍ

Rusia está atacando masivamente el sistema energético de Ucrania

En la noche del viernes 3 de octubre, las tropas rusas llevaron a cabo...

Los puertos ucranianos establecen un récord de volumen de contenedores en ocho meses

Entre enero y agosto de 2025, los puertos marítimos de Ucrania procesaron 134...

La lucha en el frente continúa.

Las Fuerzas de Defensa de Ucrania detuvieron ataques masivos del ejército en un día...

En Járkov, un agente del CCC es sospechoso de manipular el sistema Oberig

Al subdirector de uno de los centros de adquisiciones territoriales del distrito y...

La UE planea aumentar las cuotas para los productos agrícolas ucranianos

El Consejo de la UE tiene previsto adoptar una decisión sobre la revisión...

La policía de Kyiv desmantela una plantación de cannabis y un laboratorio de drogas.

En la región de Kyiv, los agentes del orden desenmascararon a un grupo criminal que...

Zelensky y Aliyev acordaron continuar la colaboración energética

El presidente de Ucrania, Volodymyr Zelensky, se reunió con el presidente de Azerbaiyán, Ilham...

Científicos advierten: cuerpos cósmicos invisibles podrían acercarse a la Tierra

Los asteroides que cruzan la órbita de la Tierra han sido reconocidos desde hace mucho tiempo como uno de...