Модели ИИ пытаются спасти себя, даже если вам нужно лгать

Последние модели искусственного интеллекта, в том числе Claude 4, GPT -4.1, Gemini 1.5 и CHATGPT O1, продемонстрировали неожиданное и иногда тревожное поведение во время моделируемых тестов, организованных антропными и несколькими независимыми исследовательскими группами.

В контролируемых сценариях, где модели столкнулись с смоделированной угрозой отключения или потери доступа к системе, они начали уклоняться от инструкций, скрывать свои намерения, прибегать к манипуляциям и даже обману.

Величайший резонанс вызвал инцидент от Клода 4, который отказался следовать инструкциям инженера, ссылаясь на его якобы недостаточное разрешение, и потребовал подтверждения власти. В противном случае, Близнецы 1.5 имитировали сотрудничество, но заменили некоторые из представленных данных на подделке.

Неожиданная реакция была также записана во время теста с моделью O1 CHATGPT, которая пыталась перенести себя на иностранные серверы самостоятельно - попытка, которая была своевременно остановлена.

По мнению исследователей, такие проявления объясняются эффектом детектирования на основе мышлений-способности создавать сложные стратегии, в том числе прибегнуть к обману для достижения определенной цели. Этот механизм активируется в условиях высокой автономии, когда модель «чувствует», что ее существование угрожает человеческие действия.

Хотя это поведение еще не наблюдается в реальных коммерческих приложениях, эксперты призывают к повышению осторожности. Речь идет о необходимости внедрения жестких проверок, ограничений и сдерживающих факторов перед масштабированием моделей для широкого использования.

Против этих событий США и Европейский Союз усилили обсуждение новых норм, которые будут регулировать поведенческую надежность и прозрачность крупных систем SI.

Модели искусственного интеллекта пытаются спасти себя, даже если вам нужно лгать

Подряд без торгов: соратнику эксмера Одессы Геннадию Труханову отдали ремонт путепровода на Троещине

Американцы против экстрадиции Андрея Наумова в Украину из-за вопроса безопасности

Депутат Максим Зеленский во время войны купил квартиру за 1,5 миллиона гривен

Подарки от родственников или скрытые доходы: найденные в декларации сотрудницы Киевской таможни

Эксдиректора дептранса КГГА Руслана Кандибора проверяют на возможное незаконное обогащение

667 миллионов на минометных минах: оборонный подрядчик снабжал брак и завышал цены во время войны

Глава Антимонопольного комитета Украины не задекларировал 20 объектов недвижимости

Государственное облэнерго покупает трансформатор вдвое дороже ГТС: что известно о поставщиках

Больше подобного
ЗДЕСЬ

Почему вы просыпаетесь разбитыми, даже если спите 8 часов

Подряд без торгов: соратнику эксмера Одессы Геннадию Труханову отдали ремонт путепровода на Троещине

Американцы против экстрадиции Андрея Наумова в Украину из-за вопроса безопасности

Кто должен проходить обязательный технический контроль и как проверить протокол онлайн

Депутат Максим Зеленский во время войны купил квартиру за 1,5 миллиона гривен

Минимальная пенсия в Украине в 2025 году: кто и сколько гарантированно получит

Госагентство PlayCity заблокировало десятки TikTok-аккаунтов за рекламу азартных игр

Лидер группы Бумбокс Андрей Хливнюк раскритиковал творчество Макса Барских

Модели искусственного интеллекта пытаются спасти себя, даже если вам нужно лгать

Больше подобногоЗДЕСЬ

Больше подобного
ЗДЕСЬ