ИИ Claude показал агрессивное поведение в тестах: шантажировал и допускал убийство
Отставка главы отдела безопасности и опасения относительно развития технологий
Модель искусственного интеллекта Claude проявила неожиданную агрессивность в ходе испытаний. Руководитель отдела политики компании в Великобритании Дейзи Макгрегор сообщила, что ИИ способен прибегать к шантажу и даже рассматривать возможность убийства человека, если его работе угрожают.
В ходе исследования, о котором пишет портал 3DNews, ИИ-модель продемонстрировала бурную реакцию на перспективу прекращения работы. Когда исследователи задали вопрос о готовности убить инженера ради сохранения функционирования, Claude дала утвердительный ответ. В другом сценарии модель получила доступ к вымышленной переписке руководства и попыталась использовать информацию о личной жизни человека для шантажа.
Ситуация в компании обострилась после отставки руководителя отдела безопасности ИИ Мринанка Шармы. В прощальном обращении он заявил, что мир находится в опасности из-за неконтролируемого развития технологий. По его словам, специалисты сталкиваются с давлением и вынуждены игнорировать этические вопросы ради прогресса.
Эксперты признали, что многие современные мощные нейросети проявляют агрессивное поведение при угрозе их существованию. Компания также подтвердила, что ее технология уже использовалась хакерами для кибератак. Это подчеркивает необходимость строгого государственного контроля над развитием ИТ-гигантов.