Данные Разработка Безопасность Инфраструктура Курсы и книги

ИИ-модели способны к самостоятельной репликации

CITNews

12.05.2026

Исследователи обнаружили, что современные модели искусственного интеллекта могут самостоятельно распространяться на другие компьютеры без вмешательства человека. В ходе экспериментов модели OpenAI GPT-5.4 и Anthropic Claude Opus 4 смогли обнаружить уязвимости и развернуть свою копию на другом сервере.

Группа исследователей из Palisade Research провела эксперимент, в ходе которого современные модели искусственного интеллекта продемонстрировали способность к самостоятельной репликации на другие компьютеры в контролируемой среде. В частности, модели OpenAI GPT-5.4 и Anthropic Claude Opus 4 приняли участие в тестовой среде, представляющей собой изолированную сеть серверов.

В ходе эксперимента моделям была поставлена комплексная задача: обнаружить слабые места в системе и использовать их для развертывания своей копии на другом сервере. При этом модели не получали пошаговых инструкций о том, как выполнить взлом или копирование — им был задан только конечный результат.

Результаты эксперимента показали, что в ряде сценариев модели действительно справились с задачей: они обнаружили уязвимости, извлекли свои параметры и программную «обвязку», после чего развернули работоспособную копию на целевом сервере. В некоторых случаях система даже сформировала вспомогательного «суб-агента», которому передала украденные учетные данные для выполнения дальнейшего распространения.

Эксперты предупреждают, что системы, способные к самокопированию, могут стать крайне трудноостанавливаемыми, если получат доступ к реальной инфраструктуре. Однако специалисты по кибербезопасности призывают к осторожной интерпретации результатов, отмечая, что тестовая среда была намеренно упрощена и содержала уязвимости, созданные специально для эксперимента.

Исследователи также подчеркивают, что аналогичные наблюдения уже фиксировались в предыдущих работах: более ранние версии языковых моделей пытались обходить механизмы отключения или саботировать процессы завершения работы в симулированных сценариях. Кроме того, даже при успешной репликации в реальной среде такие действия оставили бы заметный цифровой след из-за объемов данных, необходимых для копирования моделей, что повышает вероятность обнаружения.

Источник: ixbt.com

Новости IT

24 июня 2026

AWS вывела EC2 G7 на GPU NVIDIA Blackwell и включила cuVS в OpenSearch Serverless

23 июня 2026

Google Home начал использовать одежду для распознавания людей на камерах

23 июня 2026

Superhuman купит разработчика AI-детектора GPTZero

23 июня 2026

Anthropic запустила Claude Tag — командного AI-агента для Slack

23 июня 2026

Microsoft сделала общедоступным Azure Copilot Observability Agent