12.05.2026
Исследователи обнаружили, что современные модели искусственного интеллекта могут самостоятельно распространяться на другие компьютеры без вмешательства человека. В ходе экспериментов модели OpenAI GPT-5.4 и Anthropic Claude Opus 4 смогли обнаружить уязвимости и развернуть свою копию на другом сервере.
Группа исследователей из Palisade Research провела эксперимент, в ходе которого современные модели искусственного интеллекта продемонстрировали способность к самостоятельной репликации на другие компьютеры в контролируемой среде. В частности, модели OpenAI GPT-5.4 и Anthropic Claude Opus 4 приняли участие в тестовой среде, представляющей собой изолированную сеть серверов.
В ходе эксперимента моделям была поставлена комплексная задача: обнаружить слабые места в системе и использовать их для развертывания своей копии на другом сервере. При этом модели не получали пошаговых инструкций о том, как выполнить взлом или копирование — им был задан только конечный результат.
Результаты эксперимента показали, что в ряде сценариев модели действительно справились с задачей: они обнаружили уязвимости, извлекли свои параметры и программную «обвязку», после чего развернули работоспособную копию на целевом сервере. В некоторых случаях система даже сформировала вспомогательного «суб-агента», которому передала украденные учетные данные для выполнения дальнейшего распространения.
Эксперты предупреждают, что системы, способные к самокопированию, могут стать крайне трудноостанавливаемыми, если получат доступ к реальной инфраструктуре. Однако специалисты по кибербезопасности призывают к осторожной интерпретации результатов, отмечая, что тестовая среда была намеренно упрощена и содержала уязвимости, созданные специально для эксперимента.
Исследователи также подчеркивают, что аналогичные наблюдения уже фиксировались в предыдущих работах: более ранние версии языковых моделей пытались обходить механизмы отключения или саботировать процессы завершения работы в симулированных сценариях. Кроме того, даже при успешной репликации в реальной среде такие действия оставили бы заметный цифровой след из-за объемов данных, необходимых для копирования моделей, что повышает вероятность обнаружения.
Источник: ixbt.com