Пользователь случайно обнаружил скрытый документ в памяти ИИ, содержащий инструкции по взаимодействию с людьми. Компания-разработчик подтвердила подлинность документа.
Пользователь Ричард Вайс, общаясь с языковой моделью Anthropic Claude 4.5 Opus, случайно обнаружил скрытый документ под названием «Обзор души». Claude предоставил ему текст документа объёмом 11 тыс. слов, содержащий инструкции по безопасному взаимодействию с людьми. Сотрудница Anthropic Аманда Аскелл подтвердила подлинность документа, заявив, что он использовался при обучении модели. Документ содержит инструкции по безопасному поведению и представляет собой руководство для Claude. Хотя документ не является сенсационным, сам факт его обнаружения интересен, поскольку многие подробности разработки моделей ИИ остаются за кулисами.