Meituan представила LongCat-2.0 — модель на 1,6 трлн параметров, обученную только на китайских чипах

Китайская компания Meituan выпустила и открыла модель LongCat-2.0 для агентного программирования, которую, по заявлению разработчиков, полностью обучили и запускают на кластере из более чем 50 тысяч отечественных ИИ-ускорителей без чипов Nvidia. Модель показывает конкурентные результаты в ряде тестов, но уступает лидерам в других, а название производителя чипов не раскрывается.

Китайская компания Meituan (известна прежде всего сервисами доставки еды) официально представила и открыла в исходниках большую языковую модель LongCat-2.0, ориентированную на «агентное» программирование. Ключевая заявленная особенность — модель полностью обучена и работает на кластере из более чем 50 тысяч ИИ-ускорителей китайского производства, без использования графических процессоров Nvidia.

По данным разработчиков, LongCat-2.0 насчитывает около 1,6 трлн параметров (архитектура Mixture-of-Experts, MoE — модель с «экспертами», из которых на каждый запрос активируется лишь часть), поддерживает контекст до 1 млн токенов и обучалась более чем на 35 трлн токенов. Команда LongCat существует лишь с 2023 года, а её первая модель вышла в конце прошлого года.

Meituan заявляет, что появление LongCat-2.0 показывает возможность обучать крупномасштабные модели на отечественных вычислительных кластерах. Это может рассматриваться как сигнал на фоне американских экспортных ограничений на поставку в Китай передовых ИИ-чипов, действующих с 2022 года.

Результаты неоднозначны. На части тестов LongCat-2.0 конкурирует с сильными западными моделями: по заявленным данным, на SWE-bench Pro (59,5) и SWE-bench Multilingual (77,3) она опережает Gemini 3.1 Pro и GPT-5.5, но уступает Claude Opus 4.7 и 4.8. При этом на ряде других бенчмарков — IFEval (90,0), IMO-AnswerBench (81,8), GPQA-diamond (88,9) — модель местами заметно отстаёт от Gemini и GPT-5.5.

Важная оговорка: Meituan не назвала конкретного производителя чипов, на которых велось обучение. Подробнее — в материале The Decoder.

Источник: the-decoder.com

Связь с редакцией