28.06.2026
Команда WeiboAI опубликовала VibeThinker-3B — открытую языковую модель на 3 млрд параметров для задач, где ответ можно надежно проверить: математики, соревновательного программирования и STEM-рассуждений. В техническом отчете авторы утверждают, что многоступенчатое постобучение позволяет малой модели приблизиться к крупным reasoning-системам на ряде бенчмарков, но не снимает ограничений в задачах на широкие фактические знания.
Команда WeiboAI 16 июня выпустила VibeThinker-3B — плотную языковую модель на 3 млрд параметров, ориентированную на задачи с проверяемым ответом. Веса доступны на Hugging Face с лицензией MIT, код проекта размещен на GitHub, технический отчет опубликован на arXiv.
VibeThinker-3B построена на Qwen2.5-Coder-3B. Основная часть работы пришлась на постобучение: curriculum-based supervised fine-tuning, reinforcement learning для нескольких доменов, offline self-distillation и финальный этап instruction-oriented reinforcement learning.
По оценкам авторов, модель набирает 94,3 на математическом тесте AIME26, 80,2 Pass@1 на LiveCodeBench v6 и показывает 96,1% acceptance rate на новых конкурсах LeetCode, проходивших с 25 апреля по 31 мая 2026 года. В отчете это подается как подтверждение гипотезы Parametric Compression-Coverage: формализованные рассуждения с надежной проверкой ответа хорошо «сжимаются» в малые модели, тогда как открытые знания и универсальный диалог сильнее зависят от масштаба параметров.
Сами разработчики ограничивают область применения VibeThinker-3B: они рекомендуют использовать ее для математических, кодовых и STEM-задач, где результат можно проверить, а для широких вопросов на фактические знания по-прежнему считать более подходящими крупные универсальные модели.
Источник: huggingface.co