Данные Разработка Безопасность Инфраструктура Курсы и книги

WeiboAI открыла VibeThinker-3B — 3B-модель для проверяемых рассуждений

CITNews

28.06.2026

Команда WeiboAI опубликовала VibeThinker-3B — открытую языковую модель на 3 млрд параметров для задач, где ответ можно надежно проверить: математики, соревновательного программирования и STEM-рассуждений. В техническом отчете авторы утверждают, что многоступенчатое постобучение позволяет малой модели приблизиться к крупным reasoning-системам на ряде бенчмарков, но не снимает ограничений в задачах на широкие фактические знания.

Команда WeiboAI 16 июня выпустила VibeThinker-3B — плотную языковую модель на 3 млрд параметров, ориентированную на задачи с проверяемым ответом. Веса доступны на Hugging Face с лицензией MIT, код проекта размещен на GitHub, технический отчет опубликован на arXiv.

VibeThinker-3B построена на Qwen2.5-Coder-3B. Основная часть работы пришлась на постобучение: curriculum-based supervised fine-tuning, reinforcement learning для нескольких доменов, offline self-distillation и финальный этап instruction-oriented reinforcement learning.

По оценкам авторов, модель набирает 94,3 на математическом тесте AIME26, 80,2 Pass@1 на LiveCodeBench v6 и показывает 96,1% acceptance rate на новых конкурсах LeetCode, проходивших с 25 апреля по 31 мая 2026 года. В отчете это подается как подтверждение гипотезы Parametric Compression-Coverage: формализованные рассуждения с надежной проверкой ответа хорошо «сжимаются» в малые модели, тогда как открытые знания и универсальный диалог сильнее зависят от масштаба параметров.

Сами разработчики ограничивают область применения VibeThinker-3B: они рекомендуют использовать ее для математических, кодовых и STEM-задач, где результат можно проверить, а для широких вопросов на фактические знания по-прежнему считать более подходящими крупные универсальные модели.

Источник: huggingface.co

Новости IT

28 июня 2026

В CEO-Bench только две ИИ-модели увеличили капитал виртуального стартапа

28 июня 2026

США могут в ближайшие дни разрешить Anthropic вернуть Fable 5

28 июня 2026

Опрос Anthropic: более трети пользователей Claude ждут, что через год ИИ сможет делать 60% и больше их рабочих задач

28 июня 2026

WeiboAI открыла VibeThinker-3B — 3B-модель для проверяемых рассуждений

28 июня 2026

Coinbase сократила расходы на ИИ вдвое за счёт маршрутизации запросов и китайских моделей