01.12.2025
За одну неделю 24–30 ноября сразу все крупные лаборатории и несколько опенсорс-команд синхронно выкатили новые флагманы. Получился мини-релиз-сезон, какого ещё не было.
То, что обычно растягивается на месяцы, на этот раз уместилось в несколько дней: OpenAI доработала линейку GPT-5, Google выпустила новое поколение Gemini, Anthropic подняла планку кода и агентов с Claude Opus 4.5, а параллельно вышли мощные открытые модели, новые генераторы картинок и видео и даже «мозг» для роботов.
Ниже — восемь событий, которые вместе хорошо описывают, куда именно двигается индустрия прямо сейчас.
Anthropic постепенно выстраивает свою линейку Claude вокруг сценариев «долгой» работы: сложный код, большие документы, таблички, презентации, аналитика. Opus 4.5 — очередной шаг в эту сторону.
Главные акценты:
По сути, Anthropic закрепляется в нише «самый надёжный и аккуратный корпоративный мозг», где важны не столько красивые демки, сколько предсказуемость и качество многошаговой работы.
OpenAI сделала шаг, который давно напрашивался концептуально: GPT-5.1 в варианте Thinking умеет сам подстраивать глубину рассуждений под задачу, а не мыслить всегда на полную катушку.
Линейка теперь выглядит так:
Параллельно OpenAI подтянула инфраструктурные вещи:
apply_patch и shell, которые позволяют агентам менять файлы и выполнять команды более осмысленно;В сумме GPT-5.1 — это не просто ещё одна цифра в названии, а шаг к более разумной трате вычислений: когда модель не «пережёвывает» одинаково долго любую задачу.
Google продолжает продвигать идею Gemini как «Android для ИИ» — базового слоя, который живёт во всех сервисах и устройствах.
В выпуске Gemini 3 фокус смещён на:
По ряду бенчмарков на планирование и сложные reasoning-задачи Gemini 3 выходит вперёд других фронтирных моделей. Для Google это способ сказать: «Мы умеем не только генерировать текст, но и строить сложные цепочки действий поверх данных».
Китайская DeepSeek изначально заявляла свои модели как альтернативу системам OpenAI и Google. В этой волне релизов компания только усиливает свои позиции: у неё сразу два важных направления — универсальные модели V3.2 / V3.2-Speciale и специализированная математическая Math V2.
DeepSeek-V3.2 и V3.2-Speciale. Это универсальные модели для рассуждений, кода и сложной математики, которые по собственным и независимым тестам выходят на уровень GPT-5-High и Gemini-3.0-Pro или местами приближаются к нему. Они работают с контекстом до 128 000 токенов, используют новую архитектуру DeepSeek Sparse Attention (DSA), которая заметно удешевляет длинные запросы, и распространяются под лицензией MIT — их можно свободно использовать и в коммерческих проектах.
DeepSeek Math V2. Отдельная специализированная модель для олимпиадной и университетской математики со встроенной самопроверкой. Math V2 ориентирована не просто на выдачу ответа, а на пошаговые доказательства и верификацию решения и на крупных бенчмарках вроде IMO-2025 и Putnam-2024 выходит на «золотой» уровень.
Это важный сдвиг: математика — область, где «сойдёт и так» не работает. Модель обязывают играть по правилам строгого доказательства, а не угадывать шаблоны.
Вместе эти модели хорошо показывают стратегию DeepSeek: сначала отточить строго проверяемую математику, а затем перенести те же принципы в широкий стек общих моделей, который способен конкурировать с закрытыми системами вроде GPT-5 и Gemini — и при этом остаётся полностью открытым и доступным по лицензии MIT.
Black Forest Labs с FLUX-линейкой изначально делали ставку на визуальное качество и управление стилем. FLUX.2 закрепляет их как одного из главных игроков в генерации изображений.
Что важно в этой версии:
Вместо игрушки «для красивых картинок» получается инструмент уровня «можно строить вокруг этого дизайн-процессы и рекламные кампании».
Если закрытый фронтир — это OpenAI, Google и Anthropic, то в открытом лагере важен другой вопрос: насколько прозрачен весь цикл обучения модели.
Здесь на сцену выходит OLMo 3 от Allen Institute for AI.
Чем он отличается:
На фоне доминирования закрытых гигантов OLMo 3 выглядит как ставка на «инфраструктуру доверия»: прозрачность важнее абсолютного лидерства в каждом бенчмарке.
Пока большинство релизов недели вращаются вокруг текста и картинок, GigaBrain-0 тихо напоминает: важнейший фронтир — это роботы.
GigaBrain-0 — это vision-language-action-модель (VLA), которая учится сразу на трёх типах сигналов:
Ключевой приём — масштабное использование синтетики: миллиарды видео и сценариев, сгенерированных world-models. Реальные демонстрации человека-оператора дополняют эту базу, а не являются единственным источником правды.
За счёт этого:
Если текстовые модели позволяют автоматизировать офис, то такие VLA-системы — попытка автоматизировать физический мир.
Runway давно позиционирует себя как студию для создателей видео на базе ИИ. Gen-4.5 — их заявка на лидерство в классе текст-в-видео-моделей.
Главные акценты:
Runway прямо заявляет, что в слепых тестах Gen-4.5 обходит сопоставимые закрытые модели конкурентов. Даже если маркетинговые формулировки слегка завышены, факт остаётся: планка качества видео-генерации снова поднялась.
Если попробовать свести эту неделю в одну картинку, получится примерно так:
На таком фоне главный вопрос действительно перестаёт звучать как «кто сильнее в среднем по больнице».
Гораздо интереснее другое: насколько быстро всё это начнут склеивать в живые цепочки и продукты