Cohere открыла веса модели Command A+ на 218 млрд параметров

Cohere представила Command A+ — Sparse Mixture-of-Experts модель с 218 млрд параметров, из которых 25 млрд активны при генерации. Официальный анонс датирован 20 мая 2026 года; модель распространяется под Apache 2.0 и доступна через Hugging Face и API Cohere.

Cohere анонсировала Command A+ — новую модель семейства Command A для корпоративных сценариев, включая рассуждение, RAG, агентные задачи, мультимодальную обработку документов и многоязычные приложения. Официальная публикация Cohere датирована 20 мая 2026 года.

По данным компании, Command A+ построена как Sparse Mixture-of-Experts: общий размер модели составляет 218 млрд параметров, при этом активными при запросе являются 25 млрд. Модель выпущена под лицензией Apache 2.0; веса доступны на Hugging Face в том числе в 4-битной W4A4-квантизации.

Компания заявляет о возможности запуска «на одной GPU», но это относится не к любой видеокарте: в спецификации Cohere указаны минимальные конфигурации 1× NVIDIA B200 или 2× NVIDIA H100 для W4A4. В release notes также указаны контекст 128 тыс. токенов на входе, до 64 тыс. токенов на выходе, поддержка 48 языков и доступность модели command-a-plus-05-2026 через стандартные API Cohere.

В документации Cohere описывает Command A+ как первую MoE-модель компании и делает акцент на приватных развёртываниях для организаций, которым важны контроль над инфраструктурой и обработка данных в собственном окружении.

Источник: cohere.com

Связь с редакцией