Данные Разработка Безопасность Инфраструктура Курсы и книги

В Шэньчжэне заявили о постобучении DeepSeek-V4-Pro на кластере Huawei Ascend 910C

CITNews

06.06.2026

Шэньчжэньская команда сообщила о полном постобучении всех параметров модели DeepSeek-V4-Pro с 1,6 трлн параметров на кластере с ускорителями Huawei Ascend 910C. По данным участников проекта, тренировка прошла более 1500 шагов без сбоев, MFU превысил 30%, а эффективность ключевых обучающих операторов выросла на 14%. Речь идет не о первичном обучении модели с нуля, а о более сложной, чем инференс, стадии постобучения.

Шэньчжэньская академия Хэтао совместно с Харбинским технологическим институтом в Шэньчжэне, Шэньчжэньским исследовательским институтом больших данных и командой Huawei сообщила о завершении постобучения всех параметров модели DeepSeek-V4-Pro на кластере с ИИ-ускорителями Huawei Ascend 910C.

DeepSeek-V4-Pro — крупная модель с 1,6 трлн параметров. По заявлению участников проекта, обучение выполнялось на платформе вычислений для ИИ DeepSmart City и продлилось более 1500 шагов без прерываний и ошибок. Команда также заявила о MFU выше 30% и повышении эффективности ключевых обучающих операторов на 14%.

Важная деталь: речь идет не о развертывании модели для инференса и не о небольшом дообучении отдельных слоев, а о полном параметрическом постобучении. Для модели с архитектурой MoE это требует распределения параметров по большому числу ускорителей, балансировки экспертов и устойчивой межчиповой коммуникации.

Публикация не приводит независимых бенчмарков качества полученной версии модели. Тем не менее сам факт заявленного запуска такой задачи на Ascend 910C важен для китайской экосистемы ИИ-инфраструктуры: он показывает попытку перенести на отечественные ускорители не только инференс, но и ресурсоемкие этапы подготовки больших моделей.

Источник: yicai.com

Новости IT

27 июля 2026

NOAA перенесёт вычисления для прогноза погоды в Google Cloud

27 июля 2026

NVIDIA внедряет процессоры Vera в проектирование будущих CPU и GPU

27 июля 2026

NVIDIA инвестировала в SSI Ильи Суцкевера и поможет увеличить ее вычислительные мощности в десять раз

27 июля 2026

Google показывает AI Overviews уже в 43% поисковых запросов в США

27 июля 2026

METR предложила метрику для сравнения затрат на ИИ-агентов и работу специалистов