AMD, OpenAI и Microsoft продвигают новый сетевой протокол для крупных AI-кластеров

AMD опубликовала материал о Multipath Reliable Connection (MRC) — новом транспортном протоколе, предназначенном для крупных кластеров, на которых обучаются современные AI-модели. В разработке спецификации участвовали AMD, OpenAI, Microsoft и другие компании.

Проблема, которую должен решать MRC, связана не с вычислениями как таковыми, а с передачей данных между огромным количеством ускорителей. При обучении больших моделей сеть становится критической частью системы: задержки, перегрузки, потеря пакетов или отказ отдельного пути могут замедлять обучение и ухудшать использование дорогого оборудования.

MRC предлагает более устойчивый подход к передаче данных в таких кластерах. В частности, он использует несколько сетевых путей, поддерживает перераспределение трафика при отказах и более точное восстановление потерянных пакетов. Для инфраструктуры AI это важное направление: масштабирование моделей всё сильнее зависит не только от GPU, но и от того, насколько хорошо устроена сеть между ними.

Источник: AMD

Новости IT
8 мая 2026
Релиз Chrome 148

Связь с редакцией