Nvidia GB200 NVL72 пока не готова для тренировки передовых ИИ-моделей

watch 8s
views 2

15:28, 26.08.2025

Содержание статьи
arrow

  • Почему тренировка пока невозможна
  • Рекомендации аналитиков и фокус Nvidia
  • Прогноз на будущее и экономическая сторона

Аналитическое агентство SemiAnalysis опубликовало разбор серверных решений для обучения искусственного интеллекта и пришло к выводу, что для тренировки передовых моделей на данный момент лучше подходят ускорители Nvidia H100 и H200, а также TPU от Google. Серверные стойки GB200 NVL72 с новейшими GPU Nvidia сталкиваются с проблемами из-за медной коммутационной платы NVLink и несовершенных средств диагностики и отладки, что приводит к простоям.

Почему тренировка пока невозможна

Теоретически "отвал" одного чипа не является критичным — в NVL72 рекомендуется обучать ИИ на 64 GPU GB200, а еще 8 оставлять в резерве. Однако для их подключения необходимо быстро локализовать неисправность, что пока затруднительно из-за ограниченных диагностических инструментов. В результате останавливается процесс обучения, откатываются чекпоинты и затягивается ремонт. SemiAnalysis отмечает, что пока не известен ни один завершенный пример тренировки передовой модели на GB200 NVL72.

Рекомендации аналитиков и фокус Nvidia

На текущий момент аналитики советуют использовать GB200 NVL72 преимущественно для инференса — запуска уже обученных моделей. Nvidia в последних материалах также делает акцент на инференсе, хотя в ранних анонсах предполагалась параллельная работа над тренировкой и запуском моделей.

Прогноз на будущее и экономическая сторона

SemiAnalysis прогнозирует, что Nvidia сможет устранить проблемы с NVLink и программным обеспечением до конца года. При этом стоимость владения одним GPU GB200 в 1,6–1,7 раза выше, чем у H100. Чтобы оправдать инвестиции в новые ускорители, они должны демонстрировать минимум в 1,6 раза большую производительность при аналогичном времени простоя.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-18.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
2 TB
wKVM-SSD 2048 Metered Windows

24

При оплате за год

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33

При оплате за год

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 32768 Linux

70.49

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 8192 Linux

115.5

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 8192 Linux

26.91

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 4096 Linux

15

При оплате за год

-9.3%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 16384 Windows

54.49

При оплате за год

-26.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 1024 Metered Linux

10

При оплате за год

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 4096 Windows

18.1

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 16384 Linux

231

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.