Nvidia GB200 NVL72 пока не готова для тренировки передовых ИИ-моделей

watch 8s
views 2

15:28, 26.08.2025

Содержание статьи
arrow

  • Почему тренировка пока невозможна
  • Рекомендации аналитиков и фокус Nvidia
  • Прогноз на будущее и экономическая сторона

Аналитическое агентство SemiAnalysis опубликовало разбор серверных решений для обучения искусственного интеллекта и пришло к выводу, что для тренировки передовых моделей на данный момент лучше подходят ускорители Nvidia H100 и H200, а также TPU от Google. Серверные стойки GB200 NVL72 с новейшими GPU Nvidia сталкиваются с проблемами из-за медной коммутационной платы NVLink и несовершенных средств диагностики и отладки, что приводит к простоям.

Почему тренировка пока невозможна

Теоретически "отвал" одного чипа не является критичным — в NVL72 рекомендуется обучать ИИ на 64 GPU GB200, а еще 8 оставлять в резерве. Однако для их подключения необходимо быстро локализовать неисправность, что пока затруднительно из-за ограниченных диагностических инструментов. В результате останавливается процесс обучения, откатываются чекпоинты и затягивается ремонт. SemiAnalysis отмечает, что пока не известен ни один завершенный пример тренировки передовой модели на GB200 NVL72.

Рекомендации аналитиков и фокус Nvidia

На текущий момент аналитики советуют использовать GB200 NVL72 преимущественно для инференса — запуска уже обученных моделей. Nvidia в последних материалах также делает акцент на инференсе, хотя в ранних анонсах предполагалась параллельная работа над тренировкой и запуском моделей.

Прогноз на будущее и экономическая сторона

SemiAnalysis прогнозирует, что Nvidia сможет устранить проблемы с NVLink и программным обеспечением до конца года. При этом стоимость владения одним GPU GB200 в 1,6–1,7 раза выше, чем у H100. Чтобы оправдать инвестиции в новые ускорители, они должны демонстрировать минимум в 1,6 раза большую производительность при аналогичном времени простоя.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 8192 Windows

28.99

При оплате за год

-15.6%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 512 Metered Linux

5.33

При оплате за год

-9.6%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
wKVM-SSD 32768 Metered Windows

156

При оплате за год

-20.4%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 2048 HK Linux

18

При оплате за год

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19

При оплате за год

-9.5%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 32768 Windows

74.49

При оплате за год

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 2048 Linux

9.09

При оплате за год

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 4096 Windows

18.1

При оплате за год

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

138.99

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.