Nvidia GB200 NVL72 пока не готова для тренировки передовых ИИ-моделей

watch 8s
views 2

15:28, 26.08.2025

Содержание статьи
arrow

  • Почему тренировка пока невозможна
  • Рекомендации аналитиков и фокус Nvidia
  • Прогноз на будущее и экономическая сторона

Аналитическое агентство SemiAnalysis опубликовало разбор серверных решений для обучения искусственного интеллекта и пришло к выводу, что для тренировки передовых моделей на данный момент лучше подходят ускорители Nvidia H100 и H200, а также TPU от Google. Серверные стойки GB200 NVL72 с новейшими GPU Nvidia сталкиваются с проблемами из-за медной коммутационной платы NVLink и несовершенных средств диагностики и отладки, что приводит к простоям.

Почему тренировка пока невозможна

Теоретически "отвал" одного чипа не является критичным — в NVL72 рекомендуется обучать ИИ на 64 GPU GB200, а еще 8 оставлять в резерве. Однако для их подключения необходимо быстро локализовать неисправность, что пока затруднительно из-за ограниченных диагностических инструментов. В результате останавливается процесс обучения, откатываются чекпоинты и затягивается ремонт. SemiAnalysis отмечает, что пока не известен ни один завершенный пример тренировки передовой модели на GB200 NVL72.

Рекомендации аналитиков и фокус Nvidia

На текущий момент аналитики советуют использовать GB200 NVL72 преимущественно для инференса — запуска уже обученных моделей. Nvidia в последних материалах также делает акцент на инференсе, хотя в ранних анонсах предполагалась параллельная работа над тренировкой и запуском моделей.

Прогноз на будущее и экономическая сторона

SemiAnalysis прогнозирует, что Nvidia сможет устранить проблемы с NVLink и программным обеспечением до конца года. При этом стоимость владения одним GPU GB200 в 1,6–1,7 раза выше, чем у H100. Чтобы оправдать инвестиции в новые ускорители, они должны демонстрировать минимум в 1,6 раза большую производительность при аналогичном времени простоя.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-5.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 2048 Windows

11.62

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 16384 Linux

49.99

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 16384 Linux

50.49

При оплате за год

-16.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
60 Mbps
DDoS Protected SSD-KVM 4096 Linux

67

При оплате за год

-4.5%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 4096 Windows

16.99

При оплате за год

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

138.99

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 2048 Linux

8.3

При оплате за год

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 4096 HK Windows

40

При оплате за год

-20.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
wKVM-SSD 16384 Metered Windows

100

При оплате за год

-9.6%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
wKVM-SSD 32768 Metered Windows

156

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.