Nvidia GB200 NVL72 пока не готова для тренировки передовых ИИ-моделей

watch 8s
views 2

15:28, 26.08.2025

Содержание статьи
arrow

  • Почему тренировка пока невозможна
  • Рекомендации аналитиков и фокус Nvidia
  • Прогноз на будущее и экономическая сторона

Аналитическое агентство SemiAnalysis опубликовало разбор серверных решений для обучения искусственного интеллекта и пришло к выводу, что для тренировки передовых моделей на данный момент лучше подходят ускорители Nvidia H100 и H200, а также TPU от Google. Серверные стойки GB200 NVL72 с новейшими GPU Nvidia сталкиваются с проблемами из-за медной коммутационной платы NVLink и несовершенных средств диагностики и отладки, что приводит к простоям.

Почему тренировка пока невозможна

Теоретически "отвал" одного чипа не является критичным — в NVL72 рекомендуется обучать ИИ на 64 GPU GB200, а еще 8 оставлять в резерве. Однако для их подключения необходимо быстро локализовать неисправность, что пока затруднительно из-за ограниченных диагностических инструментов. В результате останавливается процесс обучения, откатываются чекпоинты и затягивается ремонт. SemiAnalysis отмечает, что пока не известен ни один завершенный пример тренировки передовой модели на GB200 NVL72.

Рекомендации аналитиков и фокус Nvidia

На текущий момент аналитики советуют использовать GB200 NVL72 преимущественно для инференса — запуска уже обученных моделей. Nvidia в последних материалах также делает акцент на инференсе, хотя в ранних анонсах предполагалась параллельная работа над тренировкой и запуском моделей.

Прогноз на будущее и экономическая сторона

SemiAnalysis прогнозирует, что Nvidia сможет устранить проблемы с NVLink и программным обеспечением до конца года. При этом стоимость владения одним GPU GB200 в 1,6–1,7 раза выше, чем у H100. Чтобы оправдать инвестиции в новые ускорители, они должны демонстрировать минимум в 1,6 раза большую производительность при аналогичном времени простоя.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 16384
OS
CentOS
Software
Software
Keitaro

55.54

При оплате за год

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 4096 Linux

16.8

При оплате за год

-9.5%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 32768 Windows

74.49

При оплате за год

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 2048 Linux

8.99

При оплате за год

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 32768
OS
CentOS
Software
Software
Keitaro

77.54

При оплате за год

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 1024 Linux

6.1

При оплате за год

-24.7%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
4 TB
KVM-SSD 4096 Metered Linux

31

При оплате за год

-15.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
60 Mbps
DDoS Protected SSD-wKVM 4096 Windows

73

При оплате за год

-9.6%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
wKVM-SSD 32768 Metered Windows

156

При оплате за год

-15.4%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
100 Mbps
DDoS Protected SSD-wKVM 16384 Windows

130

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.