Red Hat запускает llm-d — платформу для масштабируемого вывода ИИ на базе Kubernetes

watch 9s
views 2

15:24, 22.05.2025

Содержание статьи
arrow

  • Ключевые особенности llm-d
  • Сотрудничество ведущих игроков ИИ-индустрии
  • Технологическая основа и архитектура

Red Hat представила llm-d — новый open source-проект, предназначенный для высокопроизводительного распределённого вывода больших языковых моделей (LLM). Платформа разработана на базе Kubernetes и ориентирована на упрощение масштабирования генеративного ИИ. Исходный код доступен на GitHub под лицензией Apache 2.0.

Ключевые особенности llm-d

Среди главных функций платформы:

  • оптимизированный планировщик вывода (Inference Scheduler) для vLLM;
  • дезагрегированная архитектура обслуживания;
  • повторное использование префиксных кэшей;
  • гибкое масштабирование в зависимости от трафика, задач и доступных ресурсов.

Сотрудничество ведущих игроков ИИ-индустрии

Разработка ведётся в партнёрстве с такими компаниями, как Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave, Hugging Face и другими. Такое сотрудничество подчёркивает серьёзность подхода к llm-d и потенциал платформы как отраслевого стандарта.

Технологическая основа и архитектура

Проект использует библиотеку vLLM для распределённого inference, а также такие компоненты, как LMCache для выгрузки KV-кэша, интеллектуальную маршрутизацию трафика с поддержкой ИИ, высокоэффективные коммуникационные API, и автоматическое масштабирование под нагрузку и инфраструктуру.

Всё это позволяет адаптировать систему под различные сценарии использования и требования к производительности. А сам запуск llm-d может стать значительным шагом в сторону демократизации мощных ИИ-систем и их доступности для широкой аудитории разработчиков и исследователей.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-24.4%

CPU
CPU
2 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 1024 HK Linux

$ 15.14

$

При оплате за год

-10%

CPU
CPU
10 Epyc Cores
RAM
RAM
64 GB
Space
Space
400 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 65536 Linux

$ 217.82

$

При оплате за год

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 8192
OS
CentOS
Software
Software
Keitaro
$

При оплате за месяц

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 2048 HK Windows

$ 30.28

$

При оплате за год

-12.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
1 TB
wKVM-SSD 1024 Metered Windows

$ 19.8

$

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 4096 Linux

$ 18.58

$

При оплате за год

-7.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 4096 Windows

$ 24.46

$

При оплате за год

-9.6%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
wKVM-SSD 32768 Metered Windows

$ 181.71

$

При оплате за год

-9.7%

CPU
CPU
10 Epyc Cores
RAM
RAM
64 GB
Space
Space
300 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 65536 Windows

$ 224.81

$

При оплате за год

-10%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 65536 Linux

$ 211.41

$

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.