Alibaba Cloud сократила нагрузку на GPU для ИИ-сервисов почти в пять раз
14:46, 22.10.2025
Alibaba Cloud сделали вывод о том, что ИИ-сервисы часто используют ресурсы нерационально. Многие ИИ-модели неравномерно потребляют мощности, при этом увеличивая нагрузку на GPU. Именно такое неэффективное распределение мощностей мешает масштабированию и увеличивает растраты, связанные с ИИ-инфрастуктурой.
Aegaeon: Перераспределение ресурсов
В ответ на замеченный челлендж, Alibaba Cloud представила систему Aegaeon, которая динамически перераспределяет ресурсы, тем самым решая проблему. Благодаря системе, графические модули теперь могут переключаться между моделями в реальном времени, даже во время генерации ответов.
Почему Aegaeon — это выгодно
Новая система позволяет одному GPU обслуживать до семи моделей одновременно, что гораздо продуктивней в сравнении с прошлыми двумя-тремя моделями. При использовании Aegaeon задержки при переключении между задачами сократились на 97%.
Система уже используется на маркетплейсе Bailian от Alibaba Cloud. И это представляет собой важный на пути к более дешевой и устойчивой ИИ-инфраструктуре.