Nvidia готовит GPU нового поколения для работы с миллионным контекстом
16:00, 10.09.2025
Nvidia представила графический процессор Rubin CPX, спроектированный специально для языковых и мультимодальных моделей, которым необходимо удерживать и анализировать огромные объёмы данных. Чип оптимизирован под обработку контекстов свыше 1 миллиона токенов — показатель, который значительно превышает возможности современных систем.
Архитектура Disaggregated Inference
Ключевая инновация Rubin CPX — использование архитектуры disaggregated inference. При таком подходе несколько GPU обрабатывают разные части задачи, а затем объединяют результаты в единый ответ. Это повышает скорость работы, снижает задержки и делает использование ресурсов более эффективным. Особенно полезно это для анализа документов, генерации мультимедийного контента и работы с крупными кодовыми проектами.
Прорыв для бизнеса и науки
Nvidia отмечает, что Rubin CPX открывает новые горизонты для юристов, медиков и разработчиков. В праве он поможет работать с сотнями страниц законов, в медицине, сопоставлять большие массивы данных пациентов, а в IT, анализировать целые проекты вместо отдельных файлов. В творческой сфере GPU позволит генерировать длинные видеоролики и комплексные мультимедийные проекты.
Фокус на инференс, а не обучение
В отличие от традиционных решений, Rubin CPX нацелен прежде всего на оптимизацию инференса — ускорение работы уже готовых моделей. Это делает его привлекательным для компаний, которым важно быстрее внедрять ИИ в реальный бизнес при снижении затрат.
Выход на рынок
Появление Rubin CPX ожидается в конце 2026 года. Эксперты предполагают, что именно этот процессор может задать новый стандарт для индустрии, где работа с длинным контекстом перестанет быть редкостью и станет нормой.