NVLM 1.0 от NVIDIA: Мощная альтернатива GPT-4o с впечатляющими результатами

watch 7s
views 2

14:53, 19.09.2024

Компания NVIDIA представила новое семейство мультимодальных моделей NVLM (NVIDIA Vision Language Model), которые обеспечивают выдающиеся результаты в ряде визуальных и языковых задач. Семейство включает три основные модели: NVLM-D (модель только для декодера), NVLM-X (модель X-аттеншн) и NVLM-H (гибридная модель), каждая из которых доступна в конфигурациях с 34 и 72 миллиардами параметров.

Одной из ключевых особенностей моделей является их способность эффективно справляться с визуальными задачами. В тесте OCRBench, проверяющем способность распознавать текст с изображений, модель NVLM-D превзошла GPT-4o от OpenAI, что является важным прорывом в области мультимодальных решений. Более того, модели способны понимать мемы, разбирать человеческий почерк и отвечать на вопросы, требующие точного анализа расположения объектов на изображениях.

NVLM также хорошо справляются с математическими задачами, где они превосходят модели Google и всего на три балла отстают от лидера, модели Claude 3.5, разработанной стартапом Anthropic.

Каждая из трех моделей имеет свои особенности.

  • NVLM-D использует предварительно обученный кодер и двухслойный перцептрон, что делает ее экономически эффективной, но требует больше ресурсов GPU.
  • NVLM-X использует механизм перекрестного внимания, который лучше справляется с изображениями высокого разрешения.
  • NVLM-H сочетает в себе преимущества обеих моделей, обеспечивая баланс между эффективностью и точностью.


NVIDIA продолжает укреплять свои позиции в области искусственного интеллекта, предлагая решения, которые могут быть полезны как для исследований, так и для бизнеса.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-9.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 4096 Windows

$ 82.9

$

При оплате за год

-8.1%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 4096 Windows

$ 36.73

$

При оплате за год

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

$ 107.66

$

При оплате за год

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

$ 215.89

$

При оплате за год

-8.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 16384 Windows

$ 53.1

$

При оплате за год

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 32768
OS
CentOS
Software
Software
Keitaro
$

При оплате за месяц

-26.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 1024 Metered Linux

$ 11.51

$

При оплате за год

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 1024 Linux

$ 7.02

$

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 8192 Linux

$ 23.95

$

При оплате за год

-20.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
8 TB
KVM-SSD 8192 Metered Linux

$ 65.63

$

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.