Новая модель Qwen2.5-Max превосходит возможности DeepSeek

watch 10s
views 2

13:25, 31.01.2025

После релизов Qwen2.5, Qwen2.5-VL, стала доступной новая версия Qwen2.5-Max. Новая версия Qwen показывает высшие характеристики за DeepSeek V3 в следующих бенчмарках - GPQA-Diamond, Arena-Hard, LiveCodeBench и LiveBench.

Особенности архитектуры и модели

Версия Max – достаточно масштабный проект модели Mixture of Experts. Уникальностью этой конкретной модели стало обучение на реальных фидбеках от юзеров (RLHF), с использованием Supervised-Fine-Tuning, и конечно же обучение происходило на 20 триллионах токенов.

На данный момент данные о новой версии еще не выложены на GitHub, пока есть только доступ к API и Qwen Chat. Есть большая вероятность, что отсутствие данных на HuggingFace и GitHub свидетельствуют о спешке представить новый проект или о запланированной акции компании для стимуляции перехода на их облачную платформу.

Компания Qwen опубликовала результаты касательно новой модели. По открытых данных таблицы новой версии Qwen в сравнении с LLaMA3.1 и DeepSeek-V3, версия Max превосходит своих конкурентов в большинстве характеристик. В сравнении с Claude Sonnet и GPT, Max версия проигрывает GPT.

Компания инвестировала значительный бюджет в обучающие данные, и превосходство с конкурентами существует, но она относительно незначимое. Потому некоторые эксперты придерживаются точки зрения, что расширить возможности языковых моделей можно с помощью вычислительной мощности во время тестирования.  

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-5.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 2048 Windows

11.41

При оплате за год

-15.4%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
100 Mbps
DDoS Protected SSD-wKVM 16384 Windows

130

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 8192 Windows

28.99

При оплате за год

-4.5%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 4096 Windows

16.68

При оплате за год

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

138.99

При оплате за год

-8.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 16384 Windows

44.76

При оплате за год

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 2048 Linux

8.8

При оплате за год

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19

При оплате за год

-18.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
2 TB
wKVM-SSD 2048 Metered Windows

24

При оплате за год

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 4096 HK Windows

40

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.