Новая модель Qwen2.5-Max превосходит возможности DeepSeek

watch 10s
views 2

13:25, 31.01.2025

После релизов Qwen2.5, Qwen2.5-VL, стала доступной новая версия Qwen2.5-Max. Новая версия Qwen показывает высшие характеристики за DeepSeek V3 в следующих бенчмарках - GPQA-Diamond, Arena-Hard, LiveCodeBench и LiveBench.

Особенности архитектуры и модели

Версия Max – достаточно масштабный проект модели Mixture of Experts. Уникальностью этой конкретной модели стало обучение на реальных фидбеках от юзеров (RLHF), с использованием Supervised-Fine-Tuning, и конечно же обучение происходило на 20 триллионах токенов.

На данный момент данные о новой версии еще не выложены на GitHub, пока есть только доступ к API и Qwen Chat. Есть большая вероятность, что отсутствие данных на HuggingFace и GitHub свидетельствуют о спешке представить новый проект или о запланированной акции компании для стимуляции перехода на их облачную платформу.

Компания Qwen опубликовала результаты касательно новой модели. По открытых данных таблицы новой версии Qwen в сравнении с LLaMA3.1 и DeepSeek-V3, версия Max превосходит своих конкурентов в большинстве характеристик. В сравнении с Claude Sonnet и GPT, Max версия проигрывает GPT.

Компания инвестировала значительный бюджет в обучающие данные, и превосходство с конкурентами существует, но она относительно незначимое. Потому некоторые эксперты придерживаются точки зрения, что расширить возможности языковых моделей можно с помощью вычислительной мощности во время тестирования.  

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

7

При оплате за год

-5.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 2048 Windows

11.51

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 16384 Linux

39.87

При оплате за год

-15.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
80 Mbps
DDoS Protected SSD-KVM 8192 Linux

95

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 2048 Linux

7.7

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 2048 Linux

8.3

При оплате за год

-8.9%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 16384 Windows

56

При оплате за год

-10%

CPU
CPU
2 Epyc Cores
RAM
RAM
1 GB
Space
Space
10 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 1024 Linux

7.1

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 16384 Linux

50.49

При оплате за год

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.