GPT-4.5: новый этап в развитии языковых моделей

watch 11s
views 2

18:37, 28.02.2025

Выпущена новая языковая модель GPT-4.5, которая будет более естественной чем предыдущие версии, но ценовая политика будет выше.

Сейчас GPT-4.5 доступен в качестве “Research Preview” для разработчиков и юзеров Pro версии. На следующей неделе планируется открытие доступа для юзеров Team и Plus.

Значительное отличие версии GPT-4.5 от модели o3-mini и о1, в том, что новая версия отвечает намного быстрее из-за изменения в подходе к “неконтролируемом обучению”. Так как новая модель не думает перед ответом, производительность значительно увеличилась.

GPT-4.5 также известна под названием Orion и есть самой большой обученной моделью на данный момент. OpenAI заявляют, что новая модель не будет “пограничной” такие заявления от компании возможно связаны с обучением еще одной модели о3.

Цена модели значительно выше версии GPT-4o и о1 и составляет $75 (за миллион входных токенов) и $150 (за миллион выходных). Как и предыдущие версии этот вариант будет иметь длину контекста в 128 000 токенов.

В компании OpenAI заявили, что 2 основных подхода (рассуждение и обучение) будут использоваться как взаимодополняемые варианты. Версия 4.5 уже стала значительно интеллектуальней из-за предварительного обучения. Также есть большая возможность что новая версия GPT-5 сможет объединить эти 2 возможности.

Результаты бенчмаркинга

Что касается тестов производительности, то модель 4.5 показывает хорошие результаты и достигает 62.5% по SimpleQA. В том же тесте Grok 3 показал результат в 43.6%, а GPT-4o – 43,6%. Уровень галлюцинаций также значительно снижен до рекордных 37,1%. Также новая версия 4.5 доминирует в тестах на оценку людей в повседневных вопросах, творческом интеллекте, и профессиональных вопросах.

В тестах STEM результаты варьируются от моделей. Например, в тесте AIME '24 модель 4.5 показывает результат в 36,7%, o3-mini – 87,3% и GPT-4o – 9,3%. В тесте SWE-Bench Verified результат составляет 38,8%, в то время как o3-mini – 61,0% а GPT-4o – 30,7%.

Если сравнивать результаты всех бенчмарков, то показатели достаточно стабильные и нет значительного скачка в производительности как показал SimpleQA.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-18.6%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
4 TB
wKVM-SSD 4096 Metered Windows

38

При оплате за год

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 32768 Linux

70.49

При оплате за год

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 2048 HK Windows

26

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 8192 Linux

25.85

При оплате за год

-9.3%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 16384 Windows

53.99

При оплате за год

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

69.99

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 16384 Linux

50.49

При оплате за год

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 16384
OS
CentOS
Software
Software
Keitaro

55.54

При оплате за год

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19

При оплате за год

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 1024 Linux

6.6

При оплате за год

Другие статьи на эту тему

Релиз Debian 12.9
Релиз Debian 12.9
cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.