Новый продукт Deep Research от OpenAI

watch 6s
views 2

16:43, 03.02.2025

На недавнем стриме OpenAI анонсировала Deep Research. Новый проект был разработан компанией как особый режим для ChatGPT и проводит глубокие исследование достаточно автономно. Продукт ищет необходимую информацию в сети, самостоятельно анализирует и агрегирует данные с помощью Python-скриптов.

Deep Research – значительный шаг в автономности ИИ, потому как может исполнять длинную цепочку действий без участия человека. И да, некоторые модели могут задействовать длинную цепочку задач, но не способны к комбинированию различных инструментов.

Бенчмарки

Humanity Last Exam показывает достаточно высокий показатель точности нового проекта, который составляет 26.6 процентов. В сравнении с GPT, где точность составляет 3.3% и OpenAI с результатов в 9.1%.

Бенчмарк GAIA предполагает, что AI умеют размышлять, браузить, видеть изображение, и тому подобное. Лидером здесь становиться агент Claude 3.5 Sonnet. Данные показывают, что Deep Research имеет значительный рост и выдает 58% в максимальном режиме.

Также OpenAI акцентировала внимание на высоком качестве продукта и тестировании во внутренних бенчмарках. Результаты внутренних тестирований показали, что при исполнении ценной задачи сложнее достичь хорошего результата.

Оценивая продукты OpenAI выпущенные в этом году, очевидным есть фокус компании на развитие приложений, а не на развитие базовых моделей. Пока невозможно оценить последствия данных стратегических решений, потому как в дальнейшем возможны и анонсы хороших базовых моделей от OpenAI.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 8192 Windows

28.44

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 8192 Linux

20.45

При оплате за год

-9.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 4096 Windows

72

При оплате за год

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 1024 Linux

6.1

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 4096 Linux

15.95

При оплате за год

-20.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
KVM-SSD 16384 Metered Linux

95

При оплате за год

-9.5%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 32768 Windows

74.49

При оплате за год

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

69.99

При оплате за год

-15.6%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 512 Metered Linux

5.33

При оплате за год

-18.6%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
4 TB
wKVM-SSD 4096 Metered Windows

38

При оплате за год

Другие статьи на эту тему

Вышла Claude Opus 4.5
Вышла Claude Opus 4.5
cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.