Новый продукт Deep Research от OpenAI

watch 6s
views 2

16:43, 03.02.2025

На недавнем стриме OpenAI анонсировала Deep Research. Новый проект был разработан компанией как особый режим для ChatGPT и проводит глубокие исследование достаточно автономно. Продукт ищет необходимую информацию в сети, самостоятельно анализирует и агрегирует данные с помощью Python-скриптов.

Deep Research – значительный шаг в автономности ИИ, потому как может исполнять длинную цепочку действий без участия человека. И да, некоторые модели могут задействовать длинную цепочку задач, но не способны к комбинированию различных инструментов.

Бенчмарки

Humanity Last Exam показывает достаточно высокий показатель точности нового проекта, который составляет 26.6 процентов. В сравнении с GPT, где точность составляет 3.3% и OpenAI с результатов в 9.1%.

Бенчмарк GAIA предполагает, что AI умеют размышлять, браузить, видеть изображение, и тому подобное. Лидером здесь становиться агент Claude 3.5 Sonnet. Данные показывают, что Deep Research имеет значительный рост и выдает 58% в максимальном режиме.

Также OpenAI акцентировала внимание на высоком качестве продукта и тестировании во внутренних бенчмарках. Результаты внутренних тестирований показали, что при исполнении ценной задачи сложнее достичь хорошего результата.

Оценивая продукты OpenAI выпущенные в этом году, очевидным есть фокус компании на развитие приложений, а не на развитие базовых моделей. Пока невозможно оценить последствия данных стратегических решений, потому как в дальнейшем возможны и анонсы хороших базовых моделей от OpenAI.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

187.5

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 8192 Linux

25.25

При оплате за год

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

93.5

При оплате за год

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 4096 Linux

25.9

При оплате за год

-8.1%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 8192 Windows

31.9

При оплате за год

-7.1%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 4096 Windows

21

При оплате за год

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 8192 Linux

115.5

При оплате за год

-10%

CPU
CPU
10 Epyc Cores
RAM
RAM
64 GB
Space
Space
400 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 65536 Linux

187

При оплате за год

-15.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
80 Mbps
DDoS Protected SSD-KVM 8192 Linux

95

При оплате за год

-5.9%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 2048 Windows

14.8

При оплате за год

Другие статьи на эту тему

cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.