Результаты бенчмарков Grok 4.1 Fast и детали о Agent Tools API

watch 12s
views 2

16:37, 24.11.2025

Содержание статьи
arrow

  • Grok 4.1 Fast занимает лидирующую позицию
  • Agent Tools API – инструменты для автономных агентов

Команда xAI поделилась результатами бенчмарков, на которых Grok 4.1 Fast становиться лидером среди своих конкурентов. Кроме того, разработчики детальнее рассказали об инфраструктуре Agent Tools API.

Grok 4.1 Fast занимает лидирующую позицию

Исходя из обновленной информации по бенчмаркам от xAI, Grok 4.1 Fast занимает лидирующие позиции в таких категориях:

  • τ²-bench Telecom: в данной категории новая модель показывает максимально возможный 100% результат и значительно опережает Claude Sonnet 4.5, GPT-5.1, и Grok 4.
  • Berkeley Function Calling v4: новая модель показывает 72% в категории точности при низкой стоимости и также становится лидером.
  • Длинный контекст: модель сохраняет стабильное качество до 2-миллионного контекстного окна. К примеру, в данной категории новая модель показывает результат в 67%, а Grok 4 всего 22%.

Agent Tools API – инструменты для автономных агентов

Agent Tools API – это набор серверных инструментов, которые предоставляют доступ к внешним операциям и реальным данным.

С помощью API агент может:

  • Комбинировать несколько инструментов в цепочке автоматически.
  • Использовать интеллектуальный поиск в загруженном документе.
  • Подключаться к внешним MCP-серверам.
  • Осуществлять поиск данных в X в реальном времени.
  • Запуск кода Python в безопасной среде.

Особенностью инструментов – есть то, что они полностью функционируют на инфраструктуре xAI. Таким образом нет необходимости управлять окружениями, ключами, или лимитами, Grok самостоятельно определяет какие шаги нужны и вызывает необходимый инструмент, также могут осуществляться параллельные вызова.

На данный момент есть доступ к 2 вариантам модели: reasoning для задач с глубоким рассуждением и non-reasoning для мгновенных ответов. Инструмент Agent Tools API находится в бесплатном доступе для юзеров xAI, а модель будет бесплатна до 3 декабря.

Поделиться

Была ли эта статья полезной для вас?

Популярные предложения VPS

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 16384 Linux

£ 34.85

£

При оплате за год

-9.5%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 32768 Windows

£ 64.45

£

При оплате за год

-16.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-KVM 2048 Linux

£ 41.81

£

При оплате за год

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 2048 Linux

£ 7.67

£

При оплате за год

-18.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
2 TB
wKVM-SSD 2048 Metered Windows

£ 20.91

£

При оплате за год

-21.4%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
500 GB
wKVM-SSD 8192 HK Windows

£ 58.36

£

При оплате за год

-7.1%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 4096 Windows

£ 18.29

£

При оплате за год

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 8192 Linux

£ 22.51

£

При оплате за год

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

£ 6.1

£

При оплате за год

-5%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 1024 Windows

£ 10.54

£

При оплате за год

Другие статьи на эту тему

Вышла Claude Opus 4.5
Вышла Claude Opus 4.5
cookie

Принять файлы cookie и политику конфиденциальности?

Мы используем файлы cookie, чтобы обеспечить вам наилучший опыт работы на нашем сайте. Если вы продолжите работу без изменения настроек, мы будем считать, что вы согласны получать все файлы cookie на сайте HostZealot.