Результаты бенчмарков Grok 4.1 Fast и детали о Agent Tools API
16:37, 24.11.2025
Команда xAI поделилась результатами бенчмарков, на которых Grok 4.1 Fast становиться лидером среди своих конкурентов. Кроме того, разработчики детальнее рассказали об инфраструктуре Agent Tools API.
Grok 4.1 Fast занимает лидирующую позицию
Исходя из обновленной информации по бенчмаркам от xAI, Grok 4.1 Fast занимает лидирующие позиции в таких категориях:
- τ²-bench Telecom: в данной категории новая модель показывает максимально возможный 100% результат и значительно опережает Claude Sonnet 4.5, GPT-5.1, и Grok 4.
- Berkeley Function Calling v4: новая модель показывает 72% в категории точности при низкой стоимости и также становится лидером.
- Длинный контекст: модель сохраняет стабильное качество до 2-миллионного контекстного окна. К примеру, в данной категории новая модель показывает результат в 67%, а Grok 4 всего 22%.
Agent Tools API – инструменты для автономных агентов
Agent Tools API – это набор серверных инструментов, которые предоставляют доступ к внешним операциям и реальным данным.
С помощью API агент может:
- Комбинировать несколько инструментов в цепочке автоматически.
- Использовать интеллектуальный поиск в загруженном документе.
- Подключаться к внешним MCP-серверам.
- Осуществлять поиск данных в X в реальном времени.
- Запуск кода Python в безопасной среде.
Особенностью инструментов – есть то, что они полностью функционируют на инфраструктуре xAI. Таким образом нет необходимости управлять окружениями, ключами, или лимитами, Grok самостоятельно определяет какие шаги нужны и вызывает необходимый инструмент, также могут осуществляться параллельные вызова.
На данный момент есть доступ к 2 вариантам модели: reasoning для задач с глубоким рассуждением и non-reasoning для мгновенных ответов. Инструмент Agent Tools API находится в бесплатном доступе для юзеров xAI, а модель будет бесплатна до 3 декабря.