Вышла Claude Opus 4.5
16:57, 25.11.2025
24 ноября вышла модель Claude Opus 4.5 от Anthropic. На данном этапе, компания считает ее самой мощной опцией для управления компьютером, агентных сценариев, и программирования. Кроме того, модель значительно улучшили и теперь она оптимальнее осуществлять работу с таблицами, презентациями, и анализирует информацию.
Модель уже доступна на 3 крупных облачных платформах, в приложениях Anthropic, и через Claude API. Сейчас цена за использование составляет – 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов.
Кроме того, компания осуществила обновления Claude Code, Claude Developer Platform, и пользовательские приложения. Появился десктопный сценарий использования, инструменты для долгоживущих агентов, и интеграция с Chrome/Excel. Также, за счет автоматического сворачивания предыдущего контекста можно продолжить длину диалога в приложениях Claude.
Первое впечатление от использования
При тестировании в Anthropic, модель моментально справляется с неоднозначными задачами, самостоятельно анализирует сложные ситуации, и взвешивать компромиссы без детальных подсказок. Модель тестировали на внутренний бенчмарк, и за 2 часа модель показала лучший результат чем любой человек, который проходил тот же тест.
Данный тест ориентирован на проверку качества и техники решения в очень сжатых временных рамках. Claude Opus 4.5 обгоняет самых сильных экспертов, которые сдавали этот тест на позицию performance-инженеров.
Opus 4.5 имеет лучшие характеристики по рассуждению, зрению, и математике если сравнивать с предыдущими версиями. Также, модель показывает топовые результаты в 7 из 8 языков программирования.
Согласованность и безопасность
На сегодняшний день, Claude Opus 4.5 считается самой безопасной моделью и топовой в согласованности. При использовании модели в критичных сценариях, ожидается что она не сломается при атаке хакеров. В проекте значительно усилили устойчивость к prompt injection – наличие в запросе вредоносных скрытых инструкций.
Новинки в Claude Developer Platform
Модель решает задачи за значительно меньшее число шагов и тратит меньше токенов, чем предыдущие версии.
В Claude API появился параметр effort, с помощью которого можно использовать максимальную глубину размышлений или выбрать опцию экономии токенов и времени. На среднем уровне effort Opus 4.5 показывает лучшие результаты чем Sonnet 4.5, и использует меньше выходных токенов.
Из-за сжатия контекста, управлением “усилиями”, модель закрывает больше задач и не нуждается в большом количестве ручного участия.
Developer Platform постепенно превращается в конструктор, из которого можно создать свою систему с контролем над инструментами, эффективностью, и управлением контекстом.