В мае Anthropic анонсировала две новые системы ИИ: Opus 4 и Sonnet 4. Менее чем через шесть месяцев компания представляет Sonnet 4.5, называя ее лучшей моделью для кодирования на сегодняшний день. Anthropic обосновывает это заявление результатами тестов, где новая ИИ превосходит не только своего предшественника, но и более дорогую Opus 4.1, а также конкурирующие системы, включая Gemini 2.5 Pro от Google и GPT-5 от OpenAI. Например, в OSWorld, наборе тестов, проверяющих модели ИИ на реальных компьютерных задачах, Sonnet 4.5 установила рекордный результат в 61,4%, что на 17 процентных пунктов выше, чем у Opus 4.1.
При этом новая модель способна автономно работать над многоэтапными проектами более 30 часов, что является значительным улучшением по сравнению с примерно семью часами, которые Opus 4 могла поддерживать на момент запуска. Это важная веха для типа агентных систем, которые Anthropic стремится создавать.

Sonnet 4.5 превосходит старые модели Anthropic в задачах кодирования и агентных задачах.
(Anthropic)
Что, возможно, еще важнее, компания утверждает, что Sonnet 4.5 — это самая безопасная система ИИ на сегодняшний день, поскольку модель прошла «обширное» обучение безопасности. Это обучение привело к созданию чат-бота, который, по словам Anthropic, «значительно» менее склонен к «приспособленчеству, обману, поиску власти и тенденции поощрять бредовое мышление» — все это потенциальные черты модели, которые в последние месяцы привели к проблемам для OpenAI. Одновременно Anthropic укрепила защиту Sonnet 4.5 от атак внедрения инструкций. Благодаря сложности новой модели, Anthropic выпускает Sonnet 4.5 в рамках своей системы обеспечения безопасности ИИ уровня 3, что означает наличие фильтров, предназначенных для предотвращения потенциально опасных результатов, связанных с запросами о химическом, биологическом и ядерном оружии.

График, показывающий сравнение Sonnet 4.5 с другими передовыми моделями в тестировании безопасности.
(Anthropic)
Сегодня Anthropic также внедряет улучшения качества жизни во весь стек продуктов Claude. Для начала Claude Code, популярный агент компании для кодирования, получил обновленный интерфейс терминала с новой функцией контрольных точек. Как можно догадаться из названия, они позволяют сохранять прогресс и откатываться к предыдущему состоянию, если Claude напишет какой-нибудь странный код, который работает не так, как вы ожидали. Создание файлов, которое Anthropic начал внедрять в начале месяца, теперь доступно непосредственно в диалогах с чат-ботом, а те, кто записался в список ожидания Claude для Chrome, могут начать использовать это расширение уже сегодня.
Ценообразование API для Sonnet 4.5 остается прежним: 3 доллара за один миллион входных токенов и 15 долларов за такое же количество выходных токенов. Выпуск Sonnet 4.5 завершает сильный сентябрь для Anthropic. Всего через день после того, как Microsoft добавила модели Claude в Copilot 365 на прошлой неделе, OpenAI признала, что ее конкурент предлагает лучший ИИ для рабочих задач.