Программирует до 30 часов без перерывов: Anthropic выпустила ИИ-модель Claude Sonnet 4.5

Катерина Даньшина

Anthropic представила Claude Sonnet 4.5 — «самый современный ИИ для программирования», со слов самой компании.

Из основного: Claude Sonnet 4.5 способна создавать «готовые к производству» приложения, а не просто прототипы, и может программировать достаточно долгое время без перерывов. К примеру, в одном из тестов модель написала код для создания приложения уровня Slack и самостоятельно завершила задачу, на что ушло около 30 часов — в 4 раза дольше, чем предыдущий рекорд для ИИ Anthropic и показатели OpenAI GPT-5-Codex.

Исследователь искусственного интеллекта Anthropic Дэвид Херши рассказал TechCrunch, что в это же время Claude Sonnet 4.5 не только создавала приложение, но и обеспечивала работу служб баз данных, покупала доменные имена и проходила аудит SOC 2, чтобы убедиться в безопасности продукта.

Claude Sonnet 4.5 показывает 77.2% в тесте SWE-bench Verified, который оценивает способность ИИ-моделей решать реальные проблемы в программной инженерии.

Claude Sonnet 4.5 показывает прирост в среднем 3% во всех бенчмарках, наибольшие улучшения чат-бот демонстрировал в работе с ПК и различными сервисами 61% против 42% ранее.

Sonnet 4.5 превосходит более старые модели Anthropic в кодировании и агентских задачах

Важно и то, что по словам Anthropic, модель Sonnet 4.5 является ее «самой безопасной системой искусственного интеллекта на сегодня», поскольку она прошла «широкое» обучение по безопасности. Это означает, что чат-бот существенно меньше подвержен подхалимству, обману или галлюцинациям — то есть всем тем чертам, которые приносили OpenAI проблемы в последние месяцы. В то же время Anthropic усилила защиту Sonnet 4.5 и теперь модель поставляется с фильтрами, предназначенными для предотвращения потенциально опасных ответов, связанных, в том числе с подсказками о химическом, биологическом и ядерном оружии.

Диаграмма, сравнивающая Sonnet 4.5 с другими передовыми моделями в тестах безопасности.

Доступность и другие обновления

Claude Sonnet 4.5 будет доступен через API Claude и в чат-боте Claude (в том числе и для бесплатных пользователей, но с ограничениями). Стоимость для разработчиков: $3 за 1 млн входящих токенов и $15 за 1 млн исходящих токенов.

Среди остальных обновлений, представленных Anthropic:

  • Движок Claude Agent SDK, на котором Anthropic строит агентов, доступен для всех желающих;
  • В API для Claude теперь есть «постоянная память» с возможностью удаления лишнего из контекста;
  • Claude Code теперь делает бэкапы и по команде /rewind возвращается на последнее сохранение, также добавлена команда /usage, чтобы быстро проверить лимиты;
  • Ранее также представили расширение для Chrome, которое добавляет Claude в браузер.

