Anthropic
Anthropic представила Claude Sonnet 4.5 — “найсучасніший ШІ для програмування”, зі слів самої компанії.
З основного: Claude Sonnet 4.5 здатна створювати “готові до виробництва” застосунки, а не просто прототипи, і може програмувати досить довгий час без перерв. До прикладу, в одному з тестів модель написала код для створення застосунку рівня Slack і самостійно завершила завдання, на що пішло близько 30 годин — у 4 рази довше, аніж попередній рекорд для ШІ Anthropic і показники OpenAI GPT-5-Codex.
Водночас дослідник штучного інтелекту Anthropic Девід Герші розповів TechCrunch, що в цей час Claude Sonnet 4.5 не лише створювала застосунок, а й забезпечувала роботу служб баз даних, купувала доменні імена та проходила аудит SOC 2, щоб переконатися в безпеці продукту.
Claude Sonnet 4.5 показує приріст в середньому 3% в усіх бенчмарках, найбільші покращення чатбот демонстрував у роботі з ПК та різними сервісами — 61% проти 42% раніше.
Важливо й те, що зі слів Anthropic, модель Sonnet 4.5 є її “найбезпечнішою системою штучного інтелекту на сьогодні”, оскільки вона пройшла “широке” навчання з безпеки. Це означає, що чатбот суттєво менше схильний до підлабузництва, обману чи галюцинацій — тобто усіх тих рис, які приносили OpenAI проблеми останніми місяцями. Водночас Anthropic посилила захист Sonnet 4.5 і тепер модель постачається з фільтрами, призначеними для запобігання потенційно небезпечним відповідям, пов’язаним зокрема із підказками щодо хімічної, біологічної та ядерної зброї.
Claude Sonnet 4.5 буде доступний через API Claude та в чатботі Claude (в тому числі й для безплатних користувачів, але з обмеженнями). Вартість для розробників: $3 за 1 млн вхідних токенів та $15 за 1 млн вихідних токенів.
Серед решти оновлень, представлених Anthropic:
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.