
OpenAI офіційно представила свою нову флагманську модель штучного інтелекту GPT-5, що стане основою для наступного покоління ChatGPT.
GPT-5 — це перша “уніфікована” модель ШІ від OpenAI, яка поєднує в собі можливості роздумів зі швидкою реакцією. В той час як попередниця, GPT-4, дозволила чатботам пропонувати розумні відповіді на широкий спектр питань, GPT-5 допоможе ChatGPT виконувати різноманітні завдання від імені користувачів, такі як створення програмних застосунків чи коротких дослідницьких звітів, або ж простіші повсякденні, на кшталт керування календарем.
Головні особливості нової моделі: “перемикач” між звичайним і режимом міркування, а також значно менша кількість галюцинацій (“думаюча” GPT-5 має галюцинації у 4,8% випадків, тоді як o3 та GPT-4o демонстрували показники 22% та 20,6%). Відсьогодні GPT-5 буде доступна для всіх користувачів ChatGPT, як стандартна модель.
Гендиректор OpenAI Сем Альтман вже сміливо заявив, що GPT-5 є “найкращою моделлю у світі” і значним кроком компанії на шляху до розробки ШІ, який “зможе перевершити людей” — тобто до AGI (загальний ШІ).
З моменту запуску у 2022 році й до сьогодні ChatGPT досяг 700 млн користувачів щотижня й обробляє 1,7 млн запитів за хвилину. Однак в OpenAI ще більш амбітна мета, яка передбачає, що її чатботом користуватиметься кожна восьма людина на Землі.
Що показала GPT-5 у тестах?
За словами OpenAI, GPT-5 є “найсучаснішим” ШІ в окремих сферах, дещо випереджаючи за ключовими тестами провідні моделі від Anthropic, Google DeepMind та xAI Ілона Маска.
- У SWE-bench Verified — тесті реальних завдань кодування, взятих з GitHub — GPT-5 набрала 74,9% з першої спроби. Для порівняння, у Claude Opus 4.1 від Anthropic 74,5%, а у Gemini 2.5 Pro від Google DeepMind — 59,6%.
- На “Останньому іспиті людства” — складному тесті, що вимірює продуктивність моделей штучного інтелекту в математиці, гуманітарних та природничих науках — версія GPT-5 з розширеним мисленням (GPT-5 Pro) набрала 42%. Це трохи менше, ніж xAI зміг досягти з Grok 4 Heavy, який набрав 44,4% у тесті.
- У GPQA Diamond — тесті з наукових питань рівня PhD — GPT-5 pro набрала 89,4% з першої спроби, перевершивши Claude Opus 4.1, який набрав 80,9%, та Grok 4 Heavy, який набрав 88,9%.
- В тесті HealthBench Hard Hallucinations, що вимірює точність відповідей моделей ШІ на теми охорони здоров’я, GPT-5 показала галюцинації лише в 1,6% випадків. Це набагато нижче, ніж у попередніх моделей GPT-4o та o3, які набрали 12,9% та 15,8% відповідно.
- У бенчмарку Tau-bench, що вимірює агентну здатність моделі виконувати симульовані онлайн-завдання, GPT-5 демонструє змішані результати: в частині тесту, що вимірює здатність штучного інтелекту орієнтуватися на вебсайтах авіакомпаній, GPT-5 отримала 63,5%, трохи поступаючись o3, яка мала 64,8%; в іншій частині тесту, що вимірює здатність штучного інтелекту орієнтуватися на вебсайтах роздрібної торгівлі, GPT-5 отримує 81,1%, поступаючись Claude Opus 4.1, який мав 82,4%.
Крім того, OpenAI стверджує, що GPT-5 краща за інші моделі ШІ у складніших для вимірювання, суб’єктивних сферах, таких як креативний дизайн та письмо, а також “безпечніша” — читай, менш схильна до інтриг та брехні, ніж інші моделі. До того ж GPT-5 вміло розрізняє зловмисників, які намагаються зловживати ChatGPT, та користувачів, які роблять нешкідливі запити.
Покращення інтерфейсу ChatGPT і бонуси для передплати
Відтепер користувачі можуть обрати одного з чотирьох персонажів для ШІ: Циніка, Робота, Слухача або Зануду, які адаптуватимуть відповіді ChatGPT відповідно до своєї “особистості”.
Попри те, що GPT-5 доступна всім, платні користувачі матимуть свої переваги:
- Для тарифу Plus за $20 передбачені вищі ліміти;
- Власники передплати Pro за $200 взагалі не матимуть обмежень.
Організації, що користуються планами OpenAI Team, Edu та Enterprise, отримають доступ до GPT-5 як моделі за замовчуванням наступного тижня. Для розробників GPT-5 з’явиться в API OpenAI у трьох розмірах — gpt-5, gpt-5-mini та gpt-5-nano. Базова модель обійдеться в $1,25 за млн вхідних токенів та $10 за млн вихідних.
OpenAI представила моделі ШІ gpt-oss для запуску на відеокарті або ноутбуці
Джерело: OpenaAI, TechCrunch
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: