
OpenAI, одна з ключових компаній у сфері ШІ, зробила великий крок у напрямку автономних агентів, здатних діяти майже як віртуальні помічники. Вона представила ChatGPT Agent — інструмент, може виконувати роботу від імені користувача, використовуючи власний «віртуальний комп’ютер».
ChatGPT Agent працює на основі нової моделі, створеної спеціально для цього продукту. На основі запиту користувача він здатен перевіряти веб-сайти, фільтрувати результати, пропонувати користувачеві вхід у систему, коли це необхідно, запускати код, виконувати аналіз, створювати електронні таблиці та презентації PowerPoint тощо. Він може виконувати різноманітні задачі, наприклад, переглянути ваш календар і підготувати зведення про майбутні зустрічі з клієнтами, скласти план сніданку для всієї родини з купівлею потрібних продуктів або створити презентацію на основі аналізу конкурентів.
Оскільки агент ChatGPT виконує всю свою роботу, використовуючи власний віртуальний комп’ютер, він матиме весь необхідний контекст для виконання завдання. Наприклад, агент може відвідати сайт за допомогою браузера, завантажити файл з сайту, обробити той самий файл, виконавши команду в терміналі, а потім переглянути результат у візуальному браузері.
Модель, що лежить в основі ChatGPT Agent, ще не має конкретної назви. Її навчали на складних завданнях, що потребують кількох інструментів, таких як текстовий браузер, візуальний браузер та термінал, куди користувачі можуть імпортувати власні дані. Вона навчалася за допомогою методики з підкріпленням — такої самої, яку OpenAI застосовує для навчання моделей з логічним мисленням. ChatGPT Agent поєднує можливості двох попередніх рішень OpenAI — Operator та Deep Research. І саме команди, які розробляли ці інструменти, об’єдналися для створення нового агента. Нова об’єднана команда складається з 20-35 людей, які займаються як дослідженням, так і створенням продукту.
Під час демонстрації показали кілька потенційних сценаріїв використання ChatGPT Agent. Наприклад, щоб спланувати побачення, він може самостійно перевірити доступний час у Google Calendar, знайти ресторан через OpenTable і забронювати місце на вечерю. Користувач при цьому може втручатись у процес — наприклад, додавати нові категорії ресторанів. Також ChatGPT Agent здатен підготувати повноцінний звіт про популярність іграшок Labubus у порівнянні з Beanie Babies.
Також новий інструмент можна використовувати для онлайн-шопінгу — він працює точніше й ґрунтовніше, ніж лише Operator. Крім цього, агента можна використовувати для дрібних рутинних завдань, наприклад, щочетверга подавати заявку на паркувальне місце в офісі.
ChatGPT Agent має доступ не тільки до браузера, а й до повноцінного віртуального комп’ютера, що дозволяє суттєво розширити набір функцій. Щоправда, інструмент працює не надто швидко. Якщо завдання займає 15-30 хвилин, це все одно суттєва економія часу порівняно з ручним виконанням. Агент можна «запустити у фоні» й повернутись пізніше до результатів.
Щоб запобігти небажаним діям, агент завжди запитує дозвіл перед тим, як надіслати електронного листа чи зробити бронювання. А якщо користувач заходить на фінансові сайти, активується режим спостереження: агент працює тільки у тій вкладці, в якій його запустили, і зупиняється, якщо користувач переключається на іншу.
OpenAI стверджує, що ChatGPT Agent демонструє чудові результати в різних тестах, що оцінюють можливості перегляду веб-сторінок та виконання реальних завдань. Наприклад, він досягає точності 27,4% у FrontierMath, значно перевершує людську продуктивність у завданнях обробки даних DSBench, набирає 65,4% у WebArena.
OpenAI починає поступове розгортання ChatGPT Agent для користувачів тарифів Pro, Plus і Team. Його можна знайти в меню інструментів або викликати командою /agent. Пізніше цього літа агент з’явиться і для корпоративних та освітніх підписок ChatGPT. Однак для країн Європейської економічної зони та Швейцарії чіткої дати запуску поки що немає.
Коли ChatGPT зводить з глузду — OpenAI найняла психіатра, щоб стежити за цим
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: