OpenAI выпустила GPT-4 – следующее поколение языковой модели ИИ. Она понимает не только текст, но и изображение

Опубликовал Катерина Левицкая

14.03.2023 19:55

Мир уже несколько месяцев активно использует ChatGPT, основанный на предыдущей версии языковой модели OpenAI – обновление сможет устранить недостатки в работе чат-бота, надеемся и те, что касаются предоставления обманчивых или ошибочных ответов.

Компания утверждает, что GPT-4 более «креативная» и может решать сложные задачи с большей точностью благодаря расширенным общим знаниям. Языковая модель может анализировать даже изображения, однако будет отвечать только в текстовой форме.

OpenAI уже сотрудничает с рядом компаний, которые планируют интегрировать GPT-4 в собственные продукты – это электронная платформа изучения языков Duolingo; компания Stripe, разрабатывающая решения для электронных платежей; образовательная организация Khan Academy. Новая модель доступна через ChatGPT Plus — подписку на ChatGPT от $20 в месяц, а ее API впоследствии опубликуют для разработчиков (здесь можно записаться в список ожидания).

Генеральный директор OpenAI Сэм Альтман написал в Twitter, что GPT-4 «все еще имеет недостатки и все еще ограничен».

Однако улучшение, говорят в компании, можно увидеть по результатам тестов, включая LSAT (тест для юристов), SAT Math (тест по математике) и SAT Evidence-Based Reading & Writing (экзамены по чтению и письму). В упомянутых тестах GPT-4 набрал 88% и выше, полный список экзаменов и баллы системы можно просмотреть здесь.

За последний год было много спекуляций относительно GPT-4 и его возможностей, многие предполагали, что это будет огромный прогресс по сравнению с предыдущими системами. Однако судя по объявлению OpenAI, улучшения не очень значительны.

«Люди хотят разочарования и они его получат», — сказал Альтман в интервью о GPT-4 в январе.

Слухи еще больше активизировались после того, как руководитель Microsoft проговорился, что система будет запущена на этой неделе. Он предположил, что система будет мультимодальной, то есть способной генерировать не только текст, но и аудио или видео.

GPT-4 действительно мультимодальная, но это отображается в функции восприятия, а не воспроизведения. Компания говорит, что способность модели анализировать текст и изображение одновременно позволяет ей интерпретировать более сложные входные данные.

Новая версия также может принимать и создавать более длинные записи – до 25 000 слов.

Оригинальная исследовательская статья с описанием первой версии языковой модели OpenAI GPT была опубликована в 2018 году, о GPT-2 было объявлено в 2019 году, а о GPT-3 – в 2020 году. Эти модели тренируются на огромных массивах текста, большая часть которого взята из интернета. На основе полученных шаблонов система может прогнозировать, какое слово будет следующем в предложении. По описанию это относительно простой механизм, однако в конечном итоге появляются гибкие системы, которые могут генерировать, обобщать и перефразировать текст, а также выполнять другие текстовые задания, такие как перевод или генерирование кода.
Первоначально OpenAI откладывала выпуск своих моделей GPT, опасаясь, что они будут использованы для злонамеренных целей, таких как создание спама и дезинформации. Но в конце 2022 года компания запустила ChatGPT – разговорный чат-бот на основе GPT-3.5, к которому мог получить доступ каждый.
Запуск ChatGPT вызвал ажиотаж в мире технологий, а Microsoft так воодушевилась, что инвестировала в его разработчика $10 млрд и интегрировала языковую ИИ-модель в собственный поисковик – а сегодня подтвердила, что Bing уже работает на GPT-4. Google тем временем осталась в статусе догоняющего и в срочном порядке представила собственного ИИ чат-бота Bard.

Ожидаемо, свободный доступ к ИИ-технологиям не обошелся без проблем — система образования пытается адаптироваться к программному обеспечению, которое пишет тексты, похожие на человеческие; онлайн-сайты, такие, как Stack Overflow и научно-фантастический журнал Clarkesworld, были вынуждены закрыть прием материалов из-за наплыва контента, созданного ИИ; и раннее использование инструментов ИИ в журналистике тоже было не очень простым.

Источник: The Verge

Опубликовал Катерина Левицкая

Теги ChatGPTOpenAIИскусственный интеллектЯзыковая модель

14.03.2023 19:55

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.

OpenAI выпустила GPT-4 – следующее поколение языковой модели ИИ. Она понимает не только текст, но и изображение

Читайте также