Мир уже несколько месяцев активно использует ChatGPT, основанный на предыдущей версии языковой модели OpenAI – обновление сможет устранить недостатки в работе чат-бота, надеемся и те, что касаются предоставления обманчивых или ошибочных ответов.
Компания утверждает, что GPT-4 более «креативная» и может решать сложные задачи с большей точностью благодаря расширенным общим знаниям. Языковая модель может анализировать даже изображения, однако будет отвечать только в текстовой форме.
OpenAI уже сотрудничает с рядом компаний, которые планируют интегрировать GPT-4 в собственные продукты – это электронная платформа изучения языков Duolingo; компания Stripe, разрабатывающая решения для электронных платежей; образовательная организация Khan Academy. Новая модель доступна через ChatGPT Plus — подписку на ChatGPT от $20 в месяц, а ее API впоследствии опубликуют для разработчиков (здесь можно записаться в список ожидания).
Генеральный директор OpenAI Сэм Альтман написал в Twitter, что GPT-4 «все еще имеет недостатки и все еще ограничен».
Однако улучшение, говорят в компании, можно увидеть по результатам тестов, включая LSAT (тест для юристов), SAT Math (тест по математике) и SAT Evidence-Based Reading & Writing (экзамены по чтению и письму). В упомянутых тестах GPT-4 набрал 88% и выше, полный список экзаменов и баллы системы можно просмотреть здесь.
За последний год было много спекуляций относительно GPT-4 и его возможностей, многие предполагали, что это будет огромный прогресс по сравнению с предыдущими системами. Однако судя по объявлению OpenAI, улучшения не очень значительны.
«Люди хотят разочарования и они его получат», — сказал Альтман в интервью о GPT-4 в январе.
Слухи еще больше активизировались после того, как руководитель Microsoft проговорился, что система будет запущена на этой неделе. Он предположил, что система будет мультимодальной, то есть способной генерировать не только текст, но и аудио или видео.
GPT-4 действительно мультимодальная, но это отображается в функции восприятия, а не воспроизведения. Компания говорит, что способность модели анализировать текст и изображение одновременно позволяет ей интерпретировать более сложные входные данные.
Новая версия также может принимать и создавать более длинные записи – до 25 000 слов.
Ожидаемо, свободный доступ к ИИ-технологиям не обошелся без проблем — система образования пытается адаптироваться к программному обеспечению, которое пишет тексты, похожие на человеческие; онлайн-сайты, такие, как Stack Overflow и научно-фантастический журнал Clarkesworld, были вынуждены закрыть прием материалов из-за наплыва контента, созданного ИИ; и раннее использование инструментов ИИ в журналистике тоже было не очень простым.
Источник: The Verge