GPT4 признан лучшей моделью искусственного интеллекта на чатбот-арене

Опубликовал
Вадим Карпусь

В сервисе LMSYS Chatbot Arena обновился рейтинг больших языковых моделей искусственного интеллекта. Он позволяет оценить, какие модели сейчас лучше всего справляются со своими задачами.

LMSYS Chatbot Arena — это краудсорсинговая открытая платформа для оценки больших языковых моделей (LLM). Для составления рейтинга оцениваются более 300 тыс. человеческих отзывов о работе моделей по системе рейтинга Эло.

Как работает тест — люди вводят запрос и выбирают лучший ответ из нескольких вариантов от разных моделей. На основе тысяч пользовательских тестов формируется и ранжируется топ.

Как показывает новый рейтинг чатбот-арены, лидером среди LLM в настоящее время является GPT4. Недавние утверждения Claude, что их модель лучше, не подтвердились. Она заняла третье место. Сразу за ней расположилась модель Bard (Gemini Pro) от Google. Все эти модели получили рейтинг Эло более 1200.

Онлайн курс UI/UX Design Pro від Ithillel.
Навчіться проєктувати інтерфейси з урахуванням поведінки користувачів, розв'язувати їх проблеми через Customer Journey Mapping, створювати дизайн-системи і проводити дослідження юзабіліті, включаючи проєктування мобільних додатків для Android та iOS і розробку UX/UI на основі даних!
Дізнатися більше

Ознакомиться с подробными актуальными результатами ранжирования имеющихся больших языковых моделей можно по следующему адресу.

Disqus Comments Loading...