Новости Технологии 21.01.2025 в 08:31 comment views icon

DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно

author avatar

Катерина Даньшина

Автор новостей

DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно
Раздел Технологии выходит при поддержке

Китайская лаборатория искусственного интеллекта DeepSeek выпустила модель рассуждения R1, которая продублировала, а то и превзошла результаты o1 от OpenAI в некоторых тестах.

С плюсов — DeepSeek R1 доступна бесплатно с лимитом до 50 сообщений в день. После регистрации или авторизации нужно выбрать опцию «DeepThink».

По данным DeepSeek, R1 превосходит o1 в тестах AIME, MATH-500 и SWE-bench Verified (первый сравнивает модель с другими для оценки эффективности, второй является сборкой текстовых задач, а третий сосредотачивается на задачах программирования).

DeepSeek запустила «думающую» ИИ-модель R1
Тесты R1 / DeepSeek

Модели рассуждения отличаются тем, что могут эффективно проверять факты и избегать некоторых «ловушек», на которых обычно «тормозят» стандартные модели, а также показывать надежные результаты в естественных науках, физических и математических задачах. В то же время, по сравнению со стандартными, моделям рассуждениям необходимо немного больше времени для поиска решения.

DeepSeek R1 содержит 671 млрд параметров, тем не менее доступны и версии «попроще», которые имеют от 1,5 млрд до 79 млрд параметров — при этом наименьшая может работать и на ПК, тогда как для мощных версий понадобится сильное оборудование (тем не менее и оно доступно через API DeepSeek по цене на 90% ниже, чем OpenAI o1).

Учитывая, что DeepSeek R1 — это китайская модель, здесь есть и определенные минусы. Ее работа должна быть одобрена китайским регулятором, который должен убедиться, что ответы модели «воплощают основные социалистические ценности» (то есть R1 не ответит на вопросы о площади Тяньаньмэнь или автономии Тайваня).

Интересно, что одна из предыдущих ИИ-моделей DeepSeek также превзошла многих конкурентов по популярным тестам (в частности в программировании и написании эссе), однако имела интересную особенность — считала, что она ChatGPT (вероятно, из-за того, что обучалась на данных американской конкурентки).

Новая модель ChatGPT o1 «плела интриги против людей» и мешала себя выключить во время контрольных тестов, — Apollo Research

Источник: TechCrunch

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: