DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно

Китайская лаборатория искусственного интеллекта DeepSeek выпустила модель рассуждения R1, которая продублировала, а то и превзошла результаты o1 от OpenAI в некоторых тестах.

С плюсов — DeepSeek R1 доступна бесплатно с лимитом до 50 сообщений в день. После регистрации или авторизации нужно выбрать опцию «DeepThink».

По данным DeepSeek, R1 превосходит o1 в тестах AIME, MATH-500 и SWE-bench Verified (первый сравнивает модель с другими для оценки эффективности, второй является сборкой текстовых задач, а третий сосредотачивается на задачах программирования).

DeepSeek запустила «думающую» ИИ-модель R1 — Тесты R1 / DeepSeek

Модели рассуждения отличаются тем, что могут эффективно проверять факты и избегать некоторых «ловушек», на которых обычно «тормозят» стандартные модели, а также показывать надежные результаты в естественных науках, физических и математических задачах. В то же время, по сравнению со стандартными, моделям рассуждениям необходимо немного больше времени для поиска решения.

DeepSeek R1 содержит 671 млрд параметров, тем не менее доступны и версии «попроще», которые имеют от 1,5 млрд до 79 млрд параметров — при этом наименьшая может работать и на ПК, тогда как для мощных версий понадобится сильное оборудование (тем не менее и оно доступно через API DeepSeek по цене на 90% ниже, чем OpenAI o1).

Учитывая, что DeepSeek R1 — это китайская модель, здесь есть и определенные минусы. Ее работа должна быть одобрена китайским регулятором, который должен убедиться, что ответы модели «воплощают основные социалистические ценности» (то есть R1 не ответит на вопросы о площади Тяньаньмэнь или автономии Тайваня).

Интересно, что одна из предыдущих ИИ-моделей DeepSeek также превзошла многих конкурентов по популярным тестам (в частности в программировании и написании эссе), однако имела интересную особенность — считала, что она ChatGPT (вероятно, из-за того, что обучалась на данных американской конкурентки).