Вышла DeepSeek-V3.1: модель ИИ получила 671 млрд параметров, гибридное мышление и улучшение эффективности

Опубликовал Андрій Русанов

Китайская DeepSeek представила модель V3.1 через две недели после выхода GPT-5. Среди ее преимуществ компания отмечает гибридный режим мышления и более умный вызов инструментов.

DeepSeek V3.1 была незаметно анонсирована в сообщении одной из групп компании на WeChat, также модель представлена на платформе Hugging Face. Следующий шаг в улучшении модели V3 использует 685 млрд параметров, что делает V3.1 одной из крупнейших в мире систем искусственного интеллекта. Впрочем, контекстное окно составляет всего 128 тыс. токенов. DeepSeek использует дизайн «смеси экспертов», активируя только необходимые части модели для каждого запроса. Это приводит к снижению вычислительных затрат, что привлекает экономных разработчиков сочетанием мощности и эффективности.

Новая модель сочетает возможности быстрого реагирования с передовым мышлением, что является техническим шагом вперед и делает ее более универсальной, чем многие альтернативы с открытым кодом. Гибридная архитектура является самой большой особенностью V3.1, отличающей ее от предыдущих итераций и других моделей. Компания отмечает три ключевых преимущества:

  • Гибридный режим мышления — одна модель поддерживает как режим мышления, так и режим без мышления, изменяя шаблон чата
  • Более умный вызов инструментов — благодаря оптимизации после обучения, производительность модели в использовании инструментов и задачах агентов значительно улучшилась
  • Лучшая эффективность мышления — DeepSeek-V3.1-Think достигает сопоставимого качества ответов с DeepSeek-R1-0528, в то же время реагируя быстрее

Многие разработчики ИИ, в частности из США, все чаще создают кастомные приложения на основе предыдущей модели DeepSeek R1. Это происходит даже несмотря на опасения в распространении китайских нарративов и сборе данных пользователей.

За информация TechSpot, отраслевые эксперты отмечают, что хотя последний релиз DeepSeek не такой большой, как появление R1, выпущенной ранее в этом году, он является большим достижением. Уильям Фалкон, основатель и генеральный директор платформы Lightning AI, назвал стабильный прогресс DeepSeek исключительным, указывая на потенциальный вызов, который он создает для OpenAI, если ее собственные предложения с открытым кодом не будут успевать за китайским конкурентом.

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.