banner
Новости ИИ 25.08.2025 comment views icon

Вышла DeepSeek-V3.1: модель ИИ получила 671 млрд параметров, гибридное мышление и улучшение эффективности

author avatar

Андрій Русанов

Редактор новостей

Вышла DeepSeek-V3.1: модель ИИ получила 671 млрд параметров, гибридное мышление и улучшение эффективности

Китайская DeepSeek представила модель V3.1 через две недели после выхода GPT-5. Среди ее преимуществ компания отмечает гибридный режим мышления и более умный вызов инструментов.

DeepSeek V3.1 была незаметно анонсирована в сообщении одной из групп компании на WeChat, также модель представлена на платформе Hugging Face. Следующий шаг в улучшении модели V3 использует 685 млрд параметров, что делает V3.1 одной из крупнейших в мире систем искусственного интеллекта. Впрочем, контекстное окно составляет всего 128 тыс. токенов. DeepSeek использует дизайн «смеси экспертов», активируя только необходимые части модели для каждого запроса. Это приводит к снижению вычислительных затрат, что привлекает экономных разработчиков сочетанием мощности и эффективности.

Новая модель сочетает возможности быстрого реагирования с передовым мышлением, что является техническим шагом вперед и делает ее более универсальной, чем многие альтернативы с открытым кодом. Гибридная архитектура является самой большой особенностью V3.1, отличающей ее от предыдущих итераций и других моделей. Компания отмечает три ключевых преимущества:

  • Гибридный режим мышления — одна модель поддерживает как режим мышления, так и режим без мышления, изменяя шаблон чата
  • Более умный вызов инструментов — благодаря оптимизации после обучения, производительность модели в использовании инструментов и задачах агентов значительно улучшилась
  • Лучшая эффективность мышления — DeepSeek-V3.1-Think достигает сопоставимого качества ответов с DeepSeek-R1-0528, в то же время реагируя быстрее

Многие разработчики ИИ, в частности из США, все чаще создают кастомные приложения на основе предыдущей модели DeepSeek R1. Это происходит даже несмотря на опасения в распространении китайских нарративов и сборе данных пользователей.

За информация TechSpot, отраслевые эксперты отмечают, что хотя последний релиз DeepSeek не такой большой, как появление R1, выпущенной ранее в этом году, он является большим достижением. Уильям Фалкон, основатель и генеральный директор платформы Lightning AI, назвал стабильный прогресс DeepSeek исключительным, указывая на потенциальный вызов, который он создает для OpenAI, если ее собственные предложения с открытым кодом не будут успевать за китайским конкурентом.

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: