Depositphotos
Китайская DeepSeek представила модель V3.1 через две недели после выхода GPT-5. Среди ее преимуществ компания отмечает гибридный режим мышления и более умный вызов инструментов.
DeepSeek V3.1 была незаметно анонсирована в сообщении одной из групп компании на WeChat, также модель представлена на платформе Hugging Face. Следующий шаг в улучшении модели V3 использует 685 млрд параметров, что делает V3.1 одной из крупнейших в мире систем искусственного интеллекта. Впрочем, контекстное окно составляет всего 128 тыс. токенов. DeepSeek использует дизайн «смеси экспертов», активируя только необходимые части модели для каждого запроса. Это приводит к снижению вычислительных затрат, что привлекает экономных разработчиков сочетанием мощности и эффективности.
Новая модель сочетает возможности быстрого реагирования с передовым мышлением, что является техническим шагом вперед и делает ее более универсальной, чем многие альтернативы с открытым кодом. Гибридная архитектура является самой большой особенностью V3.1, отличающей ее от предыдущих итераций и других моделей. Компания отмечает три ключевых преимущества:
Многие разработчики ИИ, в частности из США, все чаще создают кастомные приложения на основе предыдущей модели DeepSeek R1. Это происходит даже несмотря на опасения в распространении китайских нарративов и сборе данных пользователей.
За информация TechSpot, отраслевые эксперты отмечают, что хотя последний релиз DeepSeek не такой большой, как появление R1, выпущенной ранее в этом году, он является большим достижением. Уильям Фалкон, основатель и генеральный директор платформы Lightning AI, назвал стабильный прогресс DeepSeek исключительным, указывая на потенциальный вызов, который он создает для OpenAI, если ее собственные предложения с открытым кодом не будут успевать за китайским конкурентом.
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.