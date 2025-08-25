banner
Вийшла DeepSeek-V3.1: модель ШІ отримала 671 млрд параметрів, гібридне мислення та покращення ефективності

Вийшла DeepSeek-V3.1: модель ШІ отримала 671 млрд параметрів, гібридне мислення та покращення ефективності
Китайська DeepSeek представила модель V3.1 через два тижні після виходу GPT-5. Серед її переваг компанія відзначає гібридний режим мислення та розумніший виклик інструментів.

DeepSeek V3.1 була непомітно анонсована у повідомленні однієї з груп компанії на WeChat, також модель представлена на платформі Hugging Face. Наступний крок у покращенні моделі V3 використовує 685 млрд параметрів, що робить V3.1 однією з найбільших у світі систем штучного інтелекту. Втім, контекстне вікно становить лише 128 тис. токенів. DeepSeek використовує дизайн «суміші експертів», активуючи лише необхідні частини моделі для кожного запиту. Це призводить до зниження обчислювальних витрат, що приваблює ощадливих розробників поєднанням потужності та ефективності.

Нова модель поєднує можливості швидкого реагування з передовим мисленням, що є технічним кроком вперед та робить її більш універсальною, ніж багато альтернатив з відкритим кодом. Гібридна архітектура є найбільшою особливістю V3.1, що відрізняє її від попередніх ітерацій та інших моделей. Компанія наголошує на трьох ключових перевагах:

  • Гібридний режим мислення — одна модель підтримує як режим мислення, так і режим без мислення, змінюючи шаблон чату
  • Розумніший виклик інструментів — завдяки оптимізації після навчання, продуктивність моделі у використанні інструментів та завданнях агентів значно покращилася
  • Краща ефективність мислення — DeepSeek-V3.1-Think досягає порівнянної якості відповідей з DeepSeek-R1-0528, водночас реагуючи швидше

Багато розробників ШІ, зокрема з США, усе частіше створюють кастомні застосунки на основі попередньої моделі DeepSeek R1. Це відбувається навіть попри побоювання у поширенні  китайських наративів та збирання даних користувачів.

За інформацією TechSpot, галузеві експерти зазначають, що хоча останній реліз DeepSeek не такий великий, як поява R1, випущеної раніше цього року, він є великим досягненням. Вільям Фалкон, засновник і генеральний директор платформи Lightning AI, назвав стабільний прогрес DeepSeek винятковим, вказуючи на потенційний виклик, який він створює для OpenAI, якщо її власні пропозиції з відкритим кодом не встигатимуть за китайським конкурентом.

