DeepSeek / Depositphotos
После громкого дебюта и обвала американских фондовых рынков в январе 2025 года, DeepSeek снова привлекает внимание индустрии. Компания представила две новые открытые ИИ-модели: DeepSeek V3.2 и DeepSeek V3.2-Speciale.
Это еще один шаг в ее нестандартной стратегии, которая идет вразрез с подходами OpenAI и Google. Пока конкуренты заливают миллиарды долларов в вычислительные ресурсы ради прироста производительности, DeepSeek продолжает делать ставку на оптимизацию и продуманные обучающие техники. Стоит напомнить, их предыдущая модель R1 достигла уровня GPT-4o і Gemini 2.5 Pro, хотя тренировалась на менее мощных чипах.
Базовая модель DeepSeek V3.2 позиционируется как сбалансированный «ежедневный инструмент». Она сочетает экономность с возможностями агентов и, по словам компании, выдает результат на уровне GPT-5. Это первая модель DeepSeek, которая интегрирует «мышление» непосредственно в работу с инструментами — и в режиме размышления, и без него.
Но наибольшее внимание привлекает другая новинка — DeepSeek V3.2-Speciale. Компания утверждает, что этот высокопроизводительный вариант опережает GPT-5 и по чистым логическим способностям соперничает с Google Gemini 3.0 Pro. Кроме того, Speciale получила золотые медали на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) в 2025 году. DeepSeek даже опубликовала свои финальные решения конкурсных задач, чтобы сообщество могло самостоятельно проверить их уровень.
Повышение производительности в компании объясняют механизмом DeepSeek Sparse Attention (DSA), который уменьшает вычислительную сложность при работе с большими контекстами, а также масштабируемой системой обучения с подкреплением.
Для разработчиков здесь тоже есть интересные моменты. DeepSeek создала Large-Scale Agentic Task Synthesis Pipeline — систему, которая обучает модель выполнять сложные агентные задачи на основе более 85 тыс. инструкций. Благодаря этому ИИ способен интегрировать процесс «мышления» прямо в сценарии работы с инструментами.
Обычная версия DeepSeek V3.2 уже работает в веб-версии, мобильных приложениях и через API. А вот V3.2-Speciale доступна только через API и только временно — до 15 декабря 2025 года. Специальная версия является «чистым движком рассуждения» и не поддерживает вызовы инструментов. Компания также предоставила подробные инструкции для тех, кто хочет запускать модели локально.
Источник: notebookcheck
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.