Рубрики НовостиИИ

Новая DeepSeek V3.2 бросает вызов GPT-5 и Gemini 3.0 Pro

Опубликовал Вадим Карпусь

После громкого дебюта и обвала американских фондовых рынков в январе 2025 года, DeepSeek снова привлекает внимание индустрии. Компания представила две новые открытые ИИ-модели: DeepSeek V3.2 и DeepSeek V3.2-Speciale.

Это еще один шаг в ее нестандартной стратегии, которая идет вразрез с подходами OpenAI и Google. Пока конкуренты заливают миллиарды долларов в вычислительные ресурсы ради прироста производительности, DeepSeek продолжает делать ставку на оптимизацию и продуманные обучающие техники. Стоит напомнить, их предыдущая модель R1 достигла уровня GPT-4o і Gemini 2.5 Pro, хотя тренировалась на менее мощных чипах.

Базовая модель DeepSeek V3.2 позиционируется как сбалансированный «ежедневный инструмент». Она сочетает экономность с возможностями агентов и, по словам компании, выдает результат на уровне GPT-5. Это первая модель DeepSeek, которая интегрирует «мышление» непосредственно в работу с инструментами — и в режиме размышления, и без него.

Но наибольшее внимание привлекает другая новинка — DeepSeek V3.2-Speciale. Компания утверждает, что этот высокопроизводительный вариант опережает GPT-5 и по чистым логическим способностям соперничает с Google Gemini 3.0 Pro. Кроме того, Speciale получила золотые медали на Международной математической олимпиаде (IMO) и Международной олимпиаде по информатике (IOI) в 2025 году. DeepSeek даже опубликовала свои финальные решения конкурсных задач, чтобы сообщество могло самостоятельно проверить их уровень.

Повышение производительности в компании объясняют механизмом DeepSeek Sparse Attention (DSA), который уменьшает вычислительную сложность при работе с большими контекстами, а также масштабируемой системой обучения с подкреплением.

Для разработчиков здесь тоже есть интересные моменты. DeepSeek создала Large-Scale Agentic Task Synthesis Pipeline — систему, которая обучает модель выполнять сложные агентные задачи на основе более 85 тыс. инструкций. Благодаря этому ИИ способен интегрировать процесс «мышления» прямо в сценарии работы с инструментами.

Обычная версия DeepSeek V3.2 уже работает в веб-версии, мобильных приложениях и через API. А вот V3.2-Speciale доступна только через API и только временно — до 15 декабря 2025 года. Специальная версия является «чистым движком рассуждения» и не поддерживает вызовы инструментов. Компания также предоставила подробные инструкции для тех, кто хочет запускать модели локально.

Источник: notebookcheck

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.