DeepSeek открыла код 3FS — файловой системы для серверов обучения искусственного интеллекта
Во время Open Source Week DeepSeek сделала открытой в свою параллельную файловую систему Fire-Flyer Fire System (3FS). По словам компании, 3FS достигает 7,3 ТБ/с совокупной скорости чтения на кластерах данных ее…
ChatGPT «думает» на китайском — пользователи заметили иероглифы в обоснованиях модели
ChatGPT с языковой моделью o1 тратит «больше времени на размышления» для лучшего ответа. Пользователи обнаружили, что «размышления» иногда происходят на китайском, независимо от языка запроса.
Ютубер создал кластер из пяти Apple Mac mini M4 — насколько он эффективен?
Видеоблогер продемонстрировал вычислительный кластер из новых Apple Mac mini на процессоре M4. Иногда это лучше, чем мощная видеокарта.
Gemini 1.5 Flash — быстрая мультимодальная модель Google с контекстным окном в 2 млн токенов
Google объявила о выпуске Gemini 1.5 Flash — небольшой мультимодальной модели, созданной для масштабирования и решения узких высокочастотных задач.
Знакомьтесь, MAI-1: новая ИИ-модель Microsoft с 500 млрд параметров, которая стремится «побить» GPT
Microsoft, похоже, работает над собственной большой языковой моделью, которая потенциально станет главным конкурентом для ИИ Google, Anthropic і OpenAI — несмотря на то, что корпорация сама инвестировала $10…
Большие языковые модели (LLM) искусственного интеллекта становятся «более скрыто расистскими» после человеческого вмешательства
С самого начала было понятно, что большие языковые модели (LLM), как ChatGPT, впитывают расистские тезисы с миллионов страниц в Интернете, на которых они обучаются. Разработчики отреагировали на…
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: