DeepSeek abre el código del sistema de archivos 3FS — para servidores de entrenamiento de IA

Noticias Tecnologías 03-03-2025 a las 17:32 comment
Durante la Semana del Código Abierto, DeepSeek hizo de código abierto su sistema de archivos paralelo Fire-Flyer Fire System (3FS). Según la empresa, 3FS alcanza una velocidad de lectura agregada de 7,3 TB/s en sus propios clústeres de datos de servidores, donde se utiliza desde 2019.

ChatGPT «piensa» en chino — usuarios notaron caracteres en justificaciones de modelos

Noticias Suave 01-16-2025 a las 13:54 comment
ChatGPT con la modelo lingüística o1 se toma «más tiempo para reflexionar» para una mejor respuesta. Los usuarios han notado que las «reflexiones» a veces ocurren en chino, independientemente del idioma de la consulta.

Un YouTuber ha creado un clúster de cinco Apple Mac mini M4 — ¿cómo de efectivo es?

Noticias Dispositivos 11-26-2024 a las 18:25 comment
El videoblogger demostró un clúster informático de nuevos Apple Mac minis alimentados por un procesador M4. A veces es mejor que una tarjeta gráfica potente.

Gemini 1.5 Flash — modelo Google multimodal rápido con una ventana contextual de 2 millones de tokens

Noticias Suave 05-14-2024 a las 21:05 comment
Google anunciado anuncia el lanzamiento de Gemini 1.5 Flash, un pequeño modelo multimodal diseñado para escalar y resolver problemas estrechos de alta frecuencia.

Conoce MAI-1: el nuevo modelo de IA de 500.000 millones de parámetros de Microsoft que pretende «batir» GPT

Noticias Suave 05-07-2024 a las 09:22 comment
Microsoft parece estar trabajando en su propio modelo de gran lenguaje, que potencialmente se convertirá en un importante competidor para la IA Google, Anthropic і OpenAI — a pesar de que la propia corporación invirtió 10.000 millones de dólares del desarrollador ChatGPT y recibió el derecho prioritario a utilizar sus productos.

Los grandes modelos lingüísticos (LLM) de IA se vuelven «más encubiertamente racistas» tras la intervención humana

Noticias Ciencia y espacio 03-13-2024 a las 13:42 comment
Desde el principio, quedó claro que los modelos lingüísticos a gran escala (LLM) como ChatGPT absorben mensajes racistas de los millones de páginas de Internet de las que aprenden. Los desarrolladores han respondido a esto intentando hacerlos menos tóxicos. Pero una nueva investigación demuestra que estos esfuerzos, especialmente a medida que…

Spelling error report

The following text will be sent to our editors: