
Intel no ha estado muy bien con los procesadores últimamente. ¿Quizá todos sus esfuerzos se centran en crear tarjetas gráficas y competir con NVIDIA/AMD? Hoy vamos a echar un vistazo a su última arquitectura, Intel Arc Xe2, cuyo nombre en clave es Battlemage. Y para los que ya están ansiosos por ver los resultados prácticos, ya hemos publicado una reseña editorial SPARKLE Intel Arc B580 TITAN OC en esta arquitectura.
Si sigues el ciclo revisión de la arquitecturaNecesito aclarar un punto. NVIDIA e Intel tienen sus propios nombres comerciales para sus tecnologías. Para una mejor comprensión, compararé los términos. De este modo, intentaré aumentar el nivel general de comprensión.
NVIDIA | Intel |
Bloques SM | Núcleos Xe |
Núcleos tensoriales | XMX (Xe Matrix eXtension Engines) |
Núcleos RT | RTU (RayTracing Unit) |
GPC | Render Slice |
DLSS | XeSS |
Contenido
Arquitectura de He 2 Battlemage
Cada núcleo Xe de segunda generación consta de 8 motores vectoriales, 8 motores XMX, 256 KB de caché L1 compartida con memoria local compartida y varias unidades adicionales de control e interconexión. El núcleo Xe de segunda generación admite de forma nativa operaciones SIMD16.
En los procesadores móviles Lunar Lake, la caché L1 y SLM combinadas es de 192 KB.
SIMD (Single Instruction/Multiple Data; Una instrucción/múltiples datos) es un método de cálculo que permite procesar varios datos con una sola instrucción. Mientras que el enfoque secuencial habitual de utilizar una instrucción para procesar un único dato se denomina operaciones escalares. Uno de los ejemplos de su mejora es AVX instrucciones.
Las operaciones SIMD sólo pueden paralelizarse a nivel de hardware. Esta capacidad mejora el rendimiento de la computación vectorizada, muy utilizada en aplicaciones matemáticas, científicas y gráficas.
Mecanismo vectorial (Xe Vector Engine, XVE) — es una unidad que ejecuta instrucciones. En todos los XVE, las unidades de cálculo básicas son SIMD de coma flotante. Otro nombre más conocido para XVE es Unidad Lógica Aritmética (ALU). Sin embargo, la XVE es una versión mejorada de la ALU. La XVE soporta instrucciones de coma flotante y enteras como MAD o MUL, así como instrucciones matemáticas avanzadas como sin, cos, exp, log і rcp.
Como ya se ha mencionado, el motor vectorial actualizado tiene soporte SIMD16 y SIMD32 y un mayor número de operaciones matemáticas. Por supuesto, hay soporte para INT2, INT4, INT8, FP16, BF16 y TF32.
Mecanismo de expansión de la matriz (Xe Matrix eXtension Engines, XMX) se utiliza, como su nombre indica, para calcular las operaciones matriciales necesarias para la IA. En comparación con la generación anterior, se ha mejorado el rendimiento de INT8 y FP16.
La caché L2 es el nivel superior de la jerarquía de memoria. Las peticiones de memoria de todos los segmentos de renderizado y del núcleo Xe se dirigen a la caché L2. También se ha mejorado para que admita un nuevo nivel de compresión de datos de 8 a N y una rápida limpieza de recursos.
La Unidad de Trazado de Rayos Xe (RTU) procesa las peticiones de trazado de rayos recibidas del XVE. Cada RTU tiene una caché BVH (Bounding Volume Hierarchy) para reducir la latencia media de los datos a la BVH y es capaz de manejar múltiples rayos de trazado para mejorar la eficiencia global.
Además, cada RTU cuenta con el apoyo de una unidad de clasificación de hilos (TSU), una unidad de hardware dedicada que puede clasificar y reenviar las solicitudes de rastreo a los hilos de sombreado para maximizar la coherencia SIMD de los rayos divergentes.
En comparación con la generación anterior, el número de unidades para el cálculo de canalizaciones Traversal e intersecciones Box se ha multiplicado por una vez y media, y la capacidad de memoria de las intersecciones BVH y Triangle se ha duplicado.


Juntando todo esto, Intel ofrece a los usuarios potenciales un nuevo procesador de vídeo. El chip BMG-G21 es un nuevo (y hasta ahora único) procesador gráfico de bajo coste en la actual generación de tarjetas gráficas de consumo de Intel. El procesador gráfico se suministra como parte de dos tarjetas gráficas Intel Arc B580 e Intel Arc B570. Mientras que la B580 contiene el número completo de núcleos Xe y RTU de 20 unidades cada uno, la B570 sólo contiene 18 unidades cada uno.


En comparación con la generación anterior Xe1 Alchemist, la nueva Xe2 Battlemage ha recibido un aumento muy fuerte de rendimiento en algunas áreas:
Xe1 vs Xe2 | |
Compute Dispatch XI | +700% |
Draw XI | +1250% |
Tasa de mezcla de píxeles (Pixel Blend rate) | +210% |
Ajuste de la malla del sombreador (Envío del sombreador de malla) | +410% |
Corte de índice de vértice | +200% |
Tratamiento de vértices | +150% |
Teselación | +120% |
Rayo Triángulo intersección de un triángulo | +210% |
Rayos traza | +160% |
Comentarios sobre el muestreador | +270% |


Aquí tienes una tabla comparativa con las características de ambas generaciones de tarjetas gráficas Intel. A primera vista, se puede ver que «Battlemage» es significativamente inferior en «Iron» que «Alchemist». Para algunos parámetros, la diferencia es superior a tres veces!
A770 | А750 | А580 | B580 | B570 | |
Chip | ACM-G10 | ACM-G10 | ACM-G11 | BMG-G21 | BMG-G21 |
Núcleos Xe | 32 | 28 | 24 | 20 | 18 |
Render Slice | 8 | 7 | 6 | 5 | 5 |
RTU | 32 | 28 | 24 | 20 | 18 |
XMX | 512 | 448 | 384 | 160 | 144 |
XVE | 512 | 448 | 384 | 160 | 144 |
Frecuencia | 2100 MHz | 2050 MHz | 1700 MHz | 2670 MHz | 2500 MHz |
TDP | 225 W | 225 W | 185 W | 190 W | 150 W |
Memoria de vídeo | 16 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 12 GB GDDR6 | 10 GB GDDR6 |
Ancho de banda de la memoria de vídeo | 560 GB/s | 512 GB/s | 512 GB/s | 456 GB/s | 380 GB/s |
Velocidad de la memoria de vídeo | 17,5 Gbps | 16 Gbps | 16 Gbps | 19 Gbps | 19 Gbps |
¿Es realmente cierto que la nueva generación es más débil que la anterior? No, lo que ocurre es que Intel ha hecho un trabajo increíble optimizando los controladores y colaborando estrechamente con los desarrolladores de juegos para dar soporte a las nuevas tecnologías. Incluso en revisión editorial del Intel B580 tuvo un buen rendimiento en los partidos.
Si nos fijamos en los nombres de los procesadores, algo no cuadra. El BMG-G21 se presenta se parece a una versión más débil de ACM-G11 en nombre y características. He aquí dos posibles soluciones:
- Intel presentará el chip BMG-G20 que será aún más potente para competir con la NVIDIA RTX 5060;
- Intel dejará de lanzar chips basados en esta arquitectura. Hay muchas razones para ello, pero la más obvia es la preparación para la tercera generación, para la que aún falta un año y medio.
Intel afirma que la nueva generación de tarjetas gráficas es altamente escalable, pero sin soluciones de gama media o alta, esto no es muy interesante. Es probable que veamos esta escalabilidad para soluciones empresariales y de servidor.
Puede que los tres principales actores del mercado ya se hayan repartido las cuotas de mercado entre ellos: NVIDIA se queda con las soluciones de gama alta y la Nintendo Switch 2, AMD con las de gama media y las consolas PS con Xbox, e Intel con las soluciones económicas. Este es exactamente el panorama en cuanto a tarjetas gráficas personalizadas
Intel Xe Super Sampling 2 (XeSS 2)
Tras la exitosa aparición y desarrollo de las tecnologías DLSS y FSR por parte de la competencia, Intel necesitaba su propia implementación del escalado de imágenes en los juegos basados en IA. En 2022, junto con la arquitectura Alchemist de primera generación, la empresa presentó Xe Super Sampling, que utiliza el aprendizaje profundo para sintetizar imágenes cuya calidad se aproxima a la alta resolución nativa.
Durante dos años, Intel ha estado trabajando duro para ayudar a los desarrolladores de juegos a implementar mejor XeSS. Incluso más de 150 juegos han empezado a soportarlo. Entre ellos se incluyen: Mortal Kombat 1, Tekken 8, Dying Light 2, Forza Horizon 5 y Remnant 2, entre otros.
Con el lanzamiento de las tarjetas gráficas Battlemage, Intel ha actualizado su escalador XeSS 2. Contiene tecnologías adicionales (¿No te recuerda a nada?):
- XeSS-SR (Super Resolución) — Escalado de imagen mejorado;
- XeSS-FG (Frame Generator) es un nuevo generador de tramas de Intel;
- XeSS Low Latency — Reduce la latencia al pulsar el teclado o el ratón;
Sin embargo, hay que responder a una pregunta: ¿será XeSS 2 compatible con la anterior generación de tarjetas gráficas Intel? Sí, lo será, y aquí está la confirmación por parte de Reddit y un podcast en Youtube.
Sin embargo, no hay muchos juegos compatibles con XeSS 2. Uno de los próximos lanzamientos es Assassin’s Creed Shadows. Intel necesita ahora ampliar de nuevo su biblioteca. La lista completa puede consultarse aquí por referencia.
XeSS Super Resolution



XeSS-SR es la versión alternativa de Intel del escalado de imágenes para competir con DLSS de NVIDIA. Curiosamente, en la diapositiva se nos mostraban dos modelos: uno completo y otro simplificado (Lite). Al parecer, la primera versión sólo se utilizará en tarjetas gráficas Intel, mientras que la simplificada se empleará en todas las demás. XeSS-SR también realiza su magia «» antes del generador de fotogramas.
XeSS Frame Generation



El nuevo generador de fotogramas XeSS-FG permite añadir fotogramas interpolados mediante flujo óptico y reproyección de vectores de movimiento para ofrecer una experiencia de juego más fluida. Estos fotogramas recién generados se insertan entre los fotogramas regulares que se han renderizado de forma clásica. En DLSS 3 FG se aplicó un principio similar.
No está claro cuántos fotogramas se generarán. Según la diapositiva, el juego F1 24 genera unos 1,6 fotogramas. Se nota que la Interfaz de Usuario (UI) se forma después de crear y añadir los frames. Me parece que, al igual que con XeSS-SR, hay dos modelos para FG en el SDK — completo y simplificado. Si sólo hay uno, entonces sólo funcionará con tarjetas gráficas Intel.
XeSS Low Latency
Xe Low Latency está diseñado para reducir la latencia cuando se utiliza la entrada del reproductor. Esta tecnología es necesaria para superar «jalea» al jugar con un generador de fotogramas. Análogo de NVIDIA Reflex.




La diapositiva muestra que se ha eliminado precisamente el retardo en la cola de renderizado de la CPU. Esto significa que los clics del ratón van directamente a la GPU. Por supuesto, la duración de la reducción del retardo mostrada por Intel es demasiado corta. Pero el hecho de que al hacer clic, la acción se realice en dos fotogramas a la vez — parece plausible.
PresentMon Display Latency — una aplicación para monitorizar fps, temperaturas, latencia y mucho más. Un análogo de muchas aplicaciones de monitorización, solo que de Intel.
¿Qué debe hacer Intel ahora? Según reviseLas aplicaciones más utilizadas son: «enfermedades infantiles» relacionadas con las redes neuronales y la estabilidad. Hoy en día, las tarjetas de vídeo se utilizan no sólo para el fin previsto de jugar, sino también para renderizar vídeos y crear bellas chicas o paisajes en Stable Diffusion u otras alternativas. Por lo tanto, Intel también tiene que apoyar más esta área.
Con el próximo lanzamiento de las nuevas NVIDIA RTX 5060 y AMD Radeon RX 9060 de gama baja (se desconocen los nombres exactos), Intel tendrá que lanzar nuevas tarjetas gráficas B770/B750 para competir con ellas. No olvidemos que es necesario aumentar el número de juegos compatibles con las tecnologías XeSS 2.
Intel también necesita salvar la brecha «nuevo jugador» en la mente de los usuarios finales. Tendrán que responder a las preguntas: ¿Por qué comprar Intel cuando los usuarios pueden comprar NVIDIA/AMD? Esto también se aplica a las consolas portátiles distintas de la MSI Claw. Aparte de la «Claw», no hay más consolas de Intel. También hay mucho trabajo por hacer en esta área relativamente nueva.
Este artículo se ha elaborado a partir de material oficial de Intel.
Spelling error report
The following text will be sent to our editors: