
En artículos anteriores, hemos analizado las arquitecturas de las tarjetas de vídeo NVIDIA RTX 3000 y 4000, RTX 5000 Blackwell. Incluso pudimos inspeccionar el Intel Xe 2 Battlemagepero aún quedaba un competidor «rojo» más. Así que ha llegado el momento de cerrar esta Gestalt de análisis de GPU con la última cuarta generación de la Nueva Arquitectura Radeon (RDNA 4) de AMD.
Arquitectura RDNA 4
AMD lleva utilizando la arquitectura RDNA desde 2019 con el lanzamiento de las tarjetas gráficas de la serie RX 5700. Como habrás notado, la primera generación de RDNA se hizo en un chip monolítico. La segunda y la tercera generación, al igual que los modernos procesadores AMD Ryzen, utilizaban una estructura de chips: cada uno de los elementos del chip (la GPU o sus elementos, la memoria) podía fabricarse en diferentes procesos. Con el lanzamiento de RDNA 4, AMD volvió a una disposición monolítica. Se desconocen las razones exactas de este regreso. El tiempo dirá si los nuevos procesadores de AMD también serán monolíticos.
Según AMD, la nueva arquitectura proporciona un mejor soporte para Ray y Path Tracing, compresión de datos en memoria, asistencia de Machine Learning para el renderizado de imágenes y shaders programables mejorados.


La Unidad de Cálculo (CU) ha sido la parte principal de los gráficos y la computación de IA en las tarjetas gráficas AMD Radeon durante muchos años. Visualmente, comparada con las de la competencia, sigue siendo más confusa que la de Intel al principio.
Las unidades vectoriales (DU) Dual SIMD32 constan de tres partes diferentes en lugar de dos, como podría pensarse: dos ALU (unidades aritméticas lógicas), cada una de las cuales procesa valores FMA o FMA/INT, y una TLU (unidad lógica trascendental) para interactuar con números trascendentales. Un claro ejemplo de este tipo de números es π (Pi).
En la RTX 5000, NVIDIA ha combinado unidades similares en cuanto a funcionalidad en una sola.
La Unidad Escalar consta de los siguientes elementos: un registro de archivos guardados y registros especiales, una ALU interna para operaciones matemáticas, una unidad de cálculo de funciones no lineales de coma flotante y coma fija, y un mecanismo de conversión de tipos de datos. Con la nueva arquitectura, la unidad escalar admite ahora operaciones con el tipo Float32.
Este fichero puede ser de interés para algunos comentaristas expertos. O simplemente para aumentar la comprensión general.
La caché (resaltada en rojo) se distribuye entre dos estructuras: Scalar Cache (16 KB) y Shader Cache para la ejecución de instrucciones (32 KB). Y mirando al futuro, la caché también es diferente y ha recibido mejoras adicionales: la Infinite Cache de tercera generación es de 64 MB, la caché L2 es de 8 MB, y la caché CU total es ahora de 2 MB.
El planificador (resaltado en azul) distribuye la carga entre los bloques descritos anteriormente y a continuación, y cuenta con barreras divididas y nombradas, operaciones de llenado/rellenado más rápidas y precarga de instrucciones mejorada.



El Acelerador de Raytracing ha duplicado el número de bloques de Intersección de Rayos: Box y Triangle Intersections (las conocidas Intersecciones de Caja y Triángulo); ha mejorado la compresión del tamaño de BVH (en un 60% en comparación con RDNA 3); ha añadido la tecnología Oriented Bounding Boxes, que reduce el número de intersecciones de rayos dentro de objetos gráficos 3D. En general, el procesamiento del trazado de rayos es el doble de rápido que en RDNA 3.





AI Accelerator se encarga de trabajar con inteligencia artificial. Para ello, se le ha dado más soporte para tipos de datos y se ha acelerado el trabajo con los ya conocidos: dos veces más rápido que FP16 y cuatro veces más rápido con Structured Sparsity (Sparcity); cuatro veces con INT8 y ocho veces con Sparsity. Por supuesto, se ha añadido compatibilidad con FP8 y ML Super Resolution.
Gracias a este bloque, se procesa el nuevo FSR 4. Bueno, es una explicación lógica para la falta de compatibilidad con tarjetas de vídeo antiguas. ¿O no lo es? Lee más sobre FSR en la sección de abajo.
Una sola CU no hará gran cosa, así que AMD «bajo un ala» NAVI 48 ha combinado nada menos que 64 de ellas. AMD utiliza el término Shader Engines para combinar las CU. El chip se fabrica en las fábricas de TSMC con tecnología de 4 nm, tiene 53 900 millones de transistores y un área de cristal de 356,5 mm2. A modo de comparación, el área de chip del RTX 5090 (GB202) es de 750 mm2, y la del RTX 5080 / 5070 TI (GB203) es — 378 mm2. Y la RTX 5070 es aún más pequeña, con 263 mm2.


El chip no se venderá solo, así que AMD lo va a meter en dos tarjetas gráficas de nueva generación. La primera es el buque insignia (no se han oído planes de lanzar una solución mejor) AMD Radeon RX 9070 XT con NAVI 48 completo y RX 9070 con un Shader Engine desactivado (8 CU). Si lo deseas, puedes consultar la reseña editorial Asus AMD Radeon RX 9070 XT 16GB Prime OC y Gigabyte Radeon RX 9070 GAMING OC. Al ver el vídeo a continuación, queda claro que AMD va una generación por detrás de NVIDIA en lo que a trazado de rayos se refiere.
He aquí una tabla comparativa de las características de dos generaciones de tarjetas gráficas AMD: RDNA 3 y RDNA 4. Al compararlas, vemos una situación similar a la de Intel: el chip se ha hecho más pequeño, el número de transistores también ha aumentado y el rendimiento se ha mantenido al mismo nivel o incluso ha aumentado ligeramente. Parece que AMD e Intel se han emparejado y han utilizado el «prohibido calle la magia de la optimización».
RX 7900 XTX | RX 7900 XT | RX 9070 XT | RX 9070 | RX 7900 GRE | |
Chip | NAVI 31 | NAVI 31 | NAVI 48 | NAVI 48 | NAVI 31 |
Tamaño del chip | 529 mm2 | 529 mm2 | 357 mm2 | 357 mm2 | 529 mm2 |
Número de transistores | 57,7 millones de euros | 57,7 millones de euros | 53,9 millones de euros | 53,9 millones de euros | 57,7 millones de euros |
CU | 96 | 84 | 64 | 56 | 80 |
Ray Accelerators | 96 | 84 | 64 | 56 | 80 |
AI Accelerators | 192 | 168 | 128 | 112 | 160 |
Frecuencia | 2500 MHz | 2400 MHz | 2970 MHz | 2520 MHz | 2245 MHz |
TDP | 355 W | 315 W | 304 W | 220 W | 260 W |
Memoria de vídeo | 24 GB GDDR6 | 20 GB GDDR6 | 16 GB GDDR6 | 16 GB GDDR6 | 16 GB GDDR6 |
Ancho de banda de la memoria de vídeo | 960 GB/s | 800 GB/s | 640 GB/s | 640 GB/s | 576 GB/s |
Velocidad de la memoria de vídeo | 20 Gbps | 20 Gbps | 20 Gbps | 20 Gbps | 18 Gbps |
Los juegos son los juegos, pero ¿y los programas de trabajo? La redacción probó a renderizar un interior de prueba en Iluminación interior realista. El resultado es decepcionante, ya que la RX 9070 tardó un 64% más que la RTX 5070 Ti. Tampoco funcionó con los habituales generadores de imágenes neuronales offline. Una razón habitual del estado inoperativo de las aplicaciones es la falta de soporte para desarrolladores y la introducción inicial de nuevas tecnologías de aprendizaje automático de AMD. Parece que solo esta generación RX 9000 de tarjetas gráficas ha lanzado plenamente el ML productivo.
AMD FidelityFX Super Resolution (FSR) 4




Después de NVIDIA, AMD creó su propio escalador ascendente en 2021. Cada año, la tecnología mejoraba y aumentaba gradualmente la calidad de la escalabilidad de la imagen en los monitores de los usuarios. Y en estos cuatro años, ¡se ha añadido FSR a más de 400 juegos! El nuevo FSR 4 ya es compatible con más de 30 juegos conocidos y lo será con más de 70 este año. Se trata de un resultado realmente increíble que hay que respetar.
Ya que hemos mencionado FSR 4 Super Resolution, es necesario hablaros del principio de funcionamiento desarrollado por AMD. Cada juego tiene su propio modelo ML, que se optimiza primero en los aceleradores de servidor AMD Instinct. Así es, lo hace la propia AMD.
Después, el modelo ensamblado se envía a tu tarjeta de vídeo. Lo único que tienen que hacer los desarrolladores es añadir soporte FSR 4 a su código para que el controlador de la tarjeta de vídeo pueda utilizar el modelo resultante para cada juego individual.
Subtítulos de Presentaciones de AMD. El escalado se realiza a partir de una resolución cuatro veces menor. Aparentemente, la resolución FullHD se utiliza para 4K.
Junto con la presentación de la nueva generación de arquitectura RDNA 4, también se mostró una nueva cuarta versión de FSR. Sin embargo, los jugadores no entendieron un punto — la falta de compatibilidad con tarjetas gráficas antiguas, incluso RDNA 3. Si te perdiste la sección anterior, te lo explico brevemente.
En RDNA 3, las generaciones más antiguas tienen muy poco soporte para los modelos ML utilizados para diversas redes neuronales, etc. Mientras NVIDIA desarrollaba esta área y acaparaba el mercado, AMD mejoraba las tecnologías antiguas. Sin embargo, como el tiempo ha demostrado, la mayoría de los usuarios quieren ver altos fps con un alto nivel de gráficos, así como que el juego en sí sea interesante, pero esto no es una cuestión para los desarrolladores de tarjetas de vídeo.
AMD acaba de descubrir el camino del renderizado neuronal, que escribió anteriormente.
Sin embargo, no se elimina el soporte para juegos con escalado no AI de FSR 3.1. Las dos versiones deberían complementarse: si un usuario tiene una tarjeta gráfica antigua, tendrá FSR 3.1, mientras que una RX 9000 nueva tendrá FSR 4.
AMD HYPR-RX
NVIDIA tiene un nombre para sus tecnologías de escalado llamado DLSS, que se ha actualizado con un montón de cosas, lo que resultaba confuso al principio. Intel ha creado su propio análogo en forma de XeSS 2, que también confundió un poco a los usuarios. Menos mal que AMD ha tomado la decisión correcta y ha bautizado sus tecnologías con un nombre distinto, HYPR-RX. Incluye:
- AMD FSR — escalado de imagen;
- AMD Fluid Motion Frames 2 — generador de fotogramas.
- AMD Anti-Lag 2 — Reduce el retardo al utilizar un teclado, ratón o gamepad;
- AMD Boost — escalado para tarjetas gráficas RX 6000;
- AMD Super Resolution — es otra tecnología de escalado disponible solo para la RX 5000;
La diapositiva deja claro que HYPR-RX es una opción del menú del controlador Adrenaline para lanzar rápidamente las mejoras que necesite el usuario. Es compatible con las APU híbridas RX 5000, RX 6000, RX 7000, RX 9070 y AMD Ryzen AI 300. Por supuesto, la compatibilidad con la nueva RX 9060 se añadirá más adelante (si es que llega algún día). Repasemos las tecnologías incorporadas (ya hemos hablado de FSR más arriba).


La principal tarea de AMD Fluid Motion Frames (FMG) 2 es generar fotogramas. Cuando está totalmente activado, puede aumentar los fps más de tres veces. Es decir, se generarán uno o dos fotogramas. La versión mejorada de FMG 2.1 debería funcionar sin duda en las nuevas tarjetas gráficas RX 9000, pero hay algunas dudas sobre las generaciones anteriores.
AMD Anti-Lag 2 reduce el retardo de entrada del ratón, el teclado o el gamepad hasta en un 20% en juegos como Counter Strike 2, Apex Legends e, inesperadamente, Ghost of Tsushima.
Pronto habrá algo más.
En general, a AMD le va bien en estos momentos. Sus procesadores son muy populares tanto entre los usuarios normales como, sobre todo, entre los jugadores. Las consolas PlayStation de Sony seguirán obviamente con AMD. Con Xbox, la cuestión sigue abierta (AMD o ARM), pero Microsoft siempre ha ido por libre.
El mercado de las tarjetas de vídeo no va bien en estos momentos, y todos los actores del mercado tienen problemas. NVIDIA está claramente sobrevalorando sus nuevas tarjetas gráficas, ya que la compañía genera la mayor parte de sus ingresos a partir de sus propias soluciones de servidor de IA desarrolladas. Mientras haya clientes empresariales, NVIDIA cubrirá este mercado con sus productos. Y los jugadores se quedarán con el resto, porque se utilizan los mismos procesadores para ambos mercados.
AMD parece querer coquetear con los gamers, pero tiene exactamente un inconveniente — el tecnológico. En primer lugar, hay un retraso de una generación en el trazado de rayos. En segundo lugar, la tecnología FSR 4 ya debería estar al nivel de la nueva DLSS 4 con el nuevo modelo Transformer, pero parece que sigue siendo DLSS 3. En tercer lugar, si AMD demostró que la RX 9070 XT superaba sin problemas a la RTX 5080 sin trazado de una vez y media o dos veces su precio — sin preguntas. O al menos era más potente en 4K puro que la RTX 5070 Ti siempre en pruebas — sin preguntas. Y así AMD está librando una batalla «en raytracing campo enemigo».
Conclusión. Ahora AMD necesita invertir más en desarrolladores de software de trabajo (renderizado, redes neuronales) para aumentar el interés de los compradores potenciales. No sólo los juegos tienen que hacerlo bien, sino también las aplicaciones. Es poco probable que los usuarios quieran comprar dos tarjetas gráficas: una para juegos y otra para software.
Dentro de uno o dos años, esperamos una nueva generación de consolas, con un nuevo análogo de PSSR 2 para Sony con un escalado de Super Resolución mejorado y un nuevo generador de fotogramas. Y no nos olvidemos de los nuevos «portátiles» con la APU Strix Halo.
Spelling error report
The following text will be sent to our editors: