Рубрики TecnologíasArtículos

Sombreadores neuronales bajo la lupa: adónde nos llevará el futuro generativo de NVIDIA

Publicado por Vladyslav Vasylenko

Con el lanzamiento de la nueva generación de RTX Blackwell, NVIDIA mostró en silencio y sin mucha fanfarria hacia dónde irán los gráficos en el futuro. No solo para juegos, sino también para otros ámbitos. Hoy continuamos con el tema que se puso en Artículo anteriory tratar de entender por qué necesitaremos sombreadores neuronales y las últimas tecnologías que veremos dentro de unos años.

La revolución continúa

El rendimiento de la GPU y la calidad de imagen mejoran continuamente gracias al uso de técnicas de renderizado neuronal. Las tecnologías NVIDIA DLSS Super Resolution y Frame Generation han incrementado considerablemente la frecuencia de cuadros manteniendo la misma calidad de imagen que el renderizado clásico y generando la gran mayoría de píxeles.

Del mismo modo, DLSS Ray Reconstruction (RR) reduce significativamente el número de rayos que hay que calcular para crear escenas con trazado de rayos o ray tracing de alta calidad, utilizando técnicas avanzadas de IA para reducir el ruido y reconstruir los detalles que faltan. Las futuras tecnologías de inteligencia artificial seguirán aumentando y mejorando la calidad de las imágenes con unos costes de cálculo y almacenamiento significativamente menores.

Las tecnologías Neural Rendering y Neural Shading de Blackwell acelerarán el uso de la IA por parte de los desarrolladores en sus aplicaciones, incluida la implantación y el uso de métodos de renderizado y modelado en tiempo real basados en la IA Generativa.

La IA generativa ayudará a los desarrolladores de juegos a crear dinámicamente paisajes diversos, implementar simulaciones físicas más realistas y generar sobre la marcha comportamientos más complejos de los PNJ. Las aplicaciones profesionales de modelado 3D podrán crear opciones de diseño más rápido que nunca, basándose en criterios de entrada especificados. Estos y muchos otros escenarios se complementarán con la arquitectura RTX de Blackwell y sus funciones de renderizado neuronal.

El gráfico muestra que, con cada nueva generación de tarjetas gráficas, empieza a crecer el papel de la IA en la creación de fotogramas. La arquitectura Turing sentó las bases de una nueva era en gráficos, combinando sombreado programable, trazado de rayos en tiempo real y algoritmos de IA para ofrecer gráficos realistas y físicamente precisos en juegos y aplicaciones profesionales.

La arquitectura NVIDIA Ampere actualiza las unidades SM, mejora los núcleos RT y Tensor, introduce el primer subsistema de memoria GDDR6X en la RTX 3090, mejora las funciones DLSS y ofrece enormes mejoras de rendimiento general.

La arquitectura NVIDIA Ada proporciona aún más rendimiento, menor consumo de energía y fidelidad visual para el trazado de rayos y los gráficos neuronales basados en IA con la incorporación de nuevas funciones DLSS como la generación de fotogramas y la reconstrucción de rayos.

RTX Neural Materials, RTX Neural Faces, RTX Neural Radiance Cache (NRC) y el nuevo modelo Transformer son más eficientes desde el punto de vista computacional, pero pueden reconstruir imágenes de una calidad aún mejor. Como muestra el gráfico anterior, ha llegado la era de las imágenes neuronales.

Sombreadores neuronales (+ breve historia de los sombreadores para ellos)

Empecemos por lo básico. Un sombreador es un programa que se ejecuta en la GPU para controlar el renderizado de los gráficos, cuya complejidad varía en función de los efectos visuales y el procesamiento necesarios. En su forma más básica, los sombreadores permiten calcular la luz, la oscuridad y los colores utilizados al renderizar una escena en el espacio 3D del juego. Este proceso se denomina sombreado.

La evolución de los sombreadores en las GPU ha estado marcada por importantes avances en la programación de gráficos y la capacidad de visualización. He aquí un breve repaso de las principales etapas del desarrollo de las tecnologías gráficas:

  • Transportador con función fija (Fixed-Function Pipeline, pre-2000s) – Gráficos procesados utilizando un Fixed-Function Pipeline donde las operaciones están definidas y configuradas, pero no programables, y con un control limitado sobre el renderizado de efectos simples como la iluminación y el texturizado.
  • Sombreadores de vértices (Sombreadores de vértices, DirectX 8.0 / OpenGL 1.4, principios de la década de 2000). Los sombreadores de vértices programables permitían a los desarrolladores acceder a los datos de los vértices, incluidas las transformaciones y los cálculos de iluminación, lo que les permitía crear efectos más complejos.
  • Sombreadores de fragmentos / píxeles (Fragment / Pixel Shaders, DirectX 9.0 / OpenGL 2.0, principios de la década de 2000). Permitía a los desarrolladores escribir código especial para operaciones a nivel de píxel, lo que posibilitaba la iluminación y texturización dinámicas, ampliando la flexibilidad de visualización con Shader Model 2.0.
  • Arquitectura de sombreado unificada (Arquitectura de sombreado unificada, DirectX 10.0 / OpenGL 3.3, 2006). Unificación de los sombreadores de geometría, vértices y fragmentos, lo que garantiza una mejor utilización de los recursos y una mayor eficiencia. Introducción de Shader Model 4.0, que admite tecnologías y optimizaciones más avanzadas.
  • Sombreadores geométricos (Geometry Shaders, DirectX 10 / OpenGL 3.2, 2006). Los sombreadores de geometría permitían crear y manipular primitivas en el conducto de sombreado. Entre los nuevos efectos se incluyen la teselación dinámica y el sistema de partículas.
  • Mejora de la teselación y los sombreadores computacionales (Compute Shaders, DirectX 11 / OpenGL 4.0, 2009). Geometría reimaginada con mayor detalle en las superficies y curvas más suaves en los modelos 3D. Shader Model 5.0 ha añadido más funciones para los métodos de renderizado en tiempo real. Los sombreadores computacionales han añadido compatibilidad con el procesamiento paralelo y la simulación compleja.
  • Sombreadores primitivos y de malla (Sombreadores primitivos y de malla, complemento de DirectX 12 Ultimate / Vulkan, 2018-2020). Se han ampliado las funciones y el rendimiento del pipeline de geometría combinando las funciones de los sombreadores de vértices y geometría en un único sombreador. Los sombreadores de malla permiten a la GPU procesar algoritmos más complejos, quitando más trabajo a la CPU.
  • RTX (Arquitectura de trazado de rayos NVIDIA Turing / DirectX, 2018). Añade funciones de trazado de rayos en tiempo real (RTX) directamente a las unidades SM de la GPU, lo que permite obtener iluminación, sombras y reflejos realistas.
  • Sombreadores neuronales (NVIDIA Blackwell Architecture, 2025) – Combinación de IA y sombreadores tradicionales. La inteligencia artificial se integra en el proceso de renderizado tradicional, allanando el camino para el sombreado neuronal completo ¡ESTAMOS AQUÍ!

Como ves, cada nuevo tipo de shader ponía el listón del realismo en los gráficos. Las nuevas tecnologías de la época te obligaban a comprar una nueva tarjeta de vídeo cada generación, porque cada vez se parecían más a «la vida real». Los ojos vieron el progreso, y la cartera se abrió.

Con el lanzamiento de Blackwell, NVIDIA introduce la era de los «sombreadores neuronales», el siguiente paso evolutivo en el sombreado programable. En lugar de escribir código de sombreado, los desarrolladores entrenarán modelos de IA para producir una aproximación del resultado que obtendrían utilizando código. En el futuro, todos los juegos utilizarán tecnología de IA para la visualización.

Hasta ahora, NVIDIA ha utilizado sombreadores neuronales para DLSS utilizando CUDA para los núcleos tensoriales. NVIDIA ha trabajado con Microsoft sobre la creación de una nueva API de vectores cooperativos. Permite acceder a kernels de tensor a través de cualquier tipo de shader en una aplicación gráfica, lo que permite utilizar muchas tecnologías neuronales.

Lo más probable es que no sólo Microsoft estuviera implicada. Me refiero a AMD, que no captó la indirecta.

No puede hacerlo sin DLSS (o sus análogos).

Nuevas tecnologías

Si te da pereza leer, NVIDIA te ofrece dos vídeos. El primero muestra una bonita demostración en 3D de Zorah, y el segundo describe las tecnologías descritas a continuación.

¿Qué relación de pantalla es esa? 21:9?

RTX Neural Materials

En las películas CGI de gran presupuesto, algunos materiales pueden ser muy complejos y constar de múltiples capas ópticas. El trazado de rayos es una tarea compleja en sí misma, y en tiempo real se hace muy difícil. Sin embargo, las tecnologías de IA sustituyen el modelo matemático original del material por una aproximación neuronal. Esto permite una mejor representación de los materiales y, al mismo tiempo, una reproducción de calidad cinematográfica a altas velocidades de fotogramas.

RTX Neural Texture Compression (NTC)

Encontrará más información en un artículo científico.

A medida que aumentan los avances en el renderizado fotorrealista, también lo hace la cantidad de datos de texturas necesarios, lo que supone una demanda adicional de almacenamiento y memoria, además de afectar al rendimiento debido a las limitaciones del ancho de banda. RTX Neural Texture Compression utiliza redes neuronales para comprimir y descomprimir texturas de forma más eficiente. En la demo de Zorah, la de Materiales Neuronales utiliza 1110 megabytes de memoria para los materiales estándar del farol y la tela. Sin embargo, sólo utiliza 333 megabytes para los materiales neuronales, lo que supone un ahorro de más del triple con una calidad visual mucho mejor.

Neural Radiance Cache (NRC)

NRC utiliza un sombreador neuronal para almacenar en caché información aproximada sobre la luminancia. De esta forma, es posible almacenar y aplicar información de iluminación compleja para crear efectos de iluminación global y dinámica de alta calidad en tiempo real. Esta tecnología mejora la eficiencia al reducir la carga computacional de la GPU y proporciona mayor calidad de imagen y escalabilidad.

El NRC recibe los resultados del rayo tras su primer rebote y determina los valores finales de iluminación para los reflejos posteriores. Esto significa que el conjunto inicial de rayos se inicia pero no se cuenta por completo. Después, los valores de las trayectorias de los rayos se envían a la caché tras un rebote y la escena se modela como si el rayo tuviera una longitud completa con muchas reflexiones. Y como las redes neuronales se entrenan durante el juego, NRC es consciente del contexto de una gran variedad de escenarios, lo que le permite ajustarse para proporcionar un perfil de iluminación indirecta preciso para cada escena de juego.

RTX Skin

La piel es una de las cosas más difíciles de visualizar porque en los juegos puede ser de diferentes tipos. Esencialmente, la piel — es un conjunto de mallas/mallas que forman la parte exterior de un objeto. Esto funciona bien si el material es impermeable a la luz (madera o metal), donde los rayos sólo necesitan calcular la luz que es común a la escena. Sin embargo, los materiales translúcidos funcionan de otra manera. La luz penetra en el material y en el objeto, luego se mueve o se dispersa dentro del objeto, y luego se emite en otras partes del objeto. RTX Skin es el primer ejemplo de dispersión subsuperficial en juegos de trazado de rayos, y puede utilizarse como desee el artista.

RTX Neural Faces

Otro reto para la visualización en tiempo real era la representación realista de los rostros. RTX Neural Faces ofrece un nuevo enfoque innovador para mejorar la calidad de las caras mediante IA generativa.

Neural Faces toma como entrada un rostro rasterizado sencillo y datos de pose en 3D y utiliza un modelo de IA generativa en tiempo real para crear un rostro de aspecto más natural. A continuación, se entrena utilizando miles de imágenes generadas offline de este rostro desde cualquier ángulo, en diferentes condiciones de iluminación, emociones y oclusión.

El proceso de entrenamiento puede utilizar fotos reales o imágenes generadas por la IA con variantes creadas mediante un modelo de difusión. A continuación, el modelo entrenado se optimiza mediante TensorRT para la aplicación de rostros en tiempo real. RTX Neural Faces es el primer paso hacia la visualización de gráficos en tiempo real mediante inteligencia artificial generativa.

El tiempo es de 2:20. Hasta ahora, no se ve bien. Destaca demasiado del conjunto.

Las animaciones de actores vivos y MetaHuman están aún muy lejos.

Como hemos visto, todas estas tecnologías y las próximas para futuras generaciones de tarjetas gráficas proporcionarán un gran impulso de rendimiento para el renderizado neuronal, y se convertirá en la principal baza» sobre el principal competidor — AMD.

¿Y AMD?

En Nuevas tarjetas gráficas RDNA 4 anunciadas en CES 2025 — RX 9070 y RX 9070 XT. Una de las características de la nueva generación es el uso de la computación AI. Esto es en realidad algo muy bueno. Cada vez más desarrolladores de software optimizarán sus aplicaciones para las tarjetas gráficas de AMD. Pero esto no es seguro.

Lo que sí es seguro es que RDNA 4 ofrecerá mejor soporte RT, un nuevo escalador ascendente y un generador de fotogramas. Se llamará AMD FidelityFX Super Resolution 4. O simplemente — FSR 4. Por supuesto, la comunidad en línea se rebeló, y es comprensible por qué: FSR 4 no será compatible con tarjetas gráficas antiguas. Me pregunto qué se entiende por «tarjetas gráficas antiguas»?

Empecemos por lo más sencillo. NVIDIA lleva produciendo tarjetas gráficas compatibles con hardware RT desde 2018. Han pasado siete años, y ya ha aparecido la cuarta generación RT. Hay una alta probabilidad de soporte FSR 4 en las tarjetas gráficas NVIDIA.

Sin embargo, la situación con las GPU y APU de AMD es algo ambigua. Por ejemplo, la Z1/Z1 Extreme no tiene soporte de hardware RT, ya que se trata de versiones especialmente limitadas de procesadores para portátiles sin IA. La generación Z2 (tres procesadores de distintas generaciones) también es una gran incógnita. Aunque espero que lo sean con FSR 4.

Pasemos a las tarjetas de vídeo. Ya en la serie RX 6000, aparecieron los primeros núcleos RT. Aunque no se llamaban así, ya había algunos análogos (Ray y AI Accelerators). Y estamos en 2020. Es decir, las primeras actividades de implementación de IA ya han comenzado desde entonces (¡hace 5 años!). Si el FSR 4 se hace exclusivo del RX 9000, no estará claro por qué.

Las consolas PS6 y la nueva Xbox no está claro cuándo aparecerán. Si es dentro de dos años, entonces saldrá una nueva generación de tarjetas gráficas AMD y tendremos FSR 5 o un nuevo nombre para ellas.

En general, aunque RDNA 4 se anunció en CES 2025, aún no hay suficiente información sobre él. Esperamos una presentación en toda regla, no 4 o 5 diapositivas.