NVIDIA GeForce RTX 5090 FE Review

La GPU que probamos hoy es el avance en rendimiento de juegos más notable en muchas generaciones. Dobla en rendimiento a su antecesora, pero también es verdad que no lo hace de la forma tradicional. Según vayamos avanzando en nuestra review, veremos que las diferencias de prestaciones clásicas entre la RTX 4090 y la RTX 5090 no son tantas, pero sí que lo son en el concepto de entender la reproducción de juegos.

La generación anterior se apoyaba en la IA, mediante DLSS 3.5, para lograr imágenes fotorrealistas con RTX a pantalla completa y la generación de frames para permitir rendimientos RTX desconocidos hasta la fecha. Esta generación va mucho más allá, son más capaces de procesar cálculos propios de IA y ha permitido desarrollar a NVIDIA nuevas capacidades, como la generación de múltiples frames por cada frame real, hasta 3 frames calculados de “la nada” mediante IA con algoritmos predictivos para corregir el movimiento y también mejora la latencia.

Estas gráficas ofrecen el doble de rendimiento en DLSS que la generación anterior, tienen menos latencias y corrigen problemas de imagen típicos de la generación de frames de modelos anteriores. Todo en una gráfica de nuevo formato, que además no tiene ningún miedo en aprovechar el máximo de potencia que ofrecen los nuevos conectores para tarjetas gráficas de 16 pines, ya sea el nuevo 12V-2x6 del ATX 3.1 o el 12VHPWR del ATX 3.0, ambos compatibles.

Características técnicas de la NVIDIA GeForce RTX 5090 Founders Edition

  • Tarjeta gráfica: GeForce RTX 5090
  • GPU: GB202
  • Arquitectura de la GPU: NVIDIA Blackwell
  • GPCs: 11
  • TPCs: 85
  • SMs: 170
  • CUDA Cores / SM: 128
  • CUDA Cores / GPU: 21760
  • Tensor Cores / SM: 4 (5th Gen)
  • Tensor Cores / GPU: 680 (5th Gen)
  • RT Cores: 170 (4th Gen)
  • GPU Boost Clock (MHz): 2407
  • Peak FP32 TFLOPS (non-Tensor): 104,8
  • Peak FP16 TFLOPS (non-Tensor): 104,8
  • Peak BF16 TFLOPS (non-Tensor): 104,8
  • Peak INT32 TOPS (non-Tensor): 317.5
  • RT TFLOPS: 317.5
  • Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS): 1676/3352²
  • Peak FP16 Tensor TFLOPS FP16 Acumulado: 838/1676²
  • Peak FP16 Tensor TFLOPS FP32 Acumulado: 419/838²
  • Peak BF16 Tensor TFLOPS FP32 Acumulado: 209.5/419²
  • Peak TF32 Tensor TFLOPS: 104.8/209.5²
  • Peak INT8 Tensor TOPS: 838/1676²
  • Tamaño de la VRAM y tipo: 32 GB GDDR7
  • Interfaz de memoria: 512-bit
  • Memory Clock (Data Rate): 28 Gbps
  • Ancho de banda de la memoria: 1792 GB/sec
  • ROPs: 176
  • Pixel Fill-rate (Gigapixels/sec): 423.6
  • Unidades de texturas: 680
  • Texel Fill-rate (Gigatexels/sec): 1636.8
  • L1 Data Cache/Shared Memory: 21760 KB
  • L2 Cache Size: 98304 KB
  • Tamaño del archivo de registro: 43520 KB
  • Unidades de proceso de vídeo: 3 x NVENC (9th Gen), 2 x NVDEC (6th Gen)
  • TGP (Total Graphics Power): 575 W
  • Cantidad de transistores: 92.2 mil millones
  • Tamaño del Die: 750 mm²
  • Proceso de fabricación: TSMC 4nm 4N NVIDIA Custom
  • Interfaz PCI Express: Gen 5

La arquitectura NVIDIA RTX Blackwell incluye una serie de innovaciones diseñadas para revolucionar los gráficos, el trazado de rayos, la inteligencia artificial y la eficiencia energética. Estas son las principales, aunque no las únicas, que iremos desgranando en las próximas líneas. No me adentraré mucho en la arquitectura, ya que tuvimos oportunidad de dedicarle tiempo en este otro artículo.

Nuevas características del SM (Shader Model) para Neural Shading: Los nuevos núcleos RT (RT Core) de quinta generación y los nuevos Tensor Core de cuarta generación mejoran y aceleran las capacidades de renderizado neuronal, introduciendo modelos de transformación antes no disponibles, basados en modelos estándar y también de rápida respuesta como es el FP4.

La arquitectura SM (Streaming Multiprocessor) de Blackwell duplica el rendimiento de las operaciones matemáticas enteras por ciclo de reloj en comparación con la serie NVIDIA Ada, lo que beneficia especialmente las cargas de trabajo relacionadas con la generación de direcciones, cruciales para las nuevas unidades de sombreado neuronal.

 

NVIDIA Max-Q estará presente también en las gráficas de sobremesa de NVIDIA: Blackwell introduce características avanzadas de apagado por sectores (power gating) y nuevos rieles de potencia divididos (split power rails) que permiten un control preciso en la entrega de energía a diferentes subsistemas del chip.

Los relojes internos pueden ajustarse a cargas de trabajo dinámicas 1,000 veces más rápido que en arquitecturas anteriores, maximizando la eficiencia y el rendimiento según la demanda, con estados más profundos y latencias menores para pasar de esos estados de reposo, por zonas y funciones, a estados de carga elevada.

Núcleos RT de 4ª generación con mejoras significativas: Los nuevos núcleos de trazado de rayos (Ray Tracing Cores) en Blackwell ofrecen experiencias avanzadas y permiten nuevas técnicas de renderizado neuronal y trazado de rayos con un rendimiento notablemente mejorado, con una arquitectura más capaz, con prestaciones sorprendentes como la nueva Mega Geometría que permite aplicar técnicas de rayos a clústeres a resolución completa, no como en generaciones anteriores, y con un consumo mejor de memoria, lo que permite miles de millones de triángulos en pantalla.

Núcleos tensoriales de 5ª generación con capacidades de procesamiento optimizadas: Incorporan soporte para FP4, una tecnología que permite duplicar el rendimiento de IA mientras reduce a la mitad los requisitos de memoria. Soporte integrado para la nueva Second-Generation FP8 Transformer Engine, que se utiliza en las GPU de clase empresarial de la familia Blackwell, diseñadas para centros de datos.

NVIDIA DLSS 4, la gran estrella de esta generación y también una necesidad para NVIDIA para realmente lograr los resultados de rendimiento y calidad de imagen que prometen en esta generación. Esta tecnología permite crear más de un frame por frame real, que es lo que hacía el DLSS 3 o el DLSS 3.5 (con reconstrucción de rayos). Sino que permite, y esto es configurable, introducir hasta tres frames completamente generados por IA y desde una resolución más baja. Es decir, de cada 16 píxeles que vemos en pantalla, 15 están generados por la IA.

Sombreadores neuronales RTX (RTX Neural Shaders): permiten integrar pequeñas redes neuronales directamente en los sombreadores programables, abriendo una nueva era de innovación gráfica en videojuegos y aplicaciones interactivas. Con mejoras notables en la gestión de elementos complejos en pantalla como el cabello, los materiales que transportan iluminación en su interior como la piel o el realismo de los gestos en una cara.

Procesador de Gestión de IA (AI Management Processor, AMP) con soporte para múltiples modelos IA simultáneos: El AMP permite ejecutar varios modelos de IA al mismo tiempo que las cargas de trabajo gráficas. Esto incluye modelos de voz, traducción, visión por computadora, animación, comportamiento y muchos otros, reduciendo latencias.

Es la primera GPU con memoria GDDR7: Basada en el estándar de memoria GDDR7, utiliza tecnología de modulación por amplitud de pulso (PAM3), permitiendo subsistemas de memoria más rápidos y con una mejora notable en la eficiencia energética. La mitad de consumo, el doble de rendimiento, alcanzando en este modelo que probamos hoy la increíble cifra de 1800 GBps de ancho de banda sobre un bus de 512 bits.

DLSS 4 es, sin duda, el gran avance de esta generación. Será exclusiva de esta gama y permite desarrollar hasta 8 veces el rendimiento que tendríamos con técnicas de renderizado tradicionales y, a la vez, como veremos más adelante, mejora la latencia y también la calidad de imagen, por encima de lo que podríamos lograr con el rendimiento nativo de la tarjeta.

¿Dónde está el milagro? NVIDIA entrena sus juegos compatibles con DLSS 4, que se espera que sean hasta 75 para el lanzamiento de esta tarjeta (el día 30 es cuando se podrá comprar), de forma que lo que hace localmente la RTX 50 es una especie de “streaming” interactivo en tiempo real de todos esos cálculos realizados mediante los modelos de IA de NVIDIA.

El resultado, para ti y para mí, que queremos disfrutar de nuestros mejores juegos, es que DLSS 4 ofrece más calidad de imagen y el doble de rendimiento que DLSS 3.5, 8 veces más que en renderizado nativo, y el resultado, al menos en las pruebas de los juegos que hemos podido ejecutar, es real. Está ahí y es perfectamente perceptible.

La principal ventaja de esta tecnología es que ahora el “frame generation” puede generar hasta tres frames por cada frame real, sumada a la super resolución, por lo que de cada 16 píxeles que verás en pantalla, 15 son artificiales. NVIDIA introduce otras técnicas relacionadas, como un controlador para cuándo introducir esos frames y también la nueva tecnología NVIDIA Reflex 2, que permite reducir la latencia incluso con todas estas técnicas aplicadas.

A esto podemos sumar la mega geometría, todas las prestaciones neuronales nuevas, pero también otras prestaciones que van más allá de los juegos, como la nueva conectividad DisplayPort 2.1b con anchos de banda de hasta 80 Gbps, con compatibilidad para UHBR20 de hasta 20 Gbps por línea, por conector. Permite resoluciones 8K con hasta 165 Hz de refresco vertical y 4K con hasta 480 Hz. La mejor conectividad y, sin duda, una mejora notable sobre las unidades de la anterior generación.

Estos nuevos modelos también entregan nuevas unidades de proceso de video duales, algo que se introdujo en las RTX 40 y que ahora, en la RTX 50, se potencia con nuevos formatos de video y más velocidad de proceso. Ahora soporta los modos AV1 más exigentes, todos por hardware, con codificación y decodificación de formatos como el 4:2:2. Este tipo de muestreo de chroma permite retener la mitad de la calidad del video original (4:4:4) con el doble de velocidad de proceso, ofreciendo el doble de calidad que los formatos soportados hasta ahora, por hardware, que se basaban en muestras 4:2:0.

En esta sección he querido dar un repaso a los números de Blackwell para el mercado de sobremesa, de toda la gama, puesto que creo que es la oportunidad perfecta para comparar números puros y duros con las anteriores generaciones. El salto de rendimiento generacional, el puro y el DLSS, lo veremos después en nuestros datos de rendimiento; ahora vamos a los números puros y simples.

He separado la tabla de especificaciones por gama, con tres generaciones de gráficas de cada tipo. Lo que podemos ver de primeras en la RTX 5090 es que es la gráfica de más consumo, con más memoria y más ancho de banda de memoria que NVIDIA haya creado jamás. Son 32 GB de GDDR7 con un bus de 512 bits que genera casi 2 TB de ancho de banda por segundo. Esta generación también introduce el PCI Express Gen 5 con 512 GBps de ancho de banda por primera vez.

Tarjeta gráfica GeForce RTX 3090 GeForce RTX 4090 GeForce RTX 5090
GPU GA102 AD102 GB202
Arquitectura de la GPU NVIDIA Ampere NVIDIA Ada Lovelace NVIDIA Blackwell
GPCs 7 11 11
TPCs 41 64 85
SMs 82 128 170
CUDA Cores / SM 128 128 128
CUDA Cores / GPU 10496 16384 21760
Tensor Cores / SM 4 (3rd Gen) 4 (4th Gen) 4 (5th Gen)
Tensor Cores / GPU 328 (3rd Gen) 512 (4th Gen) 680 (5th Gen)
RT Cores 82 (2nd Gen) 128 (3rd Gen) 170 (4th Gen)
GPU Boost Clock (MHz) 1695 2520 2407
Peak FP32 TFLOPS (non-Tensor) 35,6 82,6 104,8
Peak FP16 TFLOPS (non-Tensor) 35,6 82,6 104,8
Peak BF16 TFLOPS (non-Tensor)¹ 35.6 82.6 104.8
Peak INT32 TOPS (non-Tensor)¹ 17.8 41.3 317.5
RT TFLOPS 69.5 191 317.5
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) N/A N/A 1676/3352²
Peak FP16 Tensor TFLOPS FP16 Acumulado N/A 660.6/1321.2² 838/1676²
Peak FP16 Tensor TFLOPS FP32 Acumulado N/A 660.6/1321.2² 419/838²
Peak FP16 Tensor TFLOPS FP16 Acumulado 142.3/284.6² 330.3/660.6² 419/838²
Peak FP16 Tensor TFLOPS FP32 Acumulado 71.2/142.4² 165.2/330.4² 209.5/419²
Peak BF16 Tensor TFLOPS FP32 Acumulado 71.2/142.4² 165.2/330.4² 209.5/419²
Peak TF32 Tensor TFLOPS¹ 35.6/71.2² 82.6/165.2² 104.8/209.5²
Peak INT8 Tensor TOPS¹ 284.7/569.4² 660.6/1321.2² 838/1676²
Tamaño de la VRAM y tipo 24 GB GDDR6X 24 GB GDDR6X 32 GB GDDR7
Interfaz de memoria 384-bit 384-bit 512-bit
Memory Clock (Data Rate) 19.5 Gbps 21 Gbps 28 Gbps
Ancho de banda de la memoria 936 GB/sec 1008 GB/sec 1792 GB/sec
ROPs 112 176 176
Pixel Fill-rate (Gigapixels/sec) 189.8 443.5 423.6
Unidades de texturas 328 512 680
Texel Fill-rate (Gigatexels/sec) 555.96 1290.2 1636.8
L1 Data Cache/Shared Memory 10496 KB 16384 KB 21760 KB
L2 Cache Size 6144 KB 73728 KB 98304 KB
Tamaño del archivo de registro 20992 KB 32768 KB 43520 KB
Unidades de proceso de vídeo 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) 3 x NVENC (9th Gen) 2 x NVDEC (6th Gen)
TGP (Total Graphics Power) 350 W 450 W 575 W
Cantidad de Transistores 28.3 M.Millones 76.3 M.Millones 92.2 M.Millones
Tamaño del Die 628.4 mm² 608.5 mm² 750 mm²
Proceso de Fabricación Samsung 8nm 8N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express Gen 4 Gen 4 Gen 5

El resto de números, como el número de unidades RT Cores o Tensor Cores, también mejora pero con cifras menos espectaculares. Pasamos de 128 a 170 RT Cores o de 512 a 680 Tensor Cores. Los números aumentan en los CUDA Cores, que pasan de 21,000, y tenemos también mejoras sustanciales en potencia de proceso de IA, sobre todo para los nuevos modelos FP4 introducidos en este modelo. En el resto de modelos, como el INT8, tenemos una mejora más reducida, de en torno al 30%.

Tarjeta gráfica Geforce RTX 3080 GeForce RTX 4080 GeForce RTX 5080
GPU GA102 AD103 GB203
Arquitectura de la GPU NVIDIA Ampere NVIDIA Ada Lovelace NVIDIA Blackwell
GPCs 6 7 11
TPCs 34 38 42
SMs 68 76 84
CUDA Cores / SM 128 128 128
CUDA Cores / GPU 8704 9728 10752
Tensor Cores / SM 4 (3rd Gen) 4 (4th Gen) 4 (5th Gen)
Tensor Cores / GPU 272 (3rd Gen) 304 (4th Gen) 336 (5th Gen)
RT Cores 80 (2nd Gen) 76 (3rd Gen) 84 (4th Gen)
GPU Boost Clock (MHz) 1710 2505 2617
Peak FP32 TFLOPS (non-Tensor) 34.1 48.7 56.3
Peak FP16 TFLOPS (non-Tensor) 34.1 48.7 56.3
Peak BF16 TFLOPS (non-Tensor)¹ 34.1 48.7 56.3
Peak INT32 TOPS (non-Tensor)¹ 17 24.4 56.3
RT TFLOPS 58,1 112,7 170,6
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) N/A N/A 900.4/1801²
Peak FP16 Tensor TFLOPS FP16 Acumulado N/A 389.9/779.8² 450.2/900.4²
Peak FP16 Tensor TFLOPS FP32 Acumulado N/A 389.9/779.8² 225.1/450.2²
Peak FP16 Tensor TFLOPS FP16 Acumulado 119.1/238.2² 194.9/389.8² 225.1/450.2²
Peak FP16 Tensor TFLOPS FP32 Acumulado 59.5/119² 97.5/195² 112.6/225.1²
Peak BF16 Tensor TFLOPS FP32 Acumulado 59.5/119² 97.5/195² 112.6/225.1²
Peak TF32 Tensor TFLOPS¹ 29.8/59.6² 48.7/97.4² 56.3/112.6²
Peak INT8 Tensor TOPS¹ 238.1/476.2² 389.9/779.8² 450.2/900.4²
Tamaño de la VRAM y tipo 10 GB GDDR6X 16 GB GDDR6X 16 GB GDDR7
Interfaz de memoria 320-bit 256-bit 256-bit
Memory Clock (Data Rate) 19 Gbps 22.4 Gbps 30 Gbps
Ancho de banda de la memoria 760 GB/sec 716.8 GB/sec 960 GB/sec
ROPs 96 112 112
Pixel Fill-rate (Gigapixels/sec) 164.2 280.6 293.1
Unidades de texturas 272 304 336
Texel Fill-rate (Gigatexels/sec) 465.12 761.5 879.3
L1 Data Cache/Shared Memory 8704 KB 9728 KB 10752 KB
L2 Cache Size 5120 KB 65536 KB 65536 KB
Tamaño del archivo de registro 17408 KB 19456 KB 21504 KB
Unidades de proceso de vídeo 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) 2 x NVENC (9th Gen) 2 x NVDEC (6th Gen)
TGP (Total Graphics Power) 320 W 320 W 360 W
Cantidad de Transistores 28.3 M.Millones 45.9 M.Millones 45.6 M.Millones
Tamaño del Die 628.4 mm² 378,6 mm² 378 mm²
Proceso de Fabricación Samsung 8nm 8N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express Gen 4 Gen 4 Gen 5

Las frecuencias de trabajo de la GPU son, en teoría, menores, más de 100 MHz menos que la generación anterior, pero luego veremos que esto es más un ajuste teórico que práctico; la tarjeta desempeña muy bien a frecuencias similares a los modelos en Ada Lovelace. En el resto de tablas tenéis la comparativa generacional. Según vayamos haciendo reviews de todas estas gráficas, iremos entrando en los detalles.

Tarjeta gráfica GeForce RTX 3070 Ti GeForce RTX 4070 Ti GeForce RTX 5070 Ti GeForce RTX 3070 GeForce RTX 4070 GeForce RTX 5070
GPU GA104 AD104 GB203 GA104 AD104 GB205
Arquitectura de la GPU NVIDIA Ampere NVIDIA Ada Lovelace NVIDIA Blackwell NVIDIA Ampere NVIDIA Ada Lovelace NVIDIA Blackwell
GPCs 6 5 11 6 5 5
TPCs 24 30 35 23 23 24
SMs 48 60 70 46 46 48
CUDA Cores / SM 128 128 128 128 128 128
CUDA Cores / GPU 6144 7680 8960 5888 5888 6144
Tensor Cores / SM 4 (3rd Gen) 4 (4th Gen) 4 (5th Gen) 4 (3rd Gen) 4 (4th Gen) 4 (5th Gen)
Tensor Cores / GPU 192 (3rd Gen) 240 (4th Gen) 280 (5th Gen) 184 (3rd Gen) 184 (4th Gen) 192 (5th Gen)
RT Cores 48 (2nd Gen) 60 (3rd Gen) 70 (4th Gen) 46 (2nd Gen) 46 (3rd Gen) 48 (4th Gen)
GPU Boost Clock (MHz) 1770 2610 2452 1725 2475 2512
Peak FP32 TFLOPS (non-Tensor) 21.7 40.1 43.9 20.3 29.1 30.9
Peak FP16 TFLOPS (non-Tensor) 21.7 40.1 43.9 20.3 29.1 30.9
Peak BF16 TFLOPS (non-Tensor)¹ 21.7 40.1 43.9 20.3 29.1 30.9
Peak INT32 TOPS (non-Tensor)¹ 10.9 20.0 43.9 10.2 14.6 30.9
RT TFLOPS 42,5 92,7 133,2 39.7 67.4 93.6
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) N/A N/A 703/1406² N/A N/A 493.9/987.8²
Peak FP16 Tensor TFLOPS FP16 Acumulado N/A 320.7/641.4² 351.5/703² N/A 233.2/466.4² 246.9/493.9²
Peak FP16 Tensor TFLOPS FP32 Acumulado N/A 320.7/641.4² 175.8/351.5² N/A 233.2/466.4² 123.5/246.9²
Peak FP16 Tensor TFLOPS FP16 Acumulado 87/174² 160.4/320.8² 175.8/351.5² 81.3/162.6² 116.6/233.2² 123.5/246.9²
Peak FP16 Tensor TFLOPS FP32 Acumulado 43.5/87² 80.2/160.4² 87.9/175.8² 40.6/81.2² 58.3/116.6² 61.7/123.5²
Peak BF16 Tensor TFLOPS FP32 Acumulado 43.5/87² 80.2/160.4² 87.9/175.8² 40.6/81.2² 58.3/116.6² 61.7/123.5²
Peak TF32 Tensor TFLOPS¹ 21.7/43.4² 40.1/80.2² 43.9/87.9² 20.3/40.6² 29.1/58.2² 30.9/61.7²
Peak INT8 Tensor TOPS¹ 174/348² 320.7/641.4² 351.5/703² 162.5/325² 233.2/466.4² 246.9/493.9²
Tamaño de la VRAM y tipo 8 GB GDDR6X 12 GB GDDR6X 16 GB GDDR6 8 GB GDDR6 12 GB GDDR6X 12 GB GDDR7
Interfaz de memoria 256-bit 192-bit 256-bit 256-bit 192-bit 192-bit
Memory Clock (Data Rate) 19 Gbps 21 Gbps 28 Gbps 14 Gbps 21 Gbps 28 Gbps
Ancho de banda de la memoria 608 GB/sec 504 GB/sec 896 GB/sec 448 GB/sec 504 GB/sec 672 GB/sec
ROPs 96 80 96 96 64 80
Pixel Fill-rate (Gigapixels/sec) 169.9 208.8 235.4 165.6 158.4 201
Unidades de texturas 192 240 280 184 184 192
Texel Fill-rate (Gigatexels/sec) 339.84 626.4 686.6 317.4 455.4 482.3
L1 Data Cache/Shared Memory 6144 KB 7680 KB 8960 KB 5888 KB 5888 KB 6144 KB
L2 Cache Size 4096 KB 49152 KB 49152 KB 4096 KB 36864 KB 49152 KB
Tamaño del archivo de registro 12288 KB 15360 KB 17920 KB 11776 KB 11776 KB 12288 KB
Unidades de proceso de vídeo 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) 2 x NVENC (9th Gen) 1 x NVDEC (5th Gen) 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) 1 x NVENC (8th Gen) 1 x NVDEC (5th Gen) 1 x NVENC (9th Gen) 1 x NVDEC (5th Gen)
TGP (Total Graphics Power) 290 W 285 W 300 W 220 W  200 W 250 W
Cantidad de Transistores 17.4 M.Millones 35.8 M.Millones 45.6 M.Millones 17.4 M.Millones 35.8 M.Millones 31.1 M.Millones
Tamaño del Die 392.5 mm² 294.5 mm² 378 mm² 392.5 mm² 294.5 mm² 263 mm²
Proceso de Fabricación Samsung 8nm 8N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom Samsung 8nm 8N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express Gen 4 Gen 4 Gen 5 Gen 4 Gen 4 Gen 5

 

Esta gráfica es simplemente impresionante, desde el bonito embalaje en materiales reciclables como el cartón o la fibra de papel, hasta los propios acabados de la tarjeta. Es una auténtica maravilla que, además, técnicamente introduce muchas mejoras.

Tiene un TDP muy superior a la generación anterior y, aun así, es más compacta. De hecho, ocupa solo dos slots de altura, enmarcandose en el proyecto SFF (Small Form Factor) de NVIDIA. El peso es considerable, una tarjeta realmente sólida, con un único conector de 16 contactos Gen5 al que saca todo el partido, aunque ciertamente debería tener margen a través del conector PCI Express 5.0, que es capaz de suministrar también hasta 300 W de potencia adicional.

El diseño es similar al de la generación anterior, pero es una gráfica más redondeada con elementos nuevos. El PCB es muy compacto, centrado en la tarjeta, lo que permite que sus dos grandes ventiladores axiales tengan cruce completo sin resistencia por todo el radiador de la tarjeta.

Ambos están situados en la misma orientación y refrigeran un conjunto de láminas curvas y planas que permite a NVIDIA mantener la presión estática en todo el recorrido. Los laterales tienen aperturas orientadas para evitar la recirculación de aire caliente. Son 600 W a refrigerar cosa que ahora analizaremos como hacen, adelantandoos que tienen modo de parada completa en reposo. 

Todo está alimentado por una cámara de vapor configurada en 3 dimensiones con comunicación directa con los heatpipes, lo que sin duda ofrece un rendimiento térmico excepcional. El PCB, que en realidad son tres, se centra en la tarjeta y es tremendamente compacto, con un diseño de alimentación completamente renovado.

Otros dos PCBs se encargan de la conectividad frontal, que se cuenta por tres conectores DisplayPort 2.1b completos y un HDMI 2.1b, y otro se encarga de la conectividad PCI Express 5.0 hacia la placa base.

El diseño incluye algunos elementos estéticos como LEDs, tanto en la cara anterior como posterior y en la zona del logo lateral, donde se lee el nombre de la GPU: GeForce RTX 5090. Es una tarjeta espectacular y con un diseño SFF que se puede montar en casi cualquier PC. Sus dimensiones son: 304 mm de longitud, 137 mm de altura, y 2 slots (40 mm) de ancho. Un bonito sueño para cualquier jugador.

Algo que hay que tener muy en cuenta en un diseño arriesgado como este es cómo se comportará la tarjeta tanto en reposo como en estrés, y si es capaz de mantener las frecuencias que promete sobre el papel. Es algo que hacemos con todas las tarjetas que pasan por nuestras manos, con más razón con una tarjeta que es la de mayor consumo de la historia y que, además, presenta un diseño más compacto que su antecesora, con casi 150 W menos de consumo.

Lo que hemos podido ver durante nuestras pruebas de estrés y estabilidad es que este modelo no solo cumple con las velocidades turbo que se esperan de ella, 2400 MHz aproximadamente, sino que las supera con creces, estabilizando, como veis en las capturas, alrededor de los 2700 MHz. A esta frecuencia, las temperaturas de trabajo son de unos 66 grados, lo cual es absolutamente increíble, y el ruido realmente ligero, menos de 43 dBA en plena carga con ventiladores a apenas 1700 rpm (en reposo tienen parada completa a 0 rpm). El consumo medio de la tarjeta, medido a entrada y por hardware, es de 564 vatios.

Un conector PCI Gen5, ya sea el 12V-2x6 o el 12VHPWR, soporta un máximo de 600 W de carga, por lo que os podéis imaginar que en este modelo el margen de aumento de potencia que admite NVIDIA para overclock es bastante reducido, solo admite un 4 % adicional. Con todo, hay poco margen de overclock sin tocar voltajes, cosa que yo no haría en una tarjeta de 2500 euros, que es además ya un portento moviendo juegos.

Sea como fuere, con este margen hemos podido exprimir otros 250 MHz adicionales estables en este modelo. Son casi 3000 MHz de GPU en un modelo pensado para 2400 MHz. Con esto, además, apenas aumentamos los consumos a 607 W en pico. El ruido se mantiene muy bien cerca de los 45 dBA, y las revoluciones de los ventiladores apenas rozan las 2000 rpm.

Para mí, es un resultado excelente en una tarjeta con este diseño. Es pronto para saberlo, pero quizás veamos modelos aún más rápidos con diseños mucho más grandes y voluminosos. Espero tener la oportunidad de probar alguno de ellos de marcas como ASUS, MSI o Gigabyte.

Zotac GeForce RTX 3090 Ti AMP Extreme Holo Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2010 470 68 40
Stock + 10% TDP 2050 490 72 42
Stock + 60MHz 2060 488 71 42
Stock + 100MHz 2080 492 74 45
         
MSI GeForce RTX 4080 Suprim X Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2715 310 65 32
Stock + 25% TDP 2805 325 70 34
Stock + 200MHz 3000 336 72 36
Stock + 250MHz 3060 343 73 40
         
MSI GeForce RTX 4090 Suprim X Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2820 420 65 37
Stock + 8% TDP 3030 430 68 39
Stock + 200MHz 3000 440 69 42
Stock + 260MHz 3060 458 71 43
         
NVIDIA GeForce RTX 5090 FE Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2700 564 64 40
Stock + 4% TDP 2850 570 66 42
Stock + 200MHz 2940 602 71 45
Stock + 250MHz 3014 604 71 45
         
ASUS TUF GAMING GeForce RTX 4080 Super OC Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2730 298 62 35
Stock + 10% TDP 2815 310 64 37
Stock + 100MHz 2920 330 64 40
Stock + 200MHz 2955 340 64 42
         
ASUS TUF GAMING GeForce RTX 4080 Super OC Frecuencia GPU (MHz) Consumo (w) Temperatura (Cº) Ruido (dBA)
Stock 2715 298 62 33
Stock + 10% TDP 2775 310 64 35
Stock + 100MHz 2850 330 64 35
Stock + 200MHz 3000 340 64 35

Esta tarjeta es completamente DLSS 4, y toda la familia se ha diseñado con esta nueva prestación en mente. Realmente, el impacto es impresionante tanto en números como en calidad de imagen. NVIDIA consigue reducir artefactos en pantalla, parpadeos y aumentar el rendimiento hasta el doble con respecto a la generación anterior gracias a esta técnica. Nosotros lo hemos comprobado con diversos test, tanto en juegos ya compatibles como en fases beta. La verdad es que el resultado es sorprendente.

Equipo de pruebas: 

3DMark DLSS Feature Test DLSS 4 beta

Doom Eternal 4k Ultra

F1 24 1080 Ultra

Cyberpunk 2077 4k 

Hogwarts Legay 4k

Dragon Age: Veilguard

El salto en calidad visual también es notable. DLSS 4 logra generar imágenes más nítidas y detalladas, reduciendo los problemas de aliasing y artefactos que podían observarse en versiones anteriores. Esto se traduce en una experiencia mucho más inmersiva, incluso en configuraciones gráficas exigentes.

Hogwarts legacy

A la izquierda DLSS 4 con MFG 4x y a la derecha en 4k nativo. No hay perdida de calidad, sino más definición.

Dragon Age Veliguard

Podemos ver en el detalle mejoras sustanciales en la imagen de la izquierda, con DLSS 4 y MFG, sobre la de la derecha, en FullRTX nativo

También, como es habitual, hemos añadido pruebas de rendimiento raster puro y duro para evaluar el verdadero potencial del nuevo hardware. Sin embargo, sinceramente, no creemos que estas pruebas sean el foco principal, ya que cualquiera que compre este modelo activará DLSS 4 (o 3) en todos los juegos compatibles.

Teniendo esto en cuenta, esta generación ofrece un incremento promedio del 20 % en rendimiento rasterizado en nuestras pruebas. Puede parecer mucho o poco, dependiendo de cómo se analice, pero es importante destacar que esta generación está diseñada específicamente para un algoritmo basado en IA de muy altas prestaciones. Ignorar esto sería no reconocer que estamos ante un cambio de paradigma donde los gráficos están definidos por los motores de proceso de IA locales.

Pruebas RT sin DLSS en 4k

Ashes of the Singularity (DX12) 1080

DOOM (Vulkan) ultra 1080

Halo Wars 2 (DX12) ultra 1080

Ghost Recon Wildlands (DX11) ultra 1080

Total War: Warhammer (DX12) ultra 1080

Battlefield 1 (DX12) ultra 1080

StarWars BattleFront 2 ultra (DX12) ultra 1080

Battlefield V (DX12) ultra 1080

Doom Eternal ultra 1080

Flight Simulator Ultra 1080

Ashes of the Singularity (DX12) 1440

DOOM (Vulkan) ultra 1440

Halo Wars 2 (DX12) ultra 1440

 

Ghost Recon Wildlands (DX11) ultra 1440

 

Total War: Warhammer (DX12) ultra 1440

 

Battlefield 1 (DX12) ultra 1440

 

StarWars BattleFront 2 ultra (DX12) ultra 1440

 

Battlefield V (DX12) ultra 1440

 

Doom Eternal ultra 1440

 

Flight Simulator Ultra 1440

 

Ashes of the Singularity (DX12) 2160

DOOM (Vulkan) ultra 2160

Halo Wars 2 (DX12) ultra 2160

Ghost Recon Wildlands (DX11) ultra 2160

Total War: Warhammer (DX12) ultra 2160

Battlefield 1 (DX12) ultra 2160

StarWars BattleFront 2 ultra (DX12) ultra 2160

Battlefield V (DX12) ultra 2160

Doom Eternal ultra 2160

Flight Simulator Ultra 2160

3DMark Speed Way (1440p)

 

3DMark Steel Nomad (4K)

 

3DMark Port Royal (1440p)

 

3DMark Time Spy (1440p)

 

3DMark Time Spy Extreme (2160p)

 

3DMark Fire Strike (1080p)

 

3DMark Fire Strike Extreme (1440p)

 

3DMark Fire Strike Ultra (2160p)

 

Si nos ceñimos exclusivamente a las pruebas de rendimiento raster, podría parecer que esta generación apenas gana un 15 % de rendimiento con un aumento de consumo del 33 %. Estos son datos ciertos, y seguramente los encontraréis en muchas de las reviews que se publican hoy junto con esta.

Sin embargo, la realidad de las RTX 50, encabezadas por la GeForce RTX 5090, es que ya no son simplemente GPU de rasterizado. Claro que lo hacen bien, tienen que hacerlo bien, pero estas tarjetas han trascendido esa función. Están diseñadas para ejecutar modelos de IA transformadores de manera extremadamente eficiente, alcanzando un nivel de rendimiento que eclipsa los TOPs de las CPUs más avanzadas de última generación.

Con toda esta potencia de proceso y los modelos entrenados directamente por NVIDIA, los juegos no solo son hasta 8 veces más rápidos, como hemos visto con DLSS 4, sino que además se ven mucho mejor, con una calidad visual sobresaliente y latencias iguales o, en algunos casos, incluso más bajas.

Las RTX 50 representan un cambio en el paradigma de las GPU. Son tarjetas gráficas diseñadas para procesar algoritmos complejos. Bienvenidos al futuro de las GPU, porque este camino ya no tiene vuelta atrás. Ni NVIDIA ni su competencia retrocederán en esta evolución.