NVIDIA GeForce RTX 5090 FE Review

Name: NVIDIA GeForce RTX 5090 FE
Brand: NVIDIA

La GPU que probamos hoy es el avance en rendimiento de juegos más notable en muchas generaciones. Dobla en rendimiento a su antecesora, pero también es verdad que no lo hace de la forma tradicional. Según vayamos avanzando en nuestra review, veremos que las diferencias de prestaciones clásicas entre la RTX 4090 y la RTX 5090 no son tantas, pero sí que lo son en el concepto de entender la reproducción de juegos.

La generación anterior se apoyaba en la IA, mediante DLSS 3.5, para lograr imágenes fotorrealistas con RTX a pantalla completa y la generación de frames para permitir rendimientos RTX desconocidos hasta la fecha. Esta generación va mucho más allá, son más capaces de procesar cálculos propios de IA y ha permitido desarrollar a NVIDIA nuevas capacidades, como la generación de múltiples frames por cada frame real, hasta 3 frames calculados de “la nada” mediante IA con algoritmos predictivos para corregir el movimiento y también mejora la latencia.

Estas gráficas ofrecen el doble de rendimiento en DLSS que la generación anterior, tienen menos latencias y corrigen problemas de imagen típicos de la generación de frames de modelos anteriores. Todo en una gráfica de nuevo formato, que además no tiene ningún miedo en aprovechar el máximo de potencia que ofrecen los nuevos conectores para tarjetas gráficas de 16 pines, ya sea el nuevo 12V-2x6 del ATX 3.1 o el 12VHPWR del ATX 3.0, ambos compatibles.

Características técnicas de la NVIDIA GeForce RTX 5090 Founders Edition

Tarjeta gráfica: GeForce RTX 5090
GPU: GB202
Arquitectura de la GPU: NVIDIA Blackwell
GPCs: 11
TPCs: 85
SMs: 170
CUDA Cores / SM: 128
CUDA Cores / GPU: 21760
Tensor Cores / SM: 4 (5th Gen)
Tensor Cores / GPU: 680 (5th Gen)
RT Cores: 170 (4th Gen)
GPU Boost Clock (MHz): 2407
Peak FP32 TFLOPS (non-Tensor): 104,8
Peak FP16 TFLOPS (non-Tensor): 104,8
Peak BF16 TFLOPS (non-Tensor): 104,8
Peak INT32 TOPS (non-Tensor): 317.5
RT TFLOPS: 317.5
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS): 1676/3352²
Peak FP16 Tensor TFLOPS FP16 Acumulado: 838/1676²
Peak FP16 Tensor TFLOPS FP32 Acumulado: 419/838²
Peak BF16 Tensor TFLOPS FP32 Acumulado: 209.5/419²
Peak TF32 Tensor TFLOPS: 104.8/209.5²
Peak INT8 Tensor TOPS: 838/1676²
Tamaño de la VRAM y tipo: 32 GB GDDR7
Interfaz de memoria: 512-bit
Memory Clock (Data Rate): 28 Gbps
Ancho de banda de la memoria: 1792 GB/sec
ROPs: 176
Pixel Fill-rate (Gigapixels/sec): 423.6
Unidades de texturas: 680
Texel Fill-rate (Gigatexels/sec): 1636.8
L1 Data Cache/Shared Memory: 21760 KB
L2 Cache Size: 98304 KB
Tamaño del archivo de registro: 43520 KB
Unidades de proceso de vídeo: 3 x NVENC (9th Gen), 2 x NVDEC (6th Gen)
TGP (Total Graphics Power): 575 W
Cantidad de transistores: 92.2 mil millones
Tamaño del Die: 750 mm²
Proceso de fabricación: TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express: Gen 5

La arquitectura NVIDIA RTX Blackwell incluye una serie de innovaciones diseñadas para revolucionar los gráficos, el trazado de rayos, la inteligencia artificial y la eficiencia energética. Estas son las principales, aunque no las únicas, que iremos desgranando en las próximas líneas. No me adentraré mucho en la arquitectura, ya que tuvimos oportunidad de dedicarle tiempo en este otro artículo.

Nuevas características del SM (Shader Model) para Neural Shading: Los nuevos núcleos RT (RT Core) de quinta generación y los nuevos Tensor Core de cuarta generación mejoran y aceleran las capacidades de renderizado neuronal, introduciendo modelos de transformación antes no disponibles, basados en modelos estándar y también de rápida respuesta como es el FP4.

La arquitectura SM (Streaming Multiprocessor) de Blackwell duplica el rendimiento de las operaciones matemáticas enteras por ciclo de reloj en comparación con la serie NVIDIA Ada, lo que beneficia especialmente las cargas de trabajo relacionadas con la generación de direcciones, cruciales para las nuevas unidades de sombreado neuronal.

NVIDIA Max-Q estará presente también en las gráficas de sobremesa de NVIDIA: Blackwell introduce características avanzadas de apagado por sectores (power gating) y nuevos rieles de potencia divididos (split power rails) que permiten un control preciso en la entrega de energía a diferentes subsistemas del chip.

Los relojes internos pueden ajustarse a cargas de trabajo dinámicas 1,000 veces más rápido que en arquitecturas anteriores, maximizando la eficiencia y el rendimiento según la demanda, con estados más profundos y latencias menores para pasar de esos estados de reposo, por zonas y funciones, a estados de carga elevada.

Núcleos RT de 4ª generación con mejoras significativas: Los nuevos núcleos de trazado de rayos (Ray Tracing Cores) en Blackwell ofrecen experiencias avanzadas y permiten nuevas técnicas de renderizado neuronal y trazado de rayos con un rendimiento notablemente mejorado, con una arquitectura más capaz, con prestaciones sorprendentes como la nueva Mega Geometría que permite aplicar técnicas de rayos a clústeres a resolución completa, no como en generaciones anteriores, y con un consumo mejor de memoria, lo que permite miles de millones de triángulos en pantalla.

Núcleos tensoriales de 5ª generación con capacidades de procesamiento optimizadas: Incorporan soporte para FP4, una tecnología que permite duplicar el rendimiento de IA mientras reduce a la mitad los requisitos de memoria. Soporte integrado para la nueva Second-Generation FP8 Transformer Engine, que se utiliza en las GPU de clase empresarial de la familia Blackwell, diseñadas para centros de datos.

NVIDIA DLSS 4, la gran estrella de esta generación y también una necesidad para NVIDIA para realmente lograr los resultados de rendimiento y calidad de imagen que prometen en esta generación. Esta tecnología permite crear más de un frame por frame real, que es lo que hacía el DLSS 3 o el DLSS 3.5 (con reconstrucción de rayos). Sino que permite, y esto es configurable, introducir hasta tres frames completamente generados por IA y desde una resolución más baja. Es decir, de cada 16 píxeles que vemos en pantalla, 15 están generados por la IA.

Sombreadores neuronales RTX (RTX Neural Shaders): permiten integrar pequeñas redes neuronales directamente en los sombreadores programables, abriendo una nueva era de innovación gráfica en videojuegos y aplicaciones interactivas. Con mejoras notables en la gestión de elementos complejos en pantalla como el cabello, los materiales que transportan iluminación en su interior como la piel o el realismo de los gestos en una cara.

Procesador de Gestión de IA (AI Management Processor, AMP) con soporte para múltiples modelos IA simultáneos: El AMP permite ejecutar varios modelos de IA al mismo tiempo que las cargas de trabajo gráficas. Esto incluye modelos de voz, traducción, visión por computadora, animación, comportamiento y muchos otros, reduciendo latencias.

Es la primera GPU con memoria GDDR7: Basada en el estándar de memoria GDDR7, utiliza tecnología de modulación por amplitud de pulso (PAM3), permitiendo subsistemas de memoria más rápidos y con una mejora notable en la eficiencia energética. La mitad de consumo, el doble de rendimiento, alcanzando en este modelo que probamos hoy la increíble cifra de 1800 GBps de ancho de banda sobre un bus de 512 bits.

DLSS 4 es, sin duda, el gran avance de esta generación. Será exclusiva de esta gama y permite desarrollar hasta 8 veces el rendimiento que tendríamos con técnicas de renderizado tradicionales y, a la vez, como veremos más adelante, mejora la latencia y también la calidad de imagen, por encima de lo que podríamos lograr con el rendimiento nativo de la tarjeta.

¿Dónde está el milagro? NVIDIA entrena sus juegos compatibles con DLSS 4, que se espera que sean hasta 75 para el lanzamiento de esta tarjeta (el día 30 es cuando se podrá comprar), de forma que lo que hace localmente la RTX 50 es una especie de “streaming” interactivo en tiempo real de todos esos cálculos realizados mediante los modelos de IA de NVIDIA.

El resultado, para ti y para mí, que queremos disfrutar de nuestros mejores juegos, es que DLSS 4 ofrece más calidad de imagen y el doble de rendimiento que DLSS 3.5, 8 veces más que en renderizado nativo, y el resultado, al menos en las pruebas de los juegos que hemos podido ejecutar, es real. Está ahí y es perfectamente perceptible.

La principal ventaja de esta tecnología es que ahora el “frame generation” puede generar hasta tres frames por cada frame real, sumada a la super resolución, por lo que de cada 16 píxeles que verás en pantalla, 15 son artificiales. NVIDIA introduce otras técnicas relacionadas, como un controlador para cuándo introducir esos frames y también la nueva tecnología NVIDIA Reflex 2, que permite reducir la latencia incluso con todas estas técnicas aplicadas.

A esto podemos sumar la mega geometría, todas las prestaciones neuronales nuevas, pero también otras prestaciones que van más allá de los juegos, como la nueva conectividad DisplayPort 2.1b con anchos de banda de hasta 80 Gbps, con compatibilidad para UHBR20 de hasta 20 Gbps por línea, por conector. Permite resoluciones 8K con hasta 165 Hz de refresco vertical y 4K con hasta 480 Hz. La mejor conectividad y, sin duda, una mejora notable sobre las unidades de la anterior generación.

Estos nuevos modelos también entregan nuevas unidades de proceso de video duales, algo que se introdujo en las RTX 40 y que ahora, en la RTX 50, se potencia con nuevos formatos de video y más velocidad de proceso. Ahora soporta los modos AV1 más exigentes, todos por hardware, con codificación y decodificación de formatos como el 4:2:2. Este tipo de muestreo de chroma permite retener la mitad de la calidad del video original (4:4:4) con el doble de velocidad de proceso, ofreciendo el doble de calidad que los formatos soportados hasta ahora, por hardware, que se basaban en muestras 4:2:0.

En esta sección he querido dar un repaso a los números de Blackwell para el mercado de sobremesa, de toda la gama, puesto que creo que es la oportunidad perfecta para comparar números puros y duros con las anteriores generaciones. El salto de rendimiento generacional, el puro y el DLSS, lo veremos después en nuestros datos de rendimiento; ahora vamos a los números puros y simples.

He separado la tabla de especificaciones por gama, con tres generaciones de gráficas de cada tipo. Lo que podemos ver de primeras en la RTX 5090 es que es la gráfica de más consumo, con más memoria y más ancho de banda de memoria que NVIDIA haya creado jamás. Son 32 GB de GDDR7 con un bus de 512 bits que genera casi 2 TB de ancho de banda por segundo. Esta generación también introduce el PCI Express Gen 5 con 512 GBps de ancho de banda por primera vez.

Tarjeta gráfica	GeForce RTX 3090	GeForce RTX 4090	GeForce RTX 5090
GPU	GA102	AD102	GB202
Arquitectura de la GPU	NVIDIA Ampere	NVIDIA Ada Lovelace	NVIDIA Blackwell
GPCs	7	11	11
TPCs	41	64	85
SMs	82	128	170
CUDA Cores / SM	128	128	128
CUDA Cores / GPU	10496	16384	21760
Tensor Cores / SM	4 (3rd Gen)	4 (4th Gen)	4 (5th Gen)
Tensor Cores / GPU	328 (3rd Gen)	512 (4th Gen)	680 (5th Gen)
RT Cores	82 (2nd Gen)	128 (3rd Gen)	170 (4th Gen)
GPU Boost Clock (MHz)	1695	2520	2407
Peak FP32 TFLOPS (non-Tensor)	35,6	82,6	104,8
Peak FP16 TFLOPS (non-Tensor)	35,6	82,6	104,8
Peak BF16 TFLOPS (non-Tensor)¹	35.6	82.6	104.8
Peak INT32 TOPS (non-Tensor)¹	17.8	41.3	317.5
RT TFLOPS	69.5	191	317.5
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS)	N/A	N/A	1676/3352²
Peak FP16 Tensor TFLOPS FP16 Acumulado	N/A	660.6/1321.2²	838/1676²
Peak FP16 Tensor TFLOPS FP32 Acumulado	N/A	660.6/1321.2²	419/838²
Peak FP16 Tensor TFLOPS FP16 Acumulado	142.3/284.6²	330.3/660.6²	419/838²
Peak FP16 Tensor TFLOPS FP32 Acumulado	71.2/142.4²	165.2/330.4²	209.5/419²
Peak BF16 Tensor TFLOPS FP32 Acumulado	71.2/142.4²	165.2/330.4²	209.5/419²
Peak TF32 Tensor TFLOPS¹	35.6/71.2²	82.6/165.2²	104.8/209.5²
Peak INT8 Tensor TOPS¹	284.7/569.4²	660.6/1321.2²	838/1676²
Tamaño de la VRAM y tipo	24 GB GDDR6X	24 GB GDDR6X	32 GB GDDR7
Interfaz de memoria	384-bit	384-bit	512-bit
Memory Clock (Data Rate)	19.5 Gbps	21 Gbps	28 Gbps
Ancho de banda de la memoria	936 GB/sec	1008 GB/sec	1792 GB/sec
ROPs	112	176	176
Pixel Fill-rate (Gigapixels/sec)	189.8	443.5	423.6
Unidades de texturas	328	512	680
Texel Fill-rate (Gigatexels/sec)	555.96	1290.2	1636.8
L1 Data Cache/Shared Memory	10496 KB	16384 KB	21760 KB
L2 Cache Size	6144 KB	73728 KB	98304 KB
Tamaño del archivo de registro	20992 KB	32768 KB	43520 KB
Unidades de proceso de vídeo	1 x NVENC (7th Gen) 1 x NVDEC (5th Gen)	2 x NVENC (8th Gen) 1 x NVDEC (5th Gen)	3 x NVENC (9th Gen) 2 x NVDEC (6th Gen)
TGP (Total Graphics Power)	350 W	450 W	575 W
Cantidad de Transistores	28.3 M.Millones	76.3 M.Millones	92.2 M.Millones
Tamaño del Die	628.4 mm²	608.5 mm²	750 mm²
Proceso de Fabricación	Samsung 8nm 8N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express	Gen 4	Gen 4	Gen 5

El resto de números, como el número de unidades RT Cores o Tensor Cores, también mejora pero con cifras menos espectaculares. Pasamos de 128 a 170 RT Cores o de 512 a 680 Tensor Cores. Los números aumentan en los CUDA Cores, que pasan de 21,000, y tenemos también mejoras sustanciales en potencia de proceso de IA, sobre todo para los nuevos modelos FP4 introducidos en este modelo. En el resto de modelos, como el INT8, tenemos una mejora más reducida, de en torno al 30%.

Tarjeta gráfica	Geforce RTX 3080	GeForce RTX 4080	GeForce RTX 5080
GPU	GA102	AD103	GB203
Arquitectura de la GPU	NVIDIA Ampere	NVIDIA Ada Lovelace	NVIDIA Blackwell
GPCs	6	7	11
TPCs	34	38	42
SMs	68	76	84
CUDA Cores / SM	128	128	128
CUDA Cores / GPU	8704	9728	10752
Tensor Cores / SM	4 (3rd Gen)	4 (4th Gen)	4 (5th Gen)
Tensor Cores / GPU	272 (3rd Gen)	304 (4th Gen)	336 (5th Gen)
RT Cores	80 (2nd Gen)	76 (3rd Gen)	84 (4th Gen)
GPU Boost Clock (MHz)	1710	2505	2617
Peak FP32 TFLOPS (non-Tensor)	34.1	48.7	56.3
Peak FP16 TFLOPS (non-Tensor)	34.1	48.7	56.3
Peak BF16 TFLOPS (non-Tensor)¹	34.1	48.7	56.3
Peak INT32 TOPS (non-Tensor)¹	17	24.4	56.3
RT TFLOPS	58,1	112,7	170,6
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS)	N/A	N/A	900.4/1801²
Peak FP16 Tensor TFLOPS FP16 Acumulado	N/A	389.9/779.8²	450.2/900.4²
Peak FP16 Tensor TFLOPS FP32 Acumulado	N/A	389.9/779.8²	225.1/450.2²
Peak FP16 Tensor TFLOPS FP16 Acumulado	119.1/238.2²	194.9/389.8²	225.1/450.2²
Peak FP16 Tensor TFLOPS FP32 Acumulado	59.5/119²	97.5/195²	112.6/225.1²
Peak BF16 Tensor TFLOPS FP32 Acumulado	59.5/119²	97.5/195²	112.6/225.1²
Peak TF32 Tensor TFLOPS¹	29.8/59.6²	48.7/97.4²	56.3/112.6²
Peak INT8 Tensor TOPS¹	238.1/476.2²	389.9/779.8²	450.2/900.4²
Tamaño de la VRAM y tipo	10 GB GDDR6X	16 GB GDDR6X	16 GB GDDR7
Interfaz de memoria	320-bit	256-bit	256-bit
Memory Clock (Data Rate)	19 Gbps	22.4 Gbps	30 Gbps
Ancho de banda de la memoria	760 GB/sec	716.8 GB/sec	960 GB/sec
ROPs	96	112	112
Pixel Fill-rate (Gigapixels/sec)	164.2	280.6	293.1
Unidades de texturas	272	304	336
Texel Fill-rate (Gigatexels/sec)	465.12	761.5	879.3
L1 Data Cache/Shared Memory	8704 KB	9728 KB	10752 KB
L2 Cache Size	5120 KB	65536 KB	65536 KB
Tamaño del archivo de registro	17408 KB	19456 KB	21504 KB
Unidades de proceso de vídeo	1 x NVENC (7th Gen) 1 x NVDEC (5th Gen)	2 x NVENC (8th Gen) 1 x NVDEC (5th Gen)	2 x NVENC (9th Gen) 2 x NVDEC (6th Gen)
TGP (Total Graphics Power)	320 W	320 W	360 W
Cantidad de Transistores	28.3 M.Millones	45.9 M.Millones	45.6 M.Millones
Tamaño del Die	628.4 mm²	378,6 mm²	378 mm²
Proceso de Fabricación	Samsung 8nm 8N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express	Gen 4	Gen 4	Gen 5

Las frecuencias de trabajo de la GPU son, en teoría, menores, más de 100 MHz menos que la generación anterior, pero luego veremos que esto es más un ajuste teórico que práctico; la tarjeta desempeña muy bien a frecuencias similares a los modelos en Ada Lovelace. En el resto de tablas tenéis la comparativa generacional. Según vayamos haciendo reviews de todas estas gráficas, iremos entrando en los detalles.

Tarjeta gráfica	GeForce RTX 3070 Ti	GeForce RTX 4070 Ti	GeForce RTX 5070 Ti	GeForce RTX 3070	GeForce RTX 4070	GeForce RTX 5070
GPU	GA104	AD104	GB203	GA104	AD104	GB205
Arquitectura de la GPU	NVIDIA Ampere	NVIDIA Ada Lovelace	NVIDIA Blackwell	NVIDIA Ampere	NVIDIA Ada Lovelace	NVIDIA Blackwell
GPCs	6	5	11	6	5	5
TPCs	24	30	35	23	23	24
SMs	48	60	70	46	46	48
CUDA Cores / SM	128	128	128	128	128	128
CUDA Cores / GPU	6144	7680	8960	5888	5888	6144
Tensor Cores / SM	4 (3rd Gen)	4 (4th Gen)	4 (5th Gen)	4 (3rd Gen)	4 (4th Gen)	4 (5th Gen)
Tensor Cores / GPU	192 (3rd Gen)	240 (4th Gen)	280 (5th Gen)	184 (3rd Gen)	184 (4th Gen)	192 (5th Gen)
RT Cores	48 (2nd Gen)	60 (3rd Gen)	70 (4th Gen)	46 (2nd Gen)	46 (3rd Gen)	48 (4th Gen)
GPU Boost Clock (MHz)	1770	2610	2452	1725	2475	2512
Peak FP32 TFLOPS (non-Tensor)	21.7	40.1	43.9	20.3	29.1	30.9
Peak FP16 TFLOPS (non-Tensor)	21.7	40.1	43.9	20.3	29.1	30.9
Peak BF16 TFLOPS (non-Tensor)¹	21.7	40.1	43.9	20.3	29.1	30.9
Peak INT32 TOPS (non-Tensor)¹	10.9	20.0	43.9	10.2	14.6	30.9
RT TFLOPS	42,5	92,7	133,2	39.7	67.4	93.6
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS)	N/A	N/A	703/1406²	N/A	N/A	493.9/987.8²
Peak FP16 Tensor TFLOPS FP16 Acumulado	N/A	320.7/641.4²	351.5/703²	N/A	233.2/466.4²	246.9/493.9²
Peak FP16 Tensor TFLOPS FP32 Acumulado	N/A	320.7/641.4²	175.8/351.5²	N/A	233.2/466.4²	123.5/246.9²
Peak FP16 Tensor TFLOPS FP16 Acumulado	87/174²	160.4/320.8²	175.8/351.5²	81.3/162.6²	116.6/233.2²	123.5/246.9²
Peak FP16 Tensor TFLOPS FP32 Acumulado	43.5/87²	80.2/160.4²	87.9/175.8²	40.6/81.2²	58.3/116.6²	61.7/123.5²
Peak BF16 Tensor TFLOPS FP32 Acumulado	43.5/87²	80.2/160.4²	87.9/175.8²	40.6/81.2²	58.3/116.6²	61.7/123.5²
Peak TF32 Tensor TFLOPS¹	21.7/43.4²	40.1/80.2²	43.9/87.9²	20.3/40.6²	29.1/58.2²	30.9/61.7²
Peak INT8 Tensor TOPS¹	174/348²	320.7/641.4²	351.5/703²	162.5/325²	233.2/466.4²	246.9/493.9²
Tamaño de la VRAM y tipo	8 GB GDDR6X	12 GB GDDR6X	16 GB GDDR6	8 GB GDDR6	12 GB GDDR6X	12 GB GDDR7
Interfaz de memoria	256-bit	192-bit	256-bit	256-bit	192-bit	192-bit
Memory Clock (Data Rate)	19 Gbps	21 Gbps	28 Gbps	14 Gbps	21 Gbps	28 Gbps
Ancho de banda de la memoria	608 GB/sec	504 GB/sec	896 GB/sec	448 GB/sec	504 GB/sec	672 GB/sec
ROPs	96	80	96	96	64	80
Pixel Fill-rate (Gigapixels/sec)	169.9	208.8	235.4	165.6	158.4	201
Unidades de texturas	192	240	280	184	184	192
Texel Fill-rate (Gigatexels/sec)	339.84	626.4	686.6	317.4	455.4	482.3
L1 Data Cache/Shared Memory	6144 KB	7680 KB	8960 KB	5888 KB	5888 KB	6144 KB
L2 Cache Size	4096 KB	49152 KB	49152 KB	4096 KB	36864 KB	49152 KB
Tamaño del archivo de registro	12288 KB	15360 KB	17920 KB	11776 KB	11776 KB	12288 KB
Unidades de proceso de vídeo	1 x NVENC (7th Gen) 1 x NVDEC (5th Gen)	2 x NVENC (8th Gen) 1 x NVDEC (5th Gen)	2 x NVENC (9th Gen) 1 x NVDEC (5th Gen)	1 x NVENC (7th Gen) 1 x NVDEC (5th Gen)	1 x NVENC (8th Gen) 1 x NVDEC (5th Gen)	1 x NVENC (9th Gen) 1 x NVDEC (5th Gen)
TGP (Total Graphics Power)	290 W	285 W	300 W	220 W	200 W	250 W
Cantidad de Transistores	17.4 M.Millones	35.8 M.Millones	45.6 M.Millones	17.4 M.Millones	35.8 M.Millones	31.1 M.Millones
Tamaño del Die	392.5 mm²	294.5 mm²	378 mm²	392.5 mm²	294.5 mm²	263 mm²
Proceso de Fabricación	Samsung 8nm 8N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom	Samsung 8nm 8N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom	TSMC 4nm 4N NVIDIA Custom
Interfaz PCI Express	Gen 4	Gen 4	Gen 5	Gen 4	Gen 4	Gen 5

Esta gráfica es simplemente impresionante, desde el bonito embalaje en materiales reciclables como el cartón o la fibra de papel, hasta los propios acabados de la tarjeta. Es una auténtica maravilla que, además, técnicamente introduce muchas mejoras.

Tiene un TDP muy superior a la generación anterior y, aun así, es más compacta. De hecho, ocupa solo dos slots de altura, enmarcandose en el proyecto SFF (Small Form Factor) de NVIDIA. El peso es considerable, una tarjeta realmente sólida, con un único conector de 16 contactos Gen5 al que saca todo el partido, aunque ciertamente debería tener margen a través del conector PCI Express 5.0, que es capaz de suministrar también hasta 300 W de potencia adicional.

El diseño es similar al de la generación anterior, pero es una gráfica más redondeada con elementos nuevos. El PCB es muy compacto, centrado en la tarjeta, lo que permite que sus dos grandes ventiladores axiales tengan cruce completo sin resistencia por todo el radiador de la tarjeta.

Ambos están situados en la misma orientación y refrigeran un conjunto de láminas curvas y planas que permite a NVIDIA mantener la presión estática en todo el recorrido. Los laterales tienen aperturas orientadas para evitar la recirculación de aire caliente. Son 600 W a refrigerar cosa que ahora analizaremos como hacen, adelantandoos que tienen modo de parada completa en reposo.

Todo está alimentado por una cámara de vapor configurada en 3 dimensiones con comunicación directa con los heatpipes, lo que sin duda ofrece un rendimiento térmico excepcional. El PCB, que en realidad son tres, se centra en la tarjeta y es tremendamente compacto, con un diseño de alimentación completamente renovado.

Otros dos PCBs se encargan de la conectividad frontal, que se cuenta por tres conectores DisplayPort 2.1b completos y un HDMI 2.1b, y otro se encarga de la conectividad PCI Express 5.0 hacia la placa base.

El diseño incluye algunos elementos estéticos como LEDs, tanto en la cara anterior como posterior y en la zona del logo lateral, donde se lee el nombre de la GPU: GeForce RTX 5090. Es una tarjeta espectacular y con un diseño SFF que se puede montar en casi cualquier PC. Sus dimensiones son: 304 mm de longitud, 137 mm de altura, y 2 slots (40 mm) de ancho. Un bonito sueño para cualquier jugador.

Algo que hay que tener muy en cuenta en un diseño arriesgado como este es cómo se comportará la tarjeta tanto en reposo como en estrés, y si es capaz de mantener las frecuencias que promete sobre el papel. Es algo que hacemos con todas las tarjetas que pasan por nuestras manos, con más razón con una tarjeta que es la de mayor consumo de la historia y que, además, presenta un diseño más compacto que su antecesora, con casi 150 W menos de consumo.

Lo que hemos podido ver durante nuestras pruebas de estrés y estabilidad es que este modelo no solo cumple con las velocidades turbo que se esperan de ella, 2400 MHz aproximadamente, sino que las supera con creces, estabilizando, como veis en las capturas, alrededor de los 2700 MHz. A esta frecuencia, las temperaturas de trabajo son de unos 66 grados, lo cual es absolutamente increíble, y el ruido realmente ligero, menos de 43 dBA en plena carga con ventiladores a apenas 1700 rpm (en reposo tienen parada completa a 0 rpm). El consumo medio de la tarjeta, medido a entrada y por hardware, es de 564 vatios.

Un conector PCI Gen5, ya sea el 12V-2x6 o el 12VHPWR, soporta un máximo de 600 W de carga, por lo que os podéis imaginar que en este modelo el margen de aumento de potencia que admite NVIDIA para overclock es bastante reducido, solo admite un 4 % adicional. Con todo, hay poco margen de overclock sin tocar voltajes, cosa que yo no haría en una tarjeta de 2500 euros, que es además ya un portento moviendo juegos.

Sea como fuere, con este margen hemos podido exprimir otros 250 MHz adicionales estables en este modelo. Son casi 3000 MHz de GPU en un modelo pensado para 2400 MHz. Con esto, además, apenas aumentamos los consumos a 607 W en pico. El ruido se mantiene muy bien cerca de los 45 dBA, y las revoluciones de los ventiladores apenas rozan las 2000 rpm.

Para mí, es un resultado excelente en una tarjeta con este diseño. Es pronto para saberlo, pero quizás veamos modelos aún más rápidos con diseños mucho más grandes y voluminosos. Espero tener la oportunidad de probar alguno de ellos de marcas como ASUS, MSI o Gigabyte.

Zotac GeForce RTX 3090 Ti AMP Extreme Holo	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2010	470	68	40
Stock + 10% TDP	2050	490	72	42
Stock + 60MHz	2060	488	71	42
Stock + 100MHz	2080	492	74	45

MSI GeForce RTX 4080 Suprim X	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2715	310	65	32
Stock + 25% TDP	2805	325	70	34
Stock + 200MHz	3000	336	72	36
Stock + 250MHz	3060	343	73	40

MSI GeForce RTX 4090 Suprim X	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2820	420	65	37
Stock + 8% TDP	3030	430	68	39
Stock + 200MHz	3000	440	69	42
Stock + 260MHz	3060	458	71	43

NVIDIA GeForce RTX 5090 FE	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2700	564	64	40
Stock + 4% TDP	2850	570	66	42
Stock + 200MHz	2940	602	71	45
Stock + 250MHz	3014	604	71	45

ASUS TUF GAMING GeForce RTX 4080 Super OC	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2730	298	62	35
Stock + 10% TDP	2815	310	64	37
Stock + 100MHz	2920	330	64	40
Stock + 200MHz	2955	340	64	42

ASUS TUF GAMING GeForce RTX 4080 Super OC	Frecuencia GPU (MHz)	Consumo (w)	Temperatura (Cº)	Ruido (dBA)
Stock	2715	298	62	33
Stock + 10% TDP	2775	310	64	35
Stock + 100MHz	2850	330	64	35
Stock + 200MHz	3000	340	64	35

Esta tarjeta es completamente DLSS 4, y toda la familia se ha diseñado con esta nueva prestación en mente. Realmente, el impacto es impresionante tanto en números como en calidad de imagen. NVIDIA consigue reducir artefactos en pantalla, parpadeos y aumentar el rendimiento hasta el doble con respecto a la generación anterior gracias a esta técnica. Nosotros lo hemos comprobado con diversos test, tanto en juegos ya compatibles como en fases beta. La verdad es que el resultado es sorprendente.

Equipo de pruebas:

Placa base: ASUS ProArt X870E-CREATOR WIFI Review
Procesador: AMD Ryzen 7 9800X3D
Memoria: G.Skill Ripjaws M5 Neo RGB DDR5-6000 CL28
Fuente: Cooler Master V PLATINUM 1600 V2
Disco duro: Corsair MP700 Elite 2TB

3DMark DLSS Feature Test DLSS 4 beta

Doom Eternal 4k Ultra

F1 24 1080 Ultra

Cyberpunk 2077 4k

Hogwarts Legay 4k

Dragon Age: Veilguard

El salto en calidad visual también es notable. DLSS 4 logra generar imágenes más nítidas y detalladas, reduciendo los problemas de aliasing y artefactos que podían observarse en versiones anteriores. Esto se traduce en una experiencia mucho más inmersiva, incluso en configuraciones gráficas exigentes.

Hogwarts legacy

A la izquierda DLSS 4 con MFG 4x y a la derecha en 4k nativo. No hay perdida de calidad, sino más definición.

Dragon Age Veliguard

Podemos ver en el detalle mejoras sustanciales en la imagen de la izquierda, con DLSS 4 y MFG, sobre la de la derecha, en FullRTX nativo

También, como es habitual, hemos añadido pruebas de rendimiento raster puro y duro para evaluar el verdadero potencial del nuevo hardware. Sin embargo, sinceramente, no creemos que estas pruebas sean el foco principal, ya que cualquiera que compre este modelo activará DLSS 4 (o 3) en todos los juegos compatibles.

Teniendo esto en cuenta, esta generación ofrece un incremento promedio del 20 % en rendimiento rasterizado en nuestras pruebas. Puede parecer mucho o poco, dependiendo de cómo se analice, pero es importante destacar que esta generación está diseñada específicamente para un algoritmo basado en IA de muy altas prestaciones. Ignorar esto sería no reconocer que estamos ante un cambio de paradigma donde los gráficos están definidos por los motores de proceso de IA locales.

Pruebas RT sin DLSS en 4k

Ashes of the Singularity (DX12) 1080

DOOM (Vulkan) ultra 1080

Halo Wars 2 (DX12) ultra 1080

Ghost Recon Wildlands (DX11) ultra 1080

Total War: Warhammer (DX12) ultra 1080

Battlefield 1 (DX12) ultra 1080

StarWars BattleFront 2 ultra (DX12) ultra 1080

Battlefield V (DX12) ultra 1080

Doom Eternal ultra 1080

Flight Simulator Ultra 1080

Ashes of the Singularity (DX12) 1440

DOOM (Vulkan) ultra 1440

Halo Wars 2 (DX12) ultra 1440

Ghost Recon Wildlands (DX11) ultra 1440

Total War: Warhammer (DX12) ultra 1440

Battlefield 1 (DX12) ultra 1440

StarWars BattleFront 2 ultra (DX12) ultra 1440

Battlefield V (DX12) ultra 1440

Doom Eternal ultra 1440

Flight Simulator Ultra 1440

Ashes of the Singularity (DX12) 2160

DOOM (Vulkan) ultra 2160

Halo Wars 2 (DX12) ultra 2160

Ghost Recon Wildlands (DX11) ultra 2160

Total War: Warhammer (DX12) ultra 2160

Battlefield 1 (DX12) ultra 2160

StarWars BattleFront 2 ultra (DX12) ultra 2160

Battlefield V (DX12) ultra 2160

Doom Eternal ultra 2160

Flight Simulator Ultra 2160

3DMark Speed Way (1440p)

3DMark Steel Nomad (4K)

3DMark Port Royal (1440p)

3DMark Time Spy (1440p)

3DMark Time Spy Extreme (2160p)

3DMark Fire Strike (1080p)

3DMark Fire Strike Extreme (1440p)

3DMark Fire Strike Ultra (2160p)

Si nos ceñimos exclusivamente a las pruebas de rendimiento raster, podría parecer que esta generación apenas gana un 15 % de rendimiento con un aumento de consumo del 33 %. Estos son datos ciertos, y seguramente los encontraréis en muchas de las reviews que se publican hoy junto con esta.

Sin embargo, la realidad de las RTX 50, encabezadas por la GeForce RTX 5090, es que ya no son simplemente GPU de rasterizado. Claro que lo hacen bien, tienen que hacerlo bien, pero estas tarjetas han trascendido esa función. Están diseñadas para ejecutar modelos de IA transformadores de manera extremadamente eficiente, alcanzando un nivel de rendimiento que eclipsa los TOPs de las CPUs más avanzadas de última generación.

Con toda esta potencia de proceso y los modelos entrenados directamente por NVIDIA, los juegos no solo son hasta 8 veces más rápidos, como hemos visto con DLSS 4, sino que además se ven mucho mejor, con una calidad visual sobresaliente y latencias iguales o, en algunos casos, incluso más bajas.

Las RTX 50 representan un cambio en el paradigma de las GPU. Son tarjetas gráficas diseñadas para procesar algoritmos complejos. Bienvenidos al futuro de las GPU, porque este camino ya no tiene vuelta atrás. Ni NVIDIA ni su competencia retrocederán en esta evolución.

Hace 7 horas por Javier Rodríguez