NVIDIA GeForce RTX 5090 FE Review
La GPU que probamos hoy es el avance en rendimiento de juegos más notable en muchas generaciones. Dobla en rendimiento a su antecesora, pero también es verdad que no lo hace de la forma tradicional. Según vayamos avanzando en nuestra review, veremos que las diferencias de prestaciones clásicas entre la RTX 4090 y la RTX 5090 no son tantas, pero sí que lo son en el concepto de entender la reproducción de juegos.
La generación anterior se apoyaba en la IA, mediante DLSS 3.5, para lograr imágenes fotorrealistas con RTX a pantalla completa y la generación de frames para permitir rendimientos RTX desconocidos hasta la fecha. Esta generación va mucho más allá, son más capaces de procesar cálculos propios de IA y ha permitido desarrollar a NVIDIA nuevas capacidades, como la generación de múltiples frames por cada frame real, hasta 3 frames calculados de “la nada” mediante IA con algoritmos predictivos para corregir el movimiento y también mejora la latencia.
Estas gráficas ofrecen el doble de rendimiento en DLSS que la generación anterior, tienen menos latencias y corrigen problemas de imagen típicos de la generación de frames de modelos anteriores. Todo en una gráfica de nuevo formato, que además no tiene ningún miedo en aprovechar el máximo de potencia que ofrecen los nuevos conectores para tarjetas gráficas de 16 pines, ya sea el nuevo 12V-2x6 del ATX 3.1 o el 12VHPWR del ATX 3.0, ambos compatibles.
Características técnicas de la NVIDIA GeForce RTX 5090 Founders Edition
- Tarjeta gráfica: GeForce RTX 5090
- GPU: GB202
- Arquitectura de la GPU: NVIDIA Blackwell
- GPCs: 11
- TPCs: 85
- SMs: 170
- CUDA Cores / SM: 128
- CUDA Cores / GPU: 21760
- Tensor Cores / SM: 4 (5th Gen)
- Tensor Cores / GPU: 680 (5th Gen)
- RT Cores: 170 (4th Gen)
- GPU Boost Clock (MHz): 2407
- Peak FP32 TFLOPS (non-Tensor): 104,8
- Peak FP16 TFLOPS (non-Tensor): 104,8
- Peak BF16 TFLOPS (non-Tensor): 104,8
- Peak INT32 TOPS (non-Tensor): 317.5
- RT TFLOPS: 317.5
- Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS): 1676/3352²
- Peak FP16 Tensor TFLOPS FP16 Acumulado: 838/1676²
- Peak FP16 Tensor TFLOPS FP32 Acumulado: 419/838²
- Peak BF16 Tensor TFLOPS FP32 Acumulado: 209.5/419²
- Peak TF32 Tensor TFLOPS: 104.8/209.5²
- Peak INT8 Tensor TOPS: 838/1676²
- Tamaño de la VRAM y tipo: 32 GB GDDR7
- Interfaz de memoria: 512-bit
- Memory Clock (Data Rate): 28 Gbps
- Ancho de banda de la memoria: 1792 GB/sec
- ROPs: 176
- Pixel Fill-rate (Gigapixels/sec): 423.6
- Unidades de texturas: 680
- Texel Fill-rate (Gigatexels/sec): 1636.8
- L1 Data Cache/Shared Memory: 21760 KB
- L2 Cache Size: 98304 KB
- Tamaño del archivo de registro: 43520 KB
- Unidades de proceso de vídeo: 3 x NVENC (9th Gen), 2 x NVDEC (6th Gen)
- TGP (Total Graphics Power): 575 W
- Cantidad de transistores: 92.2 mil millones
- Tamaño del Die: 750 mm²
- Proceso de fabricación: TSMC 4nm 4N NVIDIA Custom
- Interfaz PCI Express: Gen 5
La arquitectura NVIDIA RTX Blackwell incluye una serie de innovaciones diseñadas para revolucionar los gráficos, el trazado de rayos, la inteligencia artificial y la eficiencia energética. Estas son las principales, aunque no las únicas, que iremos desgranando en las próximas líneas. No me adentraré mucho en la arquitectura, ya que tuvimos oportunidad de dedicarle tiempo en este otro artículo.
Nuevas características del SM (Shader Model) para Neural Shading: Los nuevos núcleos RT (RT Core) de quinta generación y los nuevos Tensor Core de cuarta generación mejoran y aceleran las capacidades de renderizado neuronal, introduciendo modelos de transformación antes no disponibles, basados en modelos estándar y también de rápida respuesta como es el FP4.
La arquitectura SM (Streaming Multiprocessor) de Blackwell duplica el rendimiento de las operaciones matemáticas enteras por ciclo de reloj en comparación con la serie NVIDIA Ada, lo que beneficia especialmente las cargas de trabajo relacionadas con la generación de direcciones, cruciales para las nuevas unidades de sombreado neuronal.
NVIDIA Max-Q estará presente también en las gráficas de sobremesa de NVIDIA: Blackwell introduce características avanzadas de apagado por sectores (power gating) y nuevos rieles de potencia divididos (split power rails) que permiten un control preciso en la entrega de energía a diferentes subsistemas del chip.
Los relojes internos pueden ajustarse a cargas de trabajo dinámicas 1,000 veces más rápido que en arquitecturas anteriores, maximizando la eficiencia y el rendimiento según la demanda, con estados más profundos y latencias menores para pasar de esos estados de reposo, por zonas y funciones, a estados de carga elevada.
Núcleos RT de 4ª generación con mejoras significativas: Los nuevos núcleos de trazado de rayos (Ray Tracing Cores) en Blackwell ofrecen experiencias avanzadas y permiten nuevas técnicas de renderizado neuronal y trazado de rayos con un rendimiento notablemente mejorado, con una arquitectura más capaz, con prestaciones sorprendentes como la nueva Mega Geometría que permite aplicar técnicas de rayos a clústeres a resolución completa, no como en generaciones anteriores, y con un consumo mejor de memoria, lo que permite miles de millones de triángulos en pantalla.
Núcleos tensoriales de 5ª generación con capacidades de procesamiento optimizadas: Incorporan soporte para FP4, una tecnología que permite duplicar el rendimiento de IA mientras reduce a la mitad los requisitos de memoria. Soporte integrado para la nueva Second-Generation FP8 Transformer Engine, que se utiliza en las GPU de clase empresarial de la familia Blackwell, diseñadas para centros de datos.
NVIDIA DLSS 4, la gran estrella de esta generación y también una necesidad para NVIDIA para realmente lograr los resultados de rendimiento y calidad de imagen que prometen en esta generación. Esta tecnología permite crear más de un frame por frame real, que es lo que hacía el DLSS 3 o el DLSS 3.5 (con reconstrucción de rayos). Sino que permite, y esto es configurable, introducir hasta tres frames completamente generados por IA y desde una resolución más baja. Es decir, de cada 16 píxeles que vemos en pantalla, 15 están generados por la IA.
Sombreadores neuronales RTX (RTX Neural Shaders): permiten integrar pequeñas redes neuronales directamente en los sombreadores programables, abriendo una nueva era de innovación gráfica en videojuegos y aplicaciones interactivas. Con mejoras notables en la gestión de elementos complejos en pantalla como el cabello, los materiales que transportan iluminación en su interior como la piel o el realismo de los gestos en una cara.
Procesador de Gestión de IA (AI Management Processor, AMP) con soporte para múltiples modelos IA simultáneos: El AMP permite ejecutar varios modelos de IA al mismo tiempo que las cargas de trabajo gráficas. Esto incluye modelos de voz, traducción, visión por computadora, animación, comportamiento y muchos otros, reduciendo latencias.
Es la primera GPU con memoria GDDR7: Basada en el estándar de memoria GDDR7, utiliza tecnología de modulación por amplitud de pulso (PAM3), permitiendo subsistemas de memoria más rápidos y con una mejora notable en la eficiencia energética. La mitad de consumo, el doble de rendimiento, alcanzando en este modelo que probamos hoy la increíble cifra de 1800 GBps de ancho de banda sobre un bus de 512 bits.
DLSS 4 es, sin duda, el gran avance de esta generación. Será exclusiva de esta gama y permite desarrollar hasta 8 veces el rendimiento que tendríamos con técnicas de renderizado tradicionales y, a la vez, como veremos más adelante, mejora la latencia y también la calidad de imagen, por encima de lo que podríamos lograr con el rendimiento nativo de la tarjeta.
¿Dónde está el milagro? NVIDIA entrena sus juegos compatibles con DLSS 4, que se espera que sean hasta 75 para el lanzamiento de esta tarjeta (el día 30 es cuando se podrá comprar), de forma que lo que hace localmente la RTX 50 es una especie de “streaming” interactivo en tiempo real de todos esos cálculos realizados mediante los modelos de IA de NVIDIA.
El resultado, para ti y para mí, que queremos disfrutar de nuestros mejores juegos, es que DLSS 4 ofrece más calidad de imagen y el doble de rendimiento que DLSS 3.5, 8 veces más que en renderizado nativo, y el resultado, al menos en las pruebas de los juegos que hemos podido ejecutar, es real. Está ahí y es perfectamente perceptible.
La principal ventaja de esta tecnología es que ahora el “frame generation” puede generar hasta tres frames por cada frame real, sumada a la super resolución, por lo que de cada 16 píxeles que verás en pantalla, 15 son artificiales. NVIDIA introduce otras técnicas relacionadas, como un controlador para cuándo introducir esos frames y también la nueva tecnología NVIDIA Reflex 2, que permite reducir la latencia incluso con todas estas técnicas aplicadas.
A esto podemos sumar la mega geometría, todas las prestaciones neuronales nuevas, pero también otras prestaciones que van más allá de los juegos, como la nueva conectividad DisplayPort 2.1b con anchos de banda de hasta 80 Gbps, con compatibilidad para UHBR20 de hasta 20 Gbps por línea, por conector. Permite resoluciones 8K con hasta 165 Hz de refresco vertical y 4K con hasta 480 Hz. La mejor conectividad y, sin duda, una mejora notable sobre las unidades de la anterior generación.
Estos nuevos modelos también entregan nuevas unidades de proceso de video duales, algo que se introdujo en las RTX 40 y que ahora, en la RTX 50, se potencia con nuevos formatos de video y más velocidad de proceso. Ahora soporta los modos AV1 más exigentes, todos por hardware, con codificación y decodificación de formatos como el 4:2:2. Este tipo de muestreo de chroma permite retener la mitad de la calidad del video original (4:4:4) con el doble de velocidad de proceso, ofreciendo el doble de calidad que los formatos soportados hasta ahora, por hardware, que se basaban en muestras 4:2:0.
En esta sección he querido dar un repaso a los números de Blackwell para el mercado de sobremesa, de toda la gama, puesto que creo que es la oportunidad perfecta para comparar números puros y duros con las anteriores generaciones. El salto de rendimiento generacional, el puro y el DLSS, lo veremos después en nuestros datos de rendimiento; ahora vamos a los números puros y simples.
He separado la tabla de especificaciones por gama, con tres generaciones de gráficas de cada tipo. Lo que podemos ver de primeras en la RTX 5090 es que es la gráfica de más consumo, con más memoria y más ancho de banda de memoria que NVIDIA haya creado jamás. Son 32 GB de GDDR7 con un bus de 512 bits que genera casi 2 TB de ancho de banda por segundo. Esta generación también introduce el PCI Express Gen 5 con 512 GBps de ancho de banda por primera vez.
Tarjeta gráfica | GeForce RTX 3090 | GeForce RTX 4090 | GeForce RTX 5090 |
GPU | GA102 | AD102 | GB202 |
Arquitectura de la GPU | NVIDIA Ampere | NVIDIA Ada Lovelace | NVIDIA Blackwell |
GPCs | 7 | 11 | 11 |
TPCs | 41 | 64 | 85 |
SMs | 82 | 128 | 170 |
CUDA Cores / SM | 128 | 128 | 128 |
CUDA Cores / GPU | 10496 | 16384 | 21760 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 328 (3rd Gen) | 512 (4th Gen) | 680 (5th Gen) |
RT Cores | 82 (2nd Gen) | 128 (3rd Gen) | 170 (4th Gen) |
GPU Boost Clock (MHz) | 1695 | 2520 | 2407 |
Peak FP32 TFLOPS (non-Tensor) | 35,6 | 82,6 | 104,8 |
Peak FP16 TFLOPS (non-Tensor) | 35,6 | 82,6 | 104,8 |
Peak BF16 TFLOPS (non-Tensor)¹ | 35.6 | 82.6 | 104.8 |
Peak INT32 TOPS (non-Tensor)¹ | 17.8 | 41.3 | 317.5 |
RT TFLOPS | 69.5 | 191 | 317.5 |
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) | N/A | N/A | 1676/3352² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | N/A | 660.6/1321.2² | 838/1676² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | N/A | 660.6/1321.2² | 419/838² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | 142.3/284.6² | 330.3/660.6² | 419/838² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | 71.2/142.4² | 165.2/330.4² | 209.5/419² |
Peak BF16 Tensor TFLOPS FP32 Acumulado | 71.2/142.4² | 165.2/330.4² | 209.5/419² |
Peak TF32 Tensor TFLOPS¹ | 35.6/71.2² | 82.6/165.2² | 104.8/209.5² |
Peak INT8 Tensor TOPS¹ | 284.7/569.4² | 660.6/1321.2² | 838/1676² |
Tamaño de la VRAM y tipo | 24 GB GDDR6X | 24 GB GDDR6X | 32 GB GDDR7 |
Interfaz de memoria | 384-bit | 384-bit | 512-bit |
Memory Clock (Data Rate) | 19.5 Gbps | 21 Gbps | 28 Gbps |
Ancho de banda de la memoria | 936 GB/sec | 1008 GB/sec | 1792 GB/sec |
ROPs | 112 | 176 | 176 |
Pixel Fill-rate (Gigapixels/sec) | 189.8 | 443.5 | 423.6 |
Unidades de texturas | 328 | 512 | 680 |
Texel Fill-rate (Gigatexels/sec) | 555.96 | 1290.2 | 1636.8 |
L1 Data Cache/Shared Memory | 10496 KB | 16384 KB | 21760 KB |
L2 Cache Size | 6144 KB | 73728 KB | 98304 KB |
Tamaño del archivo de registro | 20992 KB | 32768 KB | 43520 KB |
Unidades de proceso de vídeo | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) | 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) | 3 x NVENC (9th Gen) 2 x NVDEC (6th Gen) |
TGP (Total Graphics Power) | 350 W | 450 W | 575 W |
Cantidad de Transistores | 28.3 M.Millones | 76.3 M.Millones | 92.2 M.Millones |
Tamaño del Die | 628.4 mm² | 608.5 mm² | 750 mm² |
Proceso de Fabricación | Samsung 8nm 8N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom |
Interfaz PCI Express | Gen 4 | Gen 4 | Gen 5 |
El resto de números, como el número de unidades RT Cores o Tensor Cores, también mejora pero con cifras menos espectaculares. Pasamos de 128 a 170 RT Cores o de 512 a 680 Tensor Cores. Los números aumentan en los CUDA Cores, que pasan de 21,000, y tenemos también mejoras sustanciales en potencia de proceso de IA, sobre todo para los nuevos modelos FP4 introducidos en este modelo. En el resto de modelos, como el INT8, tenemos una mejora más reducida, de en torno al 30%.
Tarjeta gráfica | Geforce RTX 3080 | GeForce RTX 4080 | GeForce RTX 5080 |
GPU | GA102 | AD103 | GB203 |
Arquitectura de la GPU | NVIDIA Ampere | NVIDIA Ada Lovelace | NVIDIA Blackwell |
GPCs | 6 | 7 | 11 |
TPCs | 34 | 38 | 42 |
SMs | 68 | 76 | 84 |
CUDA Cores / SM | 128 | 128 | 128 |
CUDA Cores / GPU | 8704 | 9728 | 10752 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 272 (3rd Gen) | 304 (4th Gen) | 336 (5th Gen) |
RT Cores | 80 (2nd Gen) | 76 (3rd Gen) | 84 (4th Gen) |
GPU Boost Clock (MHz) | 1710 | 2505 | 2617 |
Peak FP32 TFLOPS (non-Tensor) | 34.1 | 48.7 | 56.3 |
Peak FP16 TFLOPS (non-Tensor) | 34.1 | 48.7 | 56.3 |
Peak BF16 TFLOPS (non-Tensor)¹ | 34.1 | 48.7 | 56.3 |
Peak INT32 TOPS (non-Tensor)¹ | 17 | 24.4 | 56.3 |
RT TFLOPS | 58,1 | 112,7 | 170,6 |
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) | N/A | N/A | 900.4/1801² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | N/A | 389.9/779.8² | 450.2/900.4² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | N/A | 389.9/779.8² | 225.1/450.2² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | 119.1/238.2² | 194.9/389.8² | 225.1/450.2² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | 59.5/119² | 97.5/195² | 112.6/225.1² |
Peak BF16 Tensor TFLOPS FP32 Acumulado | 59.5/119² | 97.5/195² | 112.6/225.1² |
Peak TF32 Tensor TFLOPS¹ | 29.8/59.6² | 48.7/97.4² | 56.3/112.6² |
Peak INT8 Tensor TOPS¹ | 238.1/476.2² | 389.9/779.8² | 450.2/900.4² |
Tamaño de la VRAM y tipo | 10 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR7 |
Interfaz de memoria | 320-bit | 256-bit | 256-bit |
Memory Clock (Data Rate) | 19 Gbps | 22.4 Gbps | 30 Gbps |
Ancho de banda de la memoria | 760 GB/sec | 716.8 GB/sec | 960 GB/sec |
ROPs | 96 | 112 | 112 |
Pixel Fill-rate (Gigapixels/sec) | 164.2 | 280.6 | 293.1 |
Unidades de texturas | 272 | 304 | 336 |
Texel Fill-rate (Gigatexels/sec) | 465.12 | 761.5 | 879.3 |
L1 Data Cache/Shared Memory | 8704 KB | 9728 KB | 10752 KB |
L2 Cache Size | 5120 KB | 65536 KB | 65536 KB |
Tamaño del archivo de registro | 17408 KB | 19456 KB | 21504 KB |
Unidades de proceso de vídeo | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) | 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) | 2 x NVENC (9th Gen) 2 x NVDEC (6th Gen) |
TGP (Total Graphics Power) | 320 W | 320 W | 360 W |
Cantidad de Transistores | 28.3 M.Millones | 45.9 M.Millones | 45.6 M.Millones |
Tamaño del Die | 628.4 mm² | 378,6 mm² | 378 mm² |
Proceso de Fabricación | Samsung 8nm 8N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom |
Interfaz PCI Express | Gen 4 | Gen 4 | Gen 5 |
Las frecuencias de trabajo de la GPU son, en teoría, menores, más de 100 MHz menos que la generación anterior, pero luego veremos que esto es más un ajuste teórico que práctico; la tarjeta desempeña muy bien a frecuencias similares a los modelos en Ada Lovelace. En el resto de tablas tenéis la comparativa generacional. Según vayamos haciendo reviews de todas estas gráficas, iremos entrando en los detalles.
Tarjeta gráfica | GeForce RTX 3070 Ti | GeForce RTX 4070 Ti | GeForce RTX 5070 Ti | GeForce RTX 3070 | GeForce RTX 4070 | GeForce RTX 5070 |
GPU | GA104 | AD104 | GB203 | GA104 | AD104 | GB205 |
Arquitectura de la GPU | NVIDIA Ampere | NVIDIA Ada Lovelace | NVIDIA Blackwell | NVIDIA Ampere | NVIDIA Ada Lovelace | NVIDIA Blackwell |
GPCs | 6 | 5 | 11 | 6 | 5 | 5 |
TPCs | 24 | 30 | 35 | 23 | 23 | 24 |
SMs | 48 | 60 | 70 | 46 | 46 | 48 |
CUDA Cores / SM | 128 | 128 | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 6144 | 7680 | 8960 | 5888 | 5888 | 6144 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 192 (3rd Gen) | 240 (4th Gen) | 280 (5th Gen) | 184 (3rd Gen) | 184 (4th Gen) | 192 (5th Gen) |
RT Cores | 48 (2nd Gen) | 60 (3rd Gen) | 70 (4th Gen) | 46 (2nd Gen) | 46 (3rd Gen) | 48 (4th Gen) |
GPU Boost Clock (MHz) | 1770 | 2610 | 2452 | 1725 | 2475 | 2512 |
Peak FP32 TFLOPS (non-Tensor) | 21.7 | 40.1 | 43.9 | 20.3 | 29.1 | 30.9 |
Peak FP16 TFLOPS (non-Tensor) | 21.7 | 40.1 | 43.9 | 20.3 | 29.1 | 30.9 |
Peak BF16 TFLOPS (non-Tensor)¹ | 21.7 | 40.1 | 43.9 | 20.3 | 29.1 | 30.9 |
Peak INT32 TOPS (non-Tensor)¹ | 10.9 | 20.0 | 43.9 | 10.2 | 14.6 | 30.9 |
RT TFLOPS | 42,5 | 92,7 | 133,2 | 39.7 | 67.4 | 93.6 |
Peak FP32 Tensor TFLOPS FP32 Acumulado (FP4 AI TOPS) | N/A | N/A | 703/1406² | N/A | N/A | 493.9/987.8² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | N/A | 320.7/641.4² | 351.5/703² | N/A | 233.2/466.4² | 246.9/493.9² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | N/A | 320.7/641.4² | 175.8/351.5² | N/A | 233.2/466.4² | 123.5/246.9² |
Peak FP16 Tensor TFLOPS FP16 Acumulado | 87/174² | 160.4/320.8² | 175.8/351.5² | 81.3/162.6² | 116.6/233.2² | 123.5/246.9² |
Peak FP16 Tensor TFLOPS FP32 Acumulado | 43.5/87² | 80.2/160.4² | 87.9/175.8² | 40.6/81.2² | 58.3/116.6² | 61.7/123.5² |
Peak BF16 Tensor TFLOPS FP32 Acumulado | 43.5/87² | 80.2/160.4² | 87.9/175.8² | 40.6/81.2² | 58.3/116.6² | 61.7/123.5² |
Peak TF32 Tensor TFLOPS¹ | 21.7/43.4² | 40.1/80.2² | 43.9/87.9² | 20.3/40.6² | 29.1/58.2² | 30.9/61.7² |
Peak INT8 Tensor TOPS¹ | 174/348² | 320.7/641.4² | 351.5/703² | 162.5/325² | 233.2/466.4² | 246.9/493.9² |
Tamaño de la VRAM y tipo | 8 GB GDDR6X | 12 GB GDDR6X | 16 GB GDDR6 | 8 GB GDDR6 | 12 GB GDDR6X | 12 GB GDDR7 |
Interfaz de memoria | 256-bit | 192-bit | 256-bit | 256-bit | 192-bit | 192-bit |
Memory Clock (Data Rate) | 19 Gbps | 21 Gbps | 28 Gbps | 14 Gbps | 21 Gbps | 28 Gbps |
Ancho de banda de la memoria | 608 GB/sec | 504 GB/sec | 896 GB/sec | 448 GB/sec | 504 GB/sec | 672 GB/sec |
ROPs | 96 | 80 | 96 | 96 | 64 | 80 |
Pixel Fill-rate (Gigapixels/sec) | 169.9 | 208.8 | 235.4 | 165.6 | 158.4 | 201 |
Unidades de texturas | 192 | 240 | 280 | 184 | 184 | 192 |
Texel Fill-rate (Gigatexels/sec) | 339.84 | 626.4 | 686.6 | 317.4 | 455.4 | 482.3 |
L1 Data Cache/Shared Memory | 6144 KB | 7680 KB | 8960 KB | 5888 KB | 5888 KB | 6144 KB |
L2 Cache Size | 4096 KB | 49152 KB | 49152 KB | 4096 KB | 36864 KB | 49152 KB |
Tamaño del archivo de registro | 12288 KB | 15360 KB | 17920 KB | 11776 KB | 11776 KB | 12288 KB |
Unidades de proceso de vídeo | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) | 2 x NVENC (8th Gen) 1 x NVDEC (5th Gen) | 2 x NVENC (9th Gen) 1 x NVDEC (5th Gen) | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) | 1 x NVENC (8th Gen) 1 x NVDEC (5th Gen) | 1 x NVENC (9th Gen) 1 x NVDEC (5th Gen) |
TGP (Total Graphics Power) | 290 W | 285 W | 300 W | 220 W | 200 W | 250 W |
Cantidad de Transistores | 17.4 M.Millones | 35.8 M.Millones | 45.6 M.Millones | 17.4 M.Millones | 35.8 M.Millones | 31.1 M.Millones |
Tamaño del Die | 392.5 mm² | 294.5 mm² | 378 mm² | 392.5 mm² | 294.5 mm² | 263 mm² |
Proceso de Fabricación | Samsung 8nm 8N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom | Samsung 8nm 8N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom | TSMC 4nm 4N NVIDIA Custom |
Interfaz PCI Express | Gen 4 | Gen 4 | Gen 5 | Gen 4 | Gen 4 | Gen 5 |
Esta gráfica es simplemente impresionante, desde el bonito embalaje en materiales reciclables como el cartón o la fibra de papel, hasta los propios acabados de la tarjeta. Es una auténtica maravilla que, además, técnicamente introduce muchas mejoras.
Tiene un TDP muy superior a la generación anterior y, aun así, es más compacta. De hecho, ocupa solo dos slots de altura, enmarcandose en el proyecto SFF (Small Form Factor) de NVIDIA. El peso es considerable, una tarjeta realmente sólida, con un único conector de 16 contactos Gen5 al que saca todo el partido, aunque ciertamente debería tener margen a través del conector PCI Express 5.0, que es capaz de suministrar también hasta 300 W de potencia adicional.
El diseño es similar al de la generación anterior, pero es una gráfica más redondeada con elementos nuevos. El PCB es muy compacto, centrado en la tarjeta, lo que permite que sus dos grandes ventiladores axiales tengan cruce completo sin resistencia por todo el radiador de la tarjeta.
Ambos están situados en la misma orientación y refrigeran un conjunto de láminas curvas y planas que permite a NVIDIA mantener la presión estática en todo el recorrido. Los laterales tienen aperturas orientadas para evitar la recirculación de aire caliente. Son 600 W a refrigerar cosa que ahora analizaremos como hacen, adelantandoos que tienen modo de parada completa en reposo.
Todo está alimentado por una cámara de vapor configurada en 3 dimensiones con comunicación directa con los heatpipes, lo que sin duda ofrece un rendimiento térmico excepcional. El PCB, que en realidad son tres, se centra en la tarjeta y es tremendamente compacto, con un diseño de alimentación completamente renovado.
Otros dos PCBs se encargan de la conectividad frontal, que se cuenta por tres conectores DisplayPort 2.1b completos y un HDMI 2.1b, y otro se encarga de la conectividad PCI Express 5.0 hacia la placa base.
El diseño incluye algunos elementos estéticos como LEDs, tanto en la cara anterior como posterior y en la zona del logo lateral, donde se lee el nombre de la GPU: GeForce RTX 5090. Es una tarjeta espectacular y con un diseño SFF que se puede montar en casi cualquier PC. Sus dimensiones son: 304 mm de longitud, 137 mm de altura, y 2 slots (40 mm) de ancho. Un bonito sueño para cualquier jugador.
Algo que hay que tener muy en cuenta en un diseño arriesgado como este es cómo se comportará la tarjeta tanto en reposo como en estrés, y si es capaz de mantener las frecuencias que promete sobre el papel. Es algo que hacemos con todas las tarjetas que pasan por nuestras manos, con más razón con una tarjeta que es la de mayor consumo de la historia y que, además, presenta un diseño más compacto que su antecesora, con casi 150 W menos de consumo.
Lo que hemos podido ver durante nuestras pruebas de estrés y estabilidad es que este modelo no solo cumple con las velocidades turbo que se esperan de ella, 2400 MHz aproximadamente, sino que las supera con creces, estabilizando, como veis en las capturas, alrededor de los 2700 MHz. A esta frecuencia, las temperaturas de trabajo son de unos 66 grados, lo cual es absolutamente increíble, y el ruido realmente ligero, menos de 43 dBA en plena carga con ventiladores a apenas 1700 rpm (en reposo tienen parada completa a 0 rpm). El consumo medio de la tarjeta, medido a entrada y por hardware, es de 564 vatios.
Un conector PCI Gen5, ya sea el 12V-2x6 o el 12VHPWR, soporta un máximo de 600 W de carga, por lo que os podéis imaginar que en este modelo el margen de aumento de potencia que admite NVIDIA para overclock es bastante reducido, solo admite un 4 % adicional. Con todo, hay poco margen de overclock sin tocar voltajes, cosa que yo no haría en una tarjeta de 2500 euros, que es además ya un portento moviendo juegos.
Sea como fuere, con este margen hemos podido exprimir otros 250 MHz adicionales estables en este modelo. Son casi 3000 MHz de GPU en un modelo pensado para 2400 MHz. Con esto, además, apenas aumentamos los consumos a 607 W en pico. El ruido se mantiene muy bien cerca de los 45 dBA, y las revoluciones de los ventiladores apenas rozan las 2000 rpm.
Para mí, es un resultado excelente en una tarjeta con este diseño. Es pronto para saberlo, pero quizás veamos modelos aún más rápidos con diseños mucho más grandes y voluminosos. Espero tener la oportunidad de probar alguno de ellos de marcas como ASUS, MSI o Gigabyte.
Zotac GeForce RTX 3090 Ti AMP Extreme Holo | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2010 | 470 | 68 | 40 |
Stock + 10% TDP | 2050 | 490 | 72 | 42 |
Stock + 60MHz | 2060 | 488 | 71 | 42 |
Stock + 100MHz | 2080 | 492 | 74 | 45 |
MSI GeForce RTX 4080 Suprim X | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2715 | 310 | 65 | 32 |
Stock + 25% TDP | 2805 | 325 | 70 | 34 |
Stock + 200MHz | 3000 | 336 | 72 | 36 |
Stock + 250MHz | 3060 | 343 | 73 | 40 |
MSI GeForce RTX 4090 Suprim X | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2820 | 420 | 65 | 37 |
Stock + 8% TDP | 3030 | 430 | 68 | 39 |
Stock + 200MHz | 3000 | 440 | 69 | 42 |
Stock + 260MHz | 3060 | 458 | 71 | 43 |
NVIDIA GeForce RTX 5090 FE | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2700 | 564 | 64 | 40 |
Stock + 4% TDP | 2850 | 570 | 66 | 42 |
Stock + 200MHz | 2940 | 602 | 71 | 45 |
Stock + 250MHz | 3014 | 604 | 71 | 45 |
ASUS TUF GAMING GeForce RTX 4080 Super OC | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2730 | 298 | 62 | 35 |
Stock + 10% TDP | 2815 | 310 | 64 | 37 |
Stock + 100MHz | 2920 | 330 | 64 | 40 |
Stock + 200MHz | 2955 | 340 | 64 | 42 |
ASUS TUF GAMING GeForce RTX 4080 Super OC | Frecuencia GPU (MHz) | Consumo (w) | Temperatura (Cº) | Ruido (dBA) |
Stock | 2715 | 298 | 62 | 33 |
Stock + 10% TDP | 2775 | 310 | 64 | 35 |
Stock + 100MHz | 2850 | 330 | 64 | 35 |
Stock + 200MHz | 3000 | 340 | 64 | 35 |
Esta tarjeta es completamente DLSS 4, y toda la familia se ha diseñado con esta nueva prestación en mente. Realmente, el impacto es impresionante tanto en números como en calidad de imagen. NVIDIA consigue reducir artefactos en pantalla, parpadeos y aumentar el rendimiento hasta el doble con respecto a la generación anterior gracias a esta técnica. Nosotros lo hemos comprobado con diversos test, tanto en juegos ya compatibles como en fases beta. La verdad es que el resultado es sorprendente.
Equipo de pruebas:
- Placa base: ASUS ProArt X870E-CREATOR WIFI Review
- Procesador: AMD Ryzen 7 9800X3D
- Memoria: G.Skill Ripjaws M5 Neo RGB DDR5-6000 CL28
- Fuente: Cooler Master V PLATINUM 1600 V2
- Disco duro: Corsair MP700 Elite 2TB
3DMark DLSS Feature Test DLSS 4 beta
Doom Eternal 4k Ultra
F1 24 1080 Ultra
Cyberpunk 2077 4k
Hogwarts Legay 4k
Dragon Age: Veilguard
El salto en calidad visual también es notable. DLSS 4 logra generar imágenes más nítidas y detalladas, reduciendo los problemas de aliasing y artefactos que podían observarse en versiones anteriores. Esto se traduce en una experiencia mucho más inmersiva, incluso en configuraciones gráficas exigentes.
Hogwarts legacy
Dragon Age Veliguard
También, como es habitual, hemos añadido pruebas de rendimiento raster puro y duro para evaluar el verdadero potencial del nuevo hardware. Sin embargo, sinceramente, no creemos que estas pruebas sean el foco principal, ya que cualquiera que compre este modelo activará DLSS 4 (o 3) en todos los juegos compatibles.
Teniendo esto en cuenta, esta generación ofrece un incremento promedio del 20 % en rendimiento rasterizado en nuestras pruebas. Puede parecer mucho o poco, dependiendo de cómo se analice, pero es importante destacar que esta generación está diseñada específicamente para un algoritmo basado en IA de muy altas prestaciones. Ignorar esto sería no reconocer que estamos ante un cambio de paradigma donde los gráficos están definidos por los motores de proceso de IA locales.
Pruebas RT sin DLSS en 4k
Ashes of the Singularity (DX12) 1080
DOOM (Vulkan) ultra 1080
Halo Wars 2 (DX12) ultra 1080
Ghost Recon Wildlands (DX11) ultra 1080
Total War: Warhammer (DX12) ultra 1080
Battlefield 1 (DX12) ultra 1080
StarWars BattleFront 2 ultra (DX12) ultra 1080
Battlefield V (DX12) ultra 1080
Doom Eternal ultra 1080
Flight Simulator Ultra 1080
Ashes of the Singularity (DX12) 1440
DOOM (Vulkan) ultra 1440
Halo Wars 2 (DX12) ultra 1440
Ghost Recon Wildlands (DX11) ultra 1440
Total War: Warhammer (DX12) ultra 1440
Battlefield 1 (DX12) ultra 1440
StarWars BattleFront 2 ultra (DX12) ultra 1440
Battlefield V (DX12) ultra 1440
Doom Eternal ultra 1440
Flight Simulator Ultra 1440
Ashes of the Singularity (DX12) 2160
DOOM (Vulkan) ultra 2160
Halo Wars 2 (DX12) ultra 2160
Ghost Recon Wildlands (DX11) ultra 2160
Total War: Warhammer (DX12) ultra 2160
Battlefield 1 (DX12) ultra 2160
StarWars BattleFront 2 ultra (DX12) ultra 2160
Battlefield V (DX12) ultra 2160
Doom Eternal ultra 2160
Flight Simulator Ultra 2160
3DMark Speed Way (1440p)
3DMark Steel Nomad (4K)
3DMark Port Royal (1440p)
3DMark Time Spy (1440p)
3DMark Time Spy Extreme (2160p)
3DMark Fire Strike (1080p)
3DMark Fire Strike Extreme (1440p)
3DMark Fire Strike Ultra (2160p)
Si nos ceñimos exclusivamente a las pruebas de rendimiento raster, podría parecer que esta generación apenas gana un 15 % de rendimiento con un aumento de consumo del 33 %. Estos son datos ciertos, y seguramente los encontraréis en muchas de las reviews que se publican hoy junto con esta.
Sin embargo, la realidad de las RTX 50, encabezadas por la GeForce RTX 5090, es que ya no son simplemente GPU de rasterizado. Claro que lo hacen bien, tienen que hacerlo bien, pero estas tarjetas han trascendido esa función. Están diseñadas para ejecutar modelos de IA transformadores de manera extremadamente eficiente, alcanzando un nivel de rendimiento que eclipsa los TOPs de las CPUs más avanzadas de última generación.
Con toda esta potencia de proceso y los modelos entrenados directamente por NVIDIA, los juegos no solo son hasta 8 veces más rápidos, como hemos visto con DLSS 4, sino que además se ven mucho mejor, con una calidad visual sobresaliente y latencias iguales o, en algunos casos, incluso más bajas.
Las RTX 50 representan un cambio en el paradigma de las GPU. Son tarjetas gráficas diseñadas para procesar algoritmos complejos. Bienvenidos al futuro de las GPU, porque este camino ya no tiene vuelta atrás. Ni NVIDIA ni su competencia retrocederán en esta evolución.