AMD Ryzen Threadripper 1950X
Introducción
El mensaje que se nos mandaba estos años es que los usuarios de ordenadores domésticos no necesitaríamos nunca la potencia que se puede conseguir con una estación de trabajo, que no era una necesidad y que estábamos bien con mejoras destinadas únicamente a mantener la atención del usuario con numeraciones superiores y pocas mejoras reales.
Ryzen llego hace algunos meses y lo ha revolucionado todo. Los precios bajan, ahora Intel si considera que necesitamos procesadores de gama media más potentes e incluso hacen mejoras importantes en el rendimiento de sus procesadores de gama baja. En la gama alta hemos pasado de 10 núcleos a 1700 Euros a pronto tener hasta 18 núcleos por poco más que ese precio. AMD Ryzen ha revolucionado el mercado doméstico y lo mejor llega hoy mismo a las tiendas.
El Ryzen Threadripper es un procesador hermano de las soluciones empresariales EPYC de AMD y nos permite a los usuarios entusiastas alcanzar cotas que antes nos parecían impensables y por un precio alcanzable con una gama que partirá desde los 600 euros hasta los 1099 que cuesta este modelo que hoy os mostraremos en detalle. La gama, por ahora, incluye soluciones de 8, 12 y 16 núcleos con dos hilos de proceso por núcleos. 32 hilos de proceso en un ordenador de sobremesa a un precio razonable, evoluciona el concepto de procesador doméstico.
Especificaciones
Esta nueva serie de procesadores hereda y maximiza el aprovechamiento de la potente arquitectura Zen de AMD. Fabricados mediante un proceso de 14nm y formados por dos encapsulados con 4+4 núcleos cada uno comunicados por la tecnología Infinity Fabric y Data Fabric de AMD y con capacidad para combinar sus controladoras de memoria logrando anchos de banda sorprendentes, con soporte para memorias ultra-rápidas, con un cuádruple canal que desarrolla un bus de 256-Bit.
Este procesador introduce muchos cambios necesarios por su propia naturaleza. Su formato es mucho más grande, requiere un socket de grandes dimensiones denominado TR4 que es de tipo LGA con 4096 contactos. Esto es necesario porque este procesador es un portento comunicativo.
Vídeo de montaje del nuevo socket TR4:
Sin duda llama la atención por su tamaño, pero AMD ha diseñado uno de los mejores sistemas de montaje de socket que he visto en mucho tiempo. El procesador va montado en una bandeja que posicionamos en un rail y fijamos en el socket sin posibilidad de error y con las herramientas adecuadas para que todo tenga una precisión milimétrica en resistencia y fuerza. Un socket que nos permitirá montar sistemas de disipación sin sistemas de anclaje como ya hacemos en los sockets 2011 y 2066 de Intel.
Estos procesadores masivos cuentan con algunas prestaciones que resultan sorprendentes. Su configuración de doble "die" ofrece hasta 16 núcleos con capacidad para desarrollar dos hilos de proceso por núcleo. Los modelos de 12 u 8 núcleos de este modo mantienen la estructura de doble “die” con una configuración 3+3 o 2+2 para mantener prestaciones como el cuádruple canal de memoria donde podemos usar también memorias ECC, algo desconocido en equipos domésticos. Sin duda su potencia de ancho de banda de memoria es una de sus grandes diferencias con respecto a los Ryzen de socket AM4.
Cuentan con 32MB de cache de tercer nivel, todas las variantes, con una configuración de 16+16 que son accesibles solo por los núcleos de cada encapsulado. Todos los núcleos disfrutan de su propia cache L2 de baja latencia con 512KB de capacidad.
Estos nuevos procesadores desarrollan también frecuencias elevadas de entre los 3.4 hasta 3.5GHz en frecuencia base con modos turbo, para todos los núcleos, de hasta 3.7GHz y de 4GHz para cuatro núcleos o de hasta 4.2GHz mediante el sistema XFR de AMD que, como ya conocemos de los Ryzen de socket AM4, es un sistema que permite aprovechar sistemas de refrigeración más potentes de forma automática, sin intervención del usuario.
Este procesador es también un portento conectivo sin parangón. Dispone de una controladora de almacenamiento capaz de dar soporte hasta seis unidades NVMe de formato M.2 o U.2, controlar hasta 16 unidades SATA y dispone de 2 puertos USB 3.1 Gen2 nativos, 14 puertos USB 3.1 Gen1 y hasta seis puertos USB 2.0.
Estos procesadores disponen de 64 líneas PCI Express de tipo 3.0 que podemos repartir en un máximo de 7 dispositivos PCI Express. Las configuraciones graficas en este procesador no ofrecen limitación conectiva de ningún tipo y gracias a él conoceremos un nuevo concepto de integración de almacenamiento en placa. Superan en 20 lineas al mejor procesador de Intel en la actualidad.
Otra cosa que gustara a los desarrolladores y cacharreros como vosotros es que no hay limitaciones en cuanto a las prestaciones profesionales de estos procesadores para el soporte de virtualización por hardware.
Los nuevos Ryzen Threadripper tienen, sin embargo, un punto débil. Su capacidad de overclocking es limitada, aunque AMD ha hecho bien los deberes en el uso de materiales de intercambio de calor usando soldadura y materiales nobles como el oro en vez de pasta térmica como encontramos en las últimas generaciones de Intel. Su consumo, tiene que ver, sin duda con esto ya que requiere de un sistema de ventilación capaz de disipar 180w y eso hace que cualquier subida de voltaje, por controlada que sea, produzca una carga elevada en el sistema de ventilación que estemos usando.
Tiene otras prestaciones interesantes como el soporte de AES por hardware, la tecnología EFR de AMD y también la tecnología AMD-V (virtualización por hardware) que hace de estos procesadores todo un portento para los que queremos correr máquinas virtuales en nuestros sistemas. Algo que con este número de núcleos convierte a estos procesadores en una de las soluciones más potentes y económicas que podemos encontrar para virtualización de calidad.
Prestaciones de la arquitectura Zen de AMD
Los primeros modelos que llegaron al mercado son los Ryzen de la serie 7. No tendrán grandes diferencias con modelos inferiores, pero son el perfecto ejemplo de lo que esta arquitectura podrá ofrecer a los usuarios domésticos y profesionales. Se trata de procesadores de ocho núcleos donde se introduce, por primera vez en la historia de AMD, la capacidad de procesar en dos hilos paralelos por cada uno de los núcleos. Los nuevos Ryzen 5 comparten en buena medida todas las prestaciones de sus hermanos mayores.
Pero la gran capacidad de proceso de estos nuevos procesadores no solo se debe a su gran cantidad de núcleos o su capacidad de doble hilo por núcleo. AMD ha desarrollado toda una batería de prestaciones que hacen que estos procesadores brillen también en su capacidad de proceso singular.
Se ha mejorado la predicción por lo que es capaz de localizar mejor y más rápido las instrucciones necesarias, se ha introducido una nueva Cache Micro-op que permite reducir los accesos a la cache de segundo y tercer nivel. Se ha ampliado la ventana del programador de instrucciones hasta conseguir 1.75 veces más capacidad y se ha ampliado 1.5 veces los recursos de ejecución paralela. Esta profundización en la capacidad de proceso paralelo es que él pone la base del rendimiento de esta arquitectura y la que consigue que escale tan bien en sus configuraciones de múltiples núcleos.
Esta arquitectura se alimenta por una jerarquía renovada de cache de tres niveles que se estructura en una cache de primer nivel de 64KB, segundo nivel de 512KB por núcleo y una cache de tercer nivel de 8MB por cada cuatro núcleos, 16MB en los modelos de ocho núcleos de esta generación. Este diseño consigue más almacenamiento cerca del núcleo aumentando el ancho de banda hasta en cinco veces con respecto a generaciones anteriores.
Esquema de la cache de segundo nivel de 512KB por núcleo
La cache de tercer nivel se comporta, mediante los sistemas de predicción y acceso, como una cache de segundo nivel pero con una capacidad de 8MB por conjunto, 16MB en el caso del Ryzen 5 1600X.
El otro gran paso de estos procesadores lo encontramos en su proceso de fabricación y en su eficiencia energética. El modelo más elevado, el 1800X, tiene un TDP de 90w poco más que la gama media de Intel y con una potencia muy superior. De hecho, el modelo 1700, que compite directamente con el Core i7-7700k en precio, consume tan solo 65w logrando más de un 40% más de rendimiento que la alternativa de Intel. El Ryzen 5 1600X es un modelo de consumo alto comparado con sus otros hermanos de la gama Ryzen 5 (normalmente 65w) pero también tiene un potencial mayor de frecuencias efectivas. Puede trabajar auitomáticamente hasta los 4.1GHz.
Están fabricados mediante un proceso FinFET de 14nm. Esta arquitectura permite escalarse desde las soluciones móviles más eficientes hasta modelos como estos procesadores que hoy os mostramos que compiten con lo mejor del mercado doméstico para ordenadores sobremesa.
Zen se forma alrededor de grupos de 4 núcleos con capacidad para 8 hilos de proceso. AMD puede apilar esta estructura para lograr soluciones de 8 núcleos, 16 hilos o también modelos intermedios de 6 núcleos y 12 hilos desactivando algunas de las unidades internas del procesador. Esto también permite a AMD aprovechar mejor las obleas aprovechando procesadores donde algunos núcleos no funciones correctamente desactivándolo y vendiéndolo como una gama inferior. Es una forma de economizar el proceso de fabricación.
En esta foto del "die" podemos ver perfectamente los cuatro núcleos por conjunto y la gran cantidad de espacio que ocupa el sistema de caché de este procesador (se ve claramente entre los cuatro núcleos).
Cada núcleo puede acceder a todas las capaz de memoria cache de la estructura del procesador con la misma latencia que tendría a la cache más cercana físicamente a dicho núcleo. De hecho, sus 8MB de cache de tercer nivel trabajan más al modo que haría una cache de segundo nivel en un diseño más tradicional.
AMD ha desarrollado un nuevo bus de datos para esta arquitectura que ha denominado “infinite fabric”. Es un bus escalable que permite a AMD desarrollar soluciones que van desde diseños de poca entidad hasta procesadores muy densos para aplicaciones de servidor. Esto incluye control de memoria del sistema, interfaces estándar como PCI Express, entrada y salida, etc.
Se complementa también con la tecnología SenseMI de AMD que es una matriz de sensores ultrasensibles que se combina con nuevos algoritmos predictivos que permite ajustar el funcionamiento de zonas clave del procesador e incluso predecir estados del mismo de forma dinámica. Esto ayuda a AMD a que su sistema Turbo de frecuencias, por ejemplo, sea más eficiente pudiendo ajustar la frecuencia de cada uno de los núcleos, voltajes y otros factores en base a datos como la temperatura medida, etc. Esto mismo se puede aplicar también a ajustes de frecuencia para reducir consumos o mantener al procesador en parámetros de diseño para soluciones muy concretas.
Precision Boost, el turbo de estos procesadores, es la tecnología de aumento de frecuencia de esta arquitectura. Permite cambios en pasos muy reducidos, de tan solo 25MHz. AMD ha diseñado esta tecnología para que se comporte como el ajuste de frecuencia que realizan sus GPUs. Esto permite mantener frecuencias elevadas ciñéndose a las especificaciones térmicas y de consumo del procesador.
Estas mejoras se traducen en que los modelos ‘X’ como el 1800X o el 1700X tengan a su disposición la tecnología XFR (Extended Frecuency Range) que permite, con la refrigeración adecuada, que el procesador se adapte a sus condiciones de refrigeración y sea capaz de aumentar la frecuencia de trabajo por encima de los límites del procesador. Cuanto mejor sea la refrigeración del procesador, más hará por nosotros de forma automática esta tecnología.
Neural Net Prediction es otra de las joyas del diseño de esta arquitectura. Zen es capaz de predecir los movimientos de las aplicaciones que ejecutamos en él. Lo logra mediante el aprendizaje en tiempo real de las pautas de ejecución de la aplicación anticipándose a sus movimientos. Esto mismo se traduce en un mejor “prefetch” de datos limitando los accesos y aprovechando mejor la masiva cantidad de cache que tiene el procesador.
Chipset X399
De momento no tiene pinta de que las placas para estos nuevos procesadores vayan a ser baratas, aunque habrá que esperar a que los fabricantes pasen estos primeros días de lanzamiento y encuentren el camino para presentar modelos menos “premium” como hacen ya con todas las gamas de procesadores tanto de AMD como de Intel. Las placas base más económicas que encontraremos con este chipset rondan los 370 Euros, un precio elevado, pero también en línea con las placas base Intel de la misma gama y con unas prestaciones de primer orden.
El X399 de AMD ofrece conectividad extra a un procesador en forma de 4 líneas PCI Express 3.0 extra que están directamente gestionadas por el chipset. También es el que ofrece soporte conectivo a todo el sistema de almacenamiento, comunicaciones de redes, etc. Los chipsets van eliminándose de las ecuaciones, pero en estas plataformas, con un alto nivel de complejidad conectiva, siguen siendo un puente de gestión importante entre el procesador y diferentes elementos del sistema.
Las placas X399 van a ser todas portentos con unas capacidades a la altura de los procesadores que albergarán. Diseñadas para la mejor máquina de juegos o para el profesional del diseño gráfico.
Lo que echaremos de menos en esta plataforma es el soporte RAID, con arranque, para unidades NVMe de tipo PCI Express. AMD ha prometido revisar el código para que esto sea posible en las próximas semanas y, claro está, sin cambios de hardware. No es algo que mejore de forma tan notable como antes el rendimiento, hablo de los tiempos de las unidades SATA, pero sin duda a muchos usuarios puede apetecerles aprovechar el extenso sistema de unidades M.2, hasta 3 con enlaces de 32Gbps, que soportan estos procesadores.
Overclocking
Los requisitos de disipación de estos procesadores, 180w TDP, no ayudan a lograr buenos niveles de overclocking con una refrigeración estándar. Seguro que habéis visto a este procesador trabajando 5.2GHz rompiendo récords, pero me temo que eso no se ha logrado con medios que vayamos a poder usar de forma continuada.
Procesador forzado a trabajar a su freuencia turbo más elevada y para todos los núcleos, no solo para cuatro. Combinado, además, con memorias de alta velocidad DDR4 3200 y latencias muy agresivas en una configuración de cuádruple canal.
Lo común es que no podamos subir de los 4.1GHz pero si que podemos, fácilmente, hacer que el procesador trabaje cercano a los 4GHz de forma constante y en todos sus núcleos, no como en la configuración de Turbo de AMD que esta frecuencia está reservada a cuatro núcleos y siempre y cuando la capacidad del sistema de disipación lo permita.
Si deshabilitamos núcleos podemos alcanzar frecuencias en torno a los 100-150MHz más nuestro mejor resultado, pero dejarnos esta cantidad de núcleos por el camino, por 100MHz más de overclocking no tiene sentido. Este es un procesador que a su frecuencia de trabajo “estándar” consigue resultados espectaculares.
Memoria local vs. distribuida
Ya hemos explicado que estos procesadores usan una estructura de dos bloques para poder lograr un sistema de bus de memoria de cuatro núcleos. Este sistema de memoria, que soporta memorias de bajas latencias y altas frecuencias en modos agresivos como el Command Rate a 1t, permite también dos modos diferentes de trabajar.
El modo distribuido (UMA) donde las transacciones se distribuyen uniformemente por toda la memoria del sistema y que es muy útil para aplicaciones donde se haga un acceso amplio al sistema de memoria del sistema.
Luego podemos activar también el modo Local (NUMA) a través de la aplicación Ryzen Master, que también es compatible con esta plataforma y ofrece prestaciones específicas para ella. El modo local logra mejores rendimientos sobre todo en aplicaciones que aprovechan un acceso más rápido a la memoria. Las transacciones se quedan localizadas en cada encapsulado donde se originan.
Disipando a este enorme procesador
Una de las cosas más curiosas que te puede pasar con este procesador es que el bloque de disipación no sea capaz de cubrir todo el procesador, esto se ira limando cuando los fabricantes saquen unidades específicas para estos modelos de AMD pero que no lo cubra completamente no significa que no estemos disipando bien nuestro procesador.
AMD ha hecho un buen trabajo con los materiales de intercambio, usando soldadura entre el expansor de calor y los encapsulados, lo que significa que disipando la parte central del procesador estaremos haciendo el trabajo adecuado para mantenerlo completamente refrigerado y trabajando sin el más mínimo problema.
Algunos fabricantes, como Enermax, ya han anunciado kits especialmente diseñados para este socket con un intercambiador más ancho que pueda cubrir los 75mm de largo por 58mm de ancho que tiene este procesador. Es el procesador más grande que recuerdo haber tenido en las manos y sin duda también el más potente.
Rendimiento sin precedentes
Lo que vais a ver aquí es como el AMD Threadripper 1950X vapulea a cualquier otro que haya pasado antes por nuestro laboratorio. No hace rehenes y no tiene ninguna piedad, pero seguramente su reinado sea algo más corto de lo esperado puesto que Intel no parece dispuesta a que este procesador le haga sombra durante mucho tiempo. Las variantes de 14-16-18 núcleos de Intel, con arquitectura Skylake-X serán algo más rápidos, pero también notablemente más caros.
Handbrake 1.0. En segundos, menos es mejor.
Cinebench R15 1-Core
Cinebench R15 SMP
Vídeo de Cibebench R15
Sisoft Sandra 2016 CPU Aritmética
Sisoft Sandra 2016 CPU Multimedia
Sisoft Sandra 2016 MEM Bandwidth
Geekbench 4 1-CPU Single
Geekbench 4 x-CPU SMP
Consumo CPU en carga
Rendimiento en juegos con Geforce GTX 1080Ti
Destruyendo la barrera entre doméstico y profesional
Con esta nueva serie de procesadores AMD devuelve a los usuarios el poder de decisión sobre que quieren hacer con su ordenador personal. Esta nueva generación de procesadores con una gran cantidad de núcleos también consigue abrir brecha, de nuevo, entre el rendimiento de los portátiles más poderosos y los ordenadores personales de gama media y alta. Una brecha que Intel ha ido acortando degradando a un formato que volverá a coger impulso.
Con uno de estos procesadores no tendremos limitaciones técnicas para usar el ordenador como queramos y podremos acceder a estas tareas que ahora quedan limitadas a estaciones de trabajo muy caras. La multitarea cobra una nueva dimensión y tendremos que estar preparados para los problemas que puedan venir de ciertas aplicaciones que no se diseñaron para este nivel de paralelismo de procesos.
Por suerte los sistemas operativos modernos están bastante bien preparados, especialmente Windows 10 Pro, para este tipo de procesadores con una gran cantidad de núcleos y podemos de forma independiente establecer afinidades para un balanceo de carga "manual" entre aplicaciones de gran consumo.
Un PC formado alrededor de esta plataforma no tendrá límites de tipo de uso. Podremos usar los juegos más exigentes, realizar streaming de alta definición, comprimir video ultra-hd a velocidades antes desconocidas y a los desarrolladores nos ofrecerá muchas más posibilidades a un precio mucho más cercano de lo habitual.
Alienware ya esta comercializando máquinas de alto rendimiento basadas en este nuevo procesador de AMD
Tampoco son procesadores baratos, claro que no, pero AMD sabe que con estos nuevos procesadores tiene un punto de partida muy competitivo y el que antes podía comprarse un procesador de 8 núcleos por 1000 Euros, ahora podrá optar a uno de 16 con una mejora del rendimiento, en algunas aplicaciones, cercana al 45%. Todo esto conseguido en menos de 6 meses donde se ha renovado una competencia largamente olvidada.
Acceder a un PC como el que hemos usado nosotros, con algunos de los mejores componentes del mercado, no saldrá barato, en torno a los 2500 Euros, pero son casi 1000 Euros menos que lo que te hubiera costado hace seis meses y no echaras de menos ninguna funcionalidad porque AMD no solo tiene un gran procesador sino un ecosistema donde podemos usar los mejores avances tecnológicos del momento.