Intel Xeon 6 6980P Preview

Ya tuvimos oportunidad de analizar con detalle la arquitectura de los nuevos Xeon 6 de Intel, ahora con dos variantes fundamentales divididas entre procesadores de núcleos de eficiencia y de rendimiento. La Serie E se lanzó hace algunas semanas con procesadores de hasta 144 núcleos por procesador. El que probamos hoy es un procesador que se acerca a estas cifras, con 128 núcleos, pero con el doble de hilos y una arquitectura más potente con más aceleradores y capacidad de proceso por núcleo.

El Intel® Xeon® 6980P Processor que hoy analizamos dispone de esta configuración: 128 núcleos con 2 hilos por núcleo y, por tanto, 256 hilos de proceso. Una auténtica bestia que podemos encontrar en configuraciones de dos procesadores por placa base para un total de 512 hilos de proceso, 256 núcleos. Cada procesador soporta hasta 3 TB de capacidad de RAM en formato DIMM o RDIMM con velocidades de 6400 o 8800 MT/s respectivamente, montados en 12 canales.

Cada procesador dispone de todos los aceleradores de esta generación, a razón de: Intel® QuickAssist Technology (QAT) 4 dispositivos, Intel® Dynamic Load Balancer (DLB) 4 dispositivos, Intel® Data Streaming Accelerator (DSA) 4 dispositivos, Intel® In-memory Analytics Accelerator (IAA) 4 dispositivos.

Sobre estos procesadores y su arquitectura ya tuvimos tiempo de hacer un completo análisis con todos los detalles. También hemos podido probar una configuración con dos Intel® Xeon® 6780E Processor eficientes, formando un servidor con 288 núcleos de proceso.

La serie P se ha orientado más a aplicaciones de mayor exigencia, con consumos también superiores, hasta 500 W en el procesador que probamos hoy, en configuraciones, por ahora, de hasta 128 núcleos. Con construcciones en esta generación de hasta tres baldosas para las variantes P de hasta 128 núcleos y de hasta dos baldosas para los modelos eficientes que veremos con hasta 288 núcleos. Las frecuencias, en el modelo que nosotros analizamos, son moderadas, con modos turbo de hasta 3.9 GHz y de base de 2 GHz, y para sus 128 núcleos, un modo de 3.2 GHz estable en carga.

Todos estos nuevos procesadores están basados en el proceso de fabricación Intel 3, con baldosas de comunicaciones construidas mediante un proceso Intel 7. Los nuevos procesadores no solo son mucho más rápidos, hasta 2 veces más rápidos por vatio en computación general que anteriores generaciones, con una arquitectura completamente renovada y mejor orientada a aplicaciones concretas, sino que presentan también importantes mejoras tecnológicas a nivel conectivo.

Soportan más líneas PCI Express 5.0, pero también CXL en su variante 2.0, con hasta 96 líneas disponibles en estos procesadores. Algunos de ellos son también tremendamente escalables, con configuraciones de hasta 8 sockets por placa base, no en los modelos más densos, como este Intel Xeon 6980P, que se limita a configuraciones de dos sockets por placa base.

El objetivo práctico de estos modelos, que ahora están más especializados que en generaciones anteriores, es modelado, simulación, Big Data, IA, virtualización, video, Edge Analytics, etc.

En esta nueva gama, que se esperaba precisamente para estas fechas, de procesadores Xeon de sexta generación en modalidad de rendimiento, Intel ha puesto en el mercado un total de 5 nuevos procesadores. Todos comparten su capacidad de montaje en un máximo de dos sockets por placa base, un máximo de 12 canales de memoria, soporte para memoria DDR5 6400 o memoria MRDIMM de 8000 MT/s. También disponen todos de los cuatro aceleradores por categoría, 1024 claves Intel TDX por procesador, 2 unidades AVX-512, 6 conectores UPI y hasta 96 líneas PCI Express 5.0/CXL 2.0.

Nombre

Fecha lanzamiento

Núcleos 

Turbo

Base

Cache

TDP

Intel® Xeon® 6952P Processor

Q3'24 96 3.9 GHz 2.1 GHz 480 MB 400 W

Intel® Xeon® 6960P Processor

Q3'24 72 3.9 GHz 2.7 GHz 432 MB 500 W

Intel® Xeon® 6972P Processor

Q3'24 96 3.9 GHz 2.4 GHz 480 MB 500 W

Intel® Xeon® 6979P Processor

Q3'24 120 3.9 GHz 2.1 GHz 504 MB 500 W

Intel® Xeon® 6980P Processor

Q3'24 128 3.9 GHz 2 GHz 504 MB 500 W

Intel® Xeon® 6710E Processor

Q2'24 64 3.2 GHz 2.4 GHz 96 MB 205 W

Intel® Xeon® 6731E Processor

Q2'24 96 3.1 GHz 2.2 GHz 96 MB 250 W

Intel® Xeon® 6740E Processor

Q2'24 96 3.2 GHz 2.4 GHz 96 MB 250 W

Intel® Xeon® 6746E Processor

Q2'24 112 2.7 GHz 2 GHz 96 MB 250 W

Intel® Xeon® 6756E Processor

Q2'24 128 2.6 GHz 1.8 GHz 96 MB 225 W

Intel® Xeon® 6766E Processor

Q2'24 144 2.7 GHz 1.9 GHz 108 MB 250 W

Intel® Xeon® 6780E Processor

Q2'24 144 3 GHz 2.2 GHz 108 MB 330 W

Las diferencias las encontramos en el número de núcleos disponibles, consumo TDP y, cómo no, frecuencias máximas a las que puede acceder el procesador con todos sus núcleos en carga. En modo turbo, para algunos núcleos, la frecuencia máxima es siempre de 3.9 GHz. Los nuevos modelos van desde los 72 hasta los 128 núcleos, así que no son procesadores sencillos; esos quedan para las gamas 6700 que están por llegar.

El bus de datos alcanza los 768 GBps de ancho de banda, un 50% más que sus hermanos de la gama Xeon 6 6700, y también aumentan su conectividad con seis enlaces, un 50% más, de tipo **Intel UPI** (Ultra Path Interconnect), todos además con un enlace máximo de 24 GT/s. Todo esto los convierte en procesadores muy avanzados y mucho más rápidos por vatio, pero también con un potencial conectivo sobresaliente para sistemas de computación híbridos con, por ejemplo, aceleradores IA.

Esta generación de procesadores disfruta de una nueva plataforma denominada Venuecity. A diferencia de los modelos disponibles para los procesadores de la serie E, este modelo está pensado para dar cobertura a prestaciones adicionales como el soporte de doble socket con 12 canales de memoria repartidos en 24 módulos de memoria, 12 por socket.

El socket también es diferente, requiere un FCLGA7529 puesto que estos modelos son muy diferentes en sus capacidades conectivas y soporte de memoria. Más líneas PCI Express, más canales de memoria, más interfaces UPI, todo suma y requiere de más pines en el socket.

Estas placas base también tienen que tener fases y capas suficientes para estos niveles conectivos y para soportar hasta 500 W de consumo por procesador. Concretamente, un PCB de 20 capas, el doble de lo que encontramos en una placa base de sobremesa de alta gama para procesadores muy recientes.

Entre lo poco que nos puede aportar, podemos encontrar 20 líneas PCI Express 3.0, 20 puertos SATA 6 Gbps y algunos puertos USB 2.0 y USB 3.0. También se encarga de la conectividad Ethernet de soporte, normalmente un puerto Gigabit. El resto está proporcionado por los procesadores, que cuentan con una gran capacidad conectiva, como ya vimos antes.

Normalmente veremos a estos procesadores soportando interfaces de red de última generación, Ethernet o fibra óptica, con hasta 200 Gigabit de ancho de banda. Su cometido, precisamente, es dar un gran soporte a este tipo de interfaces de alta velocidad, tanto para el entorno de red como de almacenamiento masivo.

El servidor de pruebas que hemos disfrutado estos días está basado en una máquina de ensueño. A la plataforma Venuecity se le han instalado dos procesadores Intel Xeon 6980P con 128 núcleos por cabeza, 256 hilos por CPU, para un total de 512 hilos de proceso.

A esta configuración se le suma 1.5 TB de RAM, en 24 módulos DDR5 de 64 GB por unidad, aprovechando los 12 canales de memoria de ambos procesadores. Cada uno de estos procesadores cuesta la friolera de 25,000 dólares por cada 1,000 unidades.

Cada uno de estos procesadores consume en pico unos 500W, aunque en nuestras pruebas el comportamiento general es algo más eficiente. La plataforma viene equipada también con un sistema de almacenamiento sencillo, basado en un disco M.2 de prestaciones medias con interfaz PCI Express 4.0 y 4 TB de capacidad. Velocidad de acceso, unos 7,000 MBps, nada especial la verdad, pero el objetivo es probar los procesadores.

La conectividad de red de esta plataforma BeechnutCity es de primera categoría, con un chipset Mellanox MT2892 (ahora NVIDIA ConnectX-6 Dx) de doble interfaz Ethernet 100 Gbps. Este chipset permite la configuración de una interfaz de 200 Gbps sobre Ethernet, que sin duda impresiona, pero también se puede implementar en dos interfaces de 100 Gbps que deberían, bien configuradas, ofrecer el mismo rendimiento, o bien balanceo de carga y tolerancia a fallos, manteniendo una capacidad de transferencia realmente impresionante.

En nuestras pruebas hemos añadido su competencia directa, también los últimos procesadores Xeon 6 de núcleos eficientes que también tuvimos oportunidad de probar. En general, consume menos que esos 500 W, según nuestras pruebas de eficiencia, produciendo además un excelente rendimiento en todas las pruebas. Nuestra plataforma está basada en Linux, concretamente un Ubuntu 24.04 LTS.

Linux Kernel Compilation 6.8. Segundos, menos es mejor. 

Node.js Compilation 21.7.2. Menos es mejor

LLVM Compilation 16.0. Menos es mejor

OpenSSL 3.3 SHA256. 

John The Ripper: WPA PSK 

PostgreSQL 16. 

RocksDB 9. 

CoreMark 1

QuantLib 1.32

Blender 4.1. Menos es mejor

OSPRay 3.1

uvg266 0.4.1

StockFish 16.1

Consumo medio (W). 

Los avances de estos nuevos procesadores, aprovechando las nuevas arquitecturas de baldosas y los nuevos procesos de fabricación, consiguen que Intel desarrolle procesadores de alta eficiencia con una increíble relación de rendimiento por vatio, compitiendo de tú a tú con algunas de las mejores soluciones del mercado.

Este procesador que hemos probado es absolutamente masivo, con 256 hilos de proceso, frecuencias sostenidas elevadas y consumos algo más reducidos de lo esperado. Dobles unidades AVX-512 y aceleradores dedicados lo convierten en un procesador muy polivalente, adaptado a cualquier aplicación, aunque sin duda muy orientado a aplicaciones de gran necesidad de cálculo y en entornos donde la conectividad de almacenamiento y tarjetas aceleradoras es clave.