Intel Xeon 6 6780E Preview

No me voy a adentrar mucho en la arquitectura de estos nuevos procesadores porque es un ejercicio que ya hicimos en el momento de su lanzamiento. Hoy nos centraremos en el análisis de prestaciones de estos nuevos procesadores con la suerte que hemos tenido de disponer de un servidor, en el cloud, basado en dos “Intel® Xeon® 6780E Processor” con 144 núcleos por cabeza, en una impresionante configuración de 288 núcleos en el mismo servidor.

Si entraremos en detalle de las diferentes opciones comerciales de estos nuevos procesadores y para qué son cada una de las series más adecuadas, cuál es su entorno de trabajo más optimo. No todos los Xeon 6 están disponibles desde su lanzamiento.

Intel va a distribuir esta nueva generación de procesadores en dos series principales, dependiendo de cómo se han construido, básicamente en el número de baldosas que los componen. Los Xeon 6 6700 disponen de hasta dos baldosas, solo presentes en su versión con P-Core de hasta 86 núcleos, o una sola baldosa con hasta 48 P-Core o hasta 144 núcleos E-Core como los procesadores que hoy tenemos la oportunidad de probar.

Todos estos nuevos procesadores están basados en el proceso de fabricación Intel 3, con baldosas de comunicaciones construidas mediante un proceso Intel 7. Los nuevos procesadores no solo son mucho más rápidos, hasta 2.7 veces más rápidos por vatio, que anteriores generaciones, con una arquitectura completamente renovada y mejor orientada a aplicaciones concretas, sino que presenta también importantes mejoras tecnologías a nivel conectivo.

Soportan más líneas PCI Express 5.0 pero también CXL en su variante 2.0 con hasta 88 líneas disponibles en estos procesadores. Algunos de ellos son también tremendamente escalables con configuraciones de hasta 8 sockets por placa base, en nuestro caso hemos podido probar un servidor con dos sockets, sumando hasta 288 núcleos E-Core y un consumo por CPU de hasta 330W.

Son procesadores muy orientados al servicio de aplicaciones cloud, bases de datos desestructuradas, proceso de redes de alto rendimiento y redes 5G, seguridad y analítica.

Actualmente solo podemos encontrar en el mercado los Intel Xeon 6 6700E, todos basados en configuraciones de un único Tile con un mínimo, eso sí, de 64 núcleos y 64 hilos de proceso. Las cifras van escalando con configuraciones de 96, 112, 128 y hasta 144 núcleos. Las configuraciones térmicas se mueven entre los 205 y los 330 vatios y todos ellos cuentan con frecuencias turbo, pero nunca sobrepasando los 3.3GHz.

Son en total siete referencias con características personalizadas que podéis ver en la siguiente tabla comparativa. Salvo uno de ellos todos soportan hasta dos procesadores por placa base y lo que también tienen en común es que todos soportan memoria DDR5 ECC 6400MT/s con un máximo de 1TB de capacidad configurados en 8 canales de memoria lo que hace un bus potencial de 512-Bit.

Otro elemento que comparten es la conectividad PCI Express o CXL. Son un total de 88 líneas PCI Express 5.0 o CXL 2.0. Una gran cantidad de enlaces que nos permite conectar a estos procesadores a interfaces de red de ultra alta velocidad o sistemas de almacenamiento avanzados.

Algunos de ellos, no todos, también cuentan con enlaces Intel UPI (Ultra Path InterConnect) con hasta cuatro de estos enlaces con velocidades que van desde los 16 hasta los 24GT/s en los modelos más avanzados. La conectividad, por tanto, es de última generación.

Los aceleradores dedicados introducidos en los Xeon 4 también tienen cabida en esta generación. Todos cuentan con ellos, algunos con cuatro y otros con dos, pero todos disponen de las siguientes tecnologías basadas en aceleradores por hardware: Intel® QuickAssist Technology (QAT), Intel® Dynamic Load Balancer (DLB), Intel® Data Streaming Accelerator (DSA) y Intel® In-memory Analytics Accelerator (IAA). También cuentan todos con AVX2, AES, Boot Guard, VT-d y VT-x para soporte de cualquiera, y los mejores, hipervisores del mercado para virtualización de máquinas.

Nuestro servidor de pruebas es un auténtico sueño, luego os daremos detalles de él, pero para que este sueño tenga lugar hace falta una plataforma completa que de soporte a estos nuevos procesadores. Estos procesadores usan el socket FCLGA4710 y por tanto siguen usando la misma plataforma que los Xeon de cuarta y quinta generación. Para estas placas base bastaría una actualización de bios para ganar soporte para los nuevos procesadores, aunque quizás perderíamos conectividad, dependiendo de lo que hasta ahora soporte la placa base del servidor.

El Intel C741 también conocido como Intel Ice Lake IEH es un chipset de escasa entidad, ahora todo lo importante está completamente soportado por el procesador. Entre lo poco que nos puede aportar podemos encontrar 20 líneas PCI Express 3.0, 20 puertos SATA 6Gbps y algunos puertos USB 2.0 y USB 3.0. También se encarga de la conectividad Ethernet de soporte, normalmente un puerto Gigabit.

Otro de los componentes importante de estos nuevos procesadores es la memoria, con soporte para memorias DDR5 de alta velocidad, 6400MTs en estos modelos basados en núcleos eficientes. Memoria ECC que podemos configurar en 16 módulos con una cantidad máxima de 128GB por slot, lo que nos permitiría tener una capacidad máxima de RAM en sistema de hasta 2TB, 1TB de RAM por procesador. La memoria se configura óctuple canal de 64-Bit, 512-Bit por procesador.

Normalmente veremos a estos procesadores soportando interfaces de red de última generación, ethernet o fibra óptica, con hasta 200 Gigabit de ancho de banda. Su cometido, precisamente, es dar un gran soporte a este tipo de interfaces de alta velocidad, tanto para el entorno de red, como de almacenamiento masivo.

El servidor de pruebas que hemos tenido la oportunidad de probar durante un mes, alojado en el Intel Developer Cloud, está compuesto por una plataforma de pruebas Intel BeechnutCity que es una plataforma de desarrollo de servidores para esta nueva generación de procesadores.

Tiene capacidad para 16 bancos de memoria, por Socket, con capacidad para hasta 2TB de memoria RAM DDR-6400MT/s, un total de 1TB por cada procesador. En una placa base de doble socket FCLGA4710 compatible con varias generaciones Xeon incluida esta última.

Nuestro servidor viene equipado con dos procesadores Xeon 6780E con 106MB de cache por cabeza, un total de 288 núcleos eficientes con un consumo por procesador de 330W y modos turbo de hasta 3GHz, con una frecuencia base de 2.2GHz. Es el Xeon basado en eficientes más potente, por el momento. Cada procesador cuesta algo más de 10000 euros.

Lo más modesto de esta máquina es el almacenamiento, proporcionado por un Samsung PM9A3 de 4TB de capacidad. Es una unidad de almacenamiento PCI Express en formato U.2 con velocidades de lectura cercanas a los 7000MBps y una potencia de proceso en lectura de un millón de IOPs. Es una buena unidad, pero nada extraordinario teniendo en cuenta las capacidades conectivas de estos procesadores.

La conectividad de red de esta plataforma BeechnutCity es de primera categoría con un chipset Mellanox MT2892 (ahora NVIDIA ConnectX-6 Dx) de doble interfaz Ethernet 100GBps. Este chipset permite la configuración de un interfaz de 200GBps, sobre Ethernet, que sin duda impresiona, pero también se puede implementar en dos interfaces de 100GBps que debería, bien configurado, ofrecer el mismo rendimiento o balanceo de carga y tolerancia a fallo manteniendo una capacidad de transferencia realmente impresionante.

Un servidor sin duda impresionante al que hemos podido realizar diversos test de rendimiento, todos bajo un entorno Linux basado en CentOS Stream 9 administrado mediante una consola Jupyterlab.

Lo primero que quisimos probar es cómo se comportan estos procesadores, de hasta 330W de diseño térmico, en pruebas continuadas, a nivel de consumo de energía. Hemos podido comprobar, siempre a través de las utilidades de Intel para monitorización, que los consumos medios en pruebas de rendimiento están lejos de ese límite de consumo de energía de diseño térmico. En nuestras pruebas los consumos están más alrededor de los 160W que de los 330W de las especificaciones. Estos datos, con este gran numero de nucleos, nos presenta un consumo de menos de 1.5W por nucleo en carga, realmente impresionante. El AMD EPYC 9754 que añadimos a esta comparativa ronda mas los de 2W por nucleo, y ofrece rendimiento inferior en muchas de las pruebas, algo que seguramente AMD corrija con la neuva generacion de procesadores EPYC basados en Zen5.  

En el resto de las pruebas de rendimiento los resultados son simplemente espectaculares, sobre todo teniendo en cuenta el consumo del procesador, que es precisamente el objetivo de esta gama, producir niveles de eficiencia rendimiento-consumo de hasta 2.3 veces sobre la generación anterior y superior a los EPYC 8000 de AMD basados en núcleos Zen 4 y Zen4c.

Passmark Performance Test Linux

Linux Kernel Compilation 6.8. Segundos, menos es mejor. 

Node.js Compilation 21.7.2. Menos es mejor

LLVM Compilation 16.0. Menos es mejor

 

OpenSSL 3.3 SHA256. 

John The Ripper: WPA PSK 

PostgreSQL 16. 

RocksDB 9. 

CoreMark 1

QuantLib 1.32

Blender 4.1. Menos es mejor

OSPRay 3.1

uvg266 0.4.1

StockFish 16.1

Consumo medio (W). 

Intel en esta generación personaliza el uso de sus procesadores Xeon buscando la especialización de sus soluciones de procesadores para ofrecer el mejor resultado dependiendo del entorno de trabajo. Esto sin duda viene en buena medida de la nueva arquitectura basada en baldosas que permite una configuración mucho más especializada.

Este procesador que hemos probado no solo es tremendamente rápido, en los entornos de aplicación adecuados, sino que es tremendamente eficiente en la ejecución de las tareas para las que está destinado. Permite un ahorro de energía importante a la vez que ofrece impresionantes resultados de rendimiento en aplicaciones que permiten grandes niveles de ejecución en paralelo.

Sin duda nos deja con ganas de probar el desempeño de sus hermanos basados en núcleos de rendimiento, que empezaran a llegar al mercado después del verano. Mientras tanto estos procesadores, de hasta 144 núcleos, en un futuro de hasta 288 núcleos, han demostrado todo su potencial.