Intel Xeon de 5ª Generación: Todos los detalles de su Arquitectura Orientada a Inteligencia Artificial
por Antonio Delgado Actualizado: 14/12/2023La Quinta Generación de Procesadores Intel Xeon Emerald Rapids
Hoy es el día en el que Intel ha lanzado oficialmente su Quinta Generación de Procesadores Xeon Scalable, con nombre en clave "Emerald Rapids". Estas CPU están orientadas a servidores y sistemas de cómputo de alto rendimiento con una clara optimización hacia los sistemas de Inteligencia Artificial.
Con variantes que alcanzan los 64 núcleos, junto a una nueva arquitectura, Intel ofrecerá más de 30 modelos de procesadores Xeon Scalable de Quinta generación para cubrir todos los ámbitos posibles, incluyendo sistemas de dos sockets, modelos orientados a refrigeración líquida de uso general, redes y 5G, centros de datos para almacenamiento en la nube, IoT y modelos de uso general de un único socket.
Esta nueva generación se ha optimizado para ofrecer una mayor eficiencia energética y más rendimiento para cargas de trabajo específicas, sin olvidar una arquitectura especialmente diseñada para Inteligencia Artificial.
A lo largo de este artículo desgranaremos todos los detalles sobre la arquitectura, prestaciones y novedades que introducen los chips Emerald Rapids y el rendimiento que son capaces de ofrecer en comparación con la competencia y con generaciones anteriores.
Modelos y Especificaciones Técnicas de los Intel Xeon Scalable de Quinta Generación
Antes de nada, vamos a comenzar dando un repaso a todos los modelos que Intel ha anunciado de la familia Emeralds Rapids. Tenemos 8 familias diferenciadas según su orientación, siendo la familia más numerosa la de los procesadores Intel Xeon Scalable de quinta generación para sistemas de 2 sockets de propósito general.
Intel Xeon Scalable 5ª Gen - Propósito General de hasta 2 Sockets de Alto Rendimiento
Aquí tenemos modelos como el Intel Xeon 8592+ que se coloca en la cima del rendimiento con 64 núcleos a 1,9 GHz de frecuencia base, con turbo de todos los núcleos a 2,9 GHz y un máximo de 3,9 GHz. Le acompañan unos inmensos 320 MB de caché, soporte para DDR5-5600 y un TDP de 350W. Su precio recomendado es de 11.600 dólares nada más y nada menos.
El modelo más económico será el Xeon 5515+ con tan solo 8 núcleos, con velocidad base de 3,2 GHz, boost de los 8 núcleos a 3,6 GHz y Boost máximo de un núcleo de 4,1 GHz. Este modelo parte de un TDP de 165W, incluye 22,5 MB de caché y soporta memorias DDR5-4800.
En el medio nos quedan 9 modelos de procesadores que van desde esos mismos 8 núcleos hasta los 60 núcleos, pasando por modelos de 56, 48, 32, 24 y 16 núcleos con distintos soportes de memorias DDR5 (5600, 5200 y 4800), y TDPs que van desde los 195 W y los 350 W.
Intel Xeon Scalable 5ª Gen - Propósito General con Refrigeración Líquida
Los modelos Intel Xeon 8593Q y Xeon 6558Q son variantes optimizadas para refrigeración líquida. El primero de ellos es el procesador más caro de toda la quinta generación con un precio recomendado de 12.400 Dólares. Ofrece 64 núcleos a 2,2 GHz de velocidad base, 300 MHz más que el 8592+, junto a una velocidad Boost Multicore de 3 GHz y un Boost Máximo de 3,9 GHz. Tiene un TDP mayor de 385 W y mantiene los 320 MB de caché.
Por otra parte, el Xeon 6558W ofrece la mitad de los núcleos (32) a 3,2 Ghz de base, 4,1 GHz de Boost Multicore y el mismo Boost para un núcleo. Su caché es de 60 MB y su TDP de 350 W.
Intel Xeon Scalable 5ª Gen - Propósito General de hasta 2 Sockets
En esta familia nos encontramos con modelos más económicos que van desde el Xeon 4509Y de 8 núcleos a 2,6 GHz de base, 3,6 GHz de Boost multicore y 4,1 GHz de boost máximo con 125W de TDP, DDR-4400 y 22,5 MB de caché por 563 dólares; hasta el Xeon 8558 de 48 núcleos a 2,1 GHz de base, 3,0 GHz de Boost Multicore y 4,0 GHz de Boost máximo con 260 MB de caché, 330 W de TDP y soporte para DDR5-5200 por un precio de 4.650 dólares.
En la zona intermedia quedan procesadores de entre 12 y 32 núcleos, todos ellos compatibles con sistemas de doble socket.
Intel Xeon Scalable 5ª Gen - Propósito General de 1 Socket
Hay también tres procesadores Intel Xeon Emerald Rapids con soporte para un solo socket, los Xeon 8558U, 5512U y 3508U.
El Xeon 3508U es el procesador más barato de esta nueva generación, con un precio de 415 dólares por el que recibiremos un modelo de 8 núcleos a 2,1 GHz de base y apenas un aumento de 100 MHz en Boost general y máximo. Su TDP se queda en 125 W con 22,5 MB de caché y soporte DDR5-4400.
El Xeon 8558U es el más potente de esta familia de 1 socket, con 48 núcleos a 2,0 GHz, 2,9 GHz de boost multinúcleo y 4 GHz de Boost Máximo. Tiene un TPD de 300 W y una caché de 260 MB con soporte para DDR5-4800. Su precio es de 3.720 Dólares.
En el medio queda el Xeon 5512U con 28 núcleos, 2,1 GHz/3,0 GHz/3,7 GHz de base/boost multicore/boost max, con DDR-4800, 185 W de TDP y 52,5 MB de caché por un precio de 1.230 dólares.
Intel Xeon Scalable 5ª Gen - Optimizados para Redes y 5G
Dentro de los modelos específicos para tareas más concretas nos podemos encontrar los Xeon 8571N, 6548N y 6538N para redes e infraestructuras 5F. Son modelos con 52 y 32 núcleos con TDPs que van desde los 205 hasta los 300 W y precios entre los 3.351 y 6.839 dólares.
Intel Xeon Scalable 5ª Gen - Optimizados para Cloud
Para Cloud tenemos los modelos Intel Xeon 8592V, 8558P y 8581V con 48 y 60 nícleos y TDPs de 270 a 350w.
Intel Xeon Scalable 5ª Gen - Optimizados para Almacenamiento e IoT
Finalmente el Intel Xeon 6554S de 36 núcleos está optimizado para entornos de almacenamiento e infraestructura "hiperconvergentes" con 36 núcleos y 270 W de TDP; mientras que el Xeon 4510T con sus 12 núcleos y tan solo 115W se orienta hacia entornos IoT.
Arquitectura Emeralds Rapids: Pasar de Cuatro Bloques a un diseño de Dos bloques
Si bien la Quinta Generación de procesadores Intel Xeon es una evolución de la Cuarta Generación y no hay cambios drásticos, lo que permite mantener parte del soporte de software y hardware, Intel ha conseguido aumentar considerablemente algunas de las prestaciones clave de su línea Xeon Scalable.
Pasamos de un máximo de 60 núcleos a 64 núcleos, con un aumento de la velocidad de la memoria hasta los 5.600https://www.geeknetic.es/Noticia/15943/Intel-detalla-su-interconexion-CXL-como-alternativa-ante-el-NVLink-o-el-InfinityFabric.html MHz, además de aumentar en hasta 3 veces la caché L3 de los procesadores, alcanzando 320 MB en los modelos más capaces.
Esto supone que, manteniendo la misma plataforma y solamente pasando de un Xeon de 4ª gen a los nuevos 5ª Gen, podemos conseguir un aumento del rendimiento de hasta 1,21 veces en rendimiento medio, 1,42 veces en tareas de inferencia, con 1,4 veces de potencia extra en tareas de cómputo y 1,7 veces más ancho de banda para almacenamiento y red.
Si consideramos un cambio de plataforma, pasando de la tercera generación a la quinta, los aumentos son considerablemente superiores, con hasta más del doble de rendimiento en HPC, y con un impresionante aumento de rendimiento en inferencia de IA 14 veces superior.
Para conseguir estas mejoras, sobre todo las conseguidas desde la pasada generación con la que se comparte plataforma, Intel ha rediseñado los módulos internos que forman cada chip, pasando de cuatro bloques o "baldosas" (tiles) a únicamente dos bloques en los modelos más potentes.
Al reducir a dos bloques el diseño interior, se reduce la latencia en la intercomunicación entre ellos, mejorando el rendimiento general del procesador sin prescindir de núcleos, de hecho, ahora tenemos hasta 64 núcleos distribuidos en dos bloques, cuando antes el máximo eran 60.
Si sus predecesores estaban disponibles en empaquetados de cuatro bloques y hasta 60 núcleos y de un único bloque monolítico MCC de hasta 32 bloques, ahora tenemos tres opciones: las más potentes con dos bloques en doble clúster y hasta 64 núcleos, otras monolíticas MCC de hasta 32 núcleos y una tercera opción EE LCC también monolítica para los modelos de hasta 20 núcleos.
Se han mejorado también la interconexión mediante Compute Express Link 1.1, con soporte para memoria de dos niveles, con DDR5 nativa en el nivel 1 y memoria CXL en el nivel dos (Con soportepara hasta cuatro canales de memoria CXL).
En caso de utilizar únicamente un nivel, tenemos 12 canales de memoria DDR5+CXL internivelados para poder aumentar la capacidad o el ancho de banda.
Todas las optimizaciones y mejoras de este diseño respecto de la pasada generación se han realizado teniendo como objetivo prioritario su desempeño en entornos de Inteligencia Artificial, tanto para modelos generales como para modelos LLMs.
Además del mayor número de núcleos y cachjé L3, los 5.600 MT/s de memoria y la expansión mediante memoria CXL, también tenemos el Intel AMX (Advanced Matrix Extensions), y las optimizaciones de software y contenedores docker para PyTorch y TensorFlow optimizados.
Las frecuencias Turbo de los procesadores se han optimizado no sólo para el rendimiento general, sino que se ha tenido en cuenta qué instrucciones relacionadas para IA y HPC se beneficiarían más de unas frecuencias turbo superiores para conseguir mayor rendimiento.
También se promete hasta una mejora de 10 veces el rendimiento por vatio en los distintos aceleradores que se integran respecto de la pasada generación, y mejoras representativas en distintas cargas de trabajo.
Las Optimizaciones de Software consiguen aumentar el rendimiento en hasta 5 veces
Tras el lanzamiento de la cuarta generación de procesadores Intel Xeon y la popularización de la Inteligencia Artificial, Intel ha estado trabajando en optimizar el software para estos procesadores. Con la quinta generación Emerald Rapids, todas estas mejoras se heredan directamente al tener una arquitectura muy similar.
Las diferentes plataformas de software IA de Intel cubren todo el proceso relacionado con este tipo de tecnología, desde la adquisición y preprocesado de los datos, hasta el entrenamiento de los modelos y su aplicación mediante inferencia, aprovechando tanto los proceadores como las GPUs de la compañía.
De hecho, la mejora de rendimiento que ha supuesto este trabajo en software alcanza hasta el 32% manteniendo la misma plataforma de cuarta generación, y sube aún más con esta quinta generación de procesadores Xeon.
Se ha trabajado en la optimización de LLMs, multiplicando por cinco el rendimiento en la cuarta generación. Mejoras que se aplican también a esta nueva línea de procesadores.
De hecho, ahora la quinta generación ha mejorado también las latencias para adecuarse a los requisitos de estos LLM orientados a chat bots, creación multimedia, generación de código fuente, etc.
Mejoras de rendimiento en cargas de trabajo específicas
Este tipo de procesadores está pensado para servidores y máquinas específicas donde se van a procesar cargas de trabajo amplias con distintos tipos de finalidades. Por ello, es importante el trabajo de optimización que se ha realizado para que el procesador se adapte a distintos tipos de procesado específico.
Desde aplicaciones webs y microservicios hasta procesamiento de lenguaje natural IA, pasando por multimedia, infraestructuras o servicios de datos. Intel promete hasta 1,5 veces más rendimiento en este tipo de aplicaciones concretas respecto de la pasada generación, con una mejora de 1,4x en rendimiento por vatio y hasta el doble de rendimiento comparado con los procesadores AMD EPYC de cuarta generación.
Más potencia en entornos de computación de alto rendimiento o en entornos científicos gracias a las optimizaciones.
Todo ello mejorando la eficiencia energética y reduciendo costes económicos y medioambientales tanto a la hora de su fabricación como de su funcionamiento.
¿Cómo se sitúan los Intel Xeon Emerald Rapids contra la competencia?
La quinta generación de procesadores Intel Xeon Emerald Rapids entra a competir directamente con los procesadores AMD EPYC de cuarta generación "Genoa", por lo que Intel ha mostrado algunos datos de rendimiento y especificaciones para compararlos según sus propias pruebas. Hay que tener en cuenta que los Genoa alcanzan hasta los 96 núcleos
A nivel de arquitectura, Intel ha querido destacar el mayor número de núcleos por bloque que tienen sus procesadores. Ya hemos visto que tenemos hasta 32 núcleos por "baldosa/bloque", con 320 MB de caché compartida, mientras que los AMD Genoa se dividen en bloques más pequeños, lo que limita el tamaño de las cpus virtuales para máquinas virtuales que se pueden obtener por cada procesador.
Es en la virtualización donde Intel quiere destacar el mayor rendimiento de su Xeon 8592+ con 64 núcleos respecto al AMD EPYC 9554 de 64 núcleos, aunque hay que tener en cuenta que estamos comparando el modelo más potente de Intel con uno inferior de AMD.
No hay duda de que el rendimiento por núcleo es mayor en estos Emerald Rapids que en los Genoa, al menosen la mayoría de cargas de trabajo que podemos ver en la siguiente comparativa
Intel también presume de un mayor rendimiento en tareas de inferencia en Inteligencia Artificial.
En resumen, Intel promete un mayor rendimiento en cargas de trabajo clave con sus Intel Xeon de Quinta Generación respecto de los AMD EPYC Genoa, al mismo tiempo que promete reducciones en coste y emisiones.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!