Intel Lunar Lake: Arquitectura del sucesor del actual Meteor Lake
Intel llega con un buen puñado de novedades a este Computex 2024, hoy mismo damos cuenta de los nuevos Xeon de sexta generacioón o los nuevos aceleradores de IA Gaudi 3, pero una de las más esperadas es su nueva generación de procesadores basados en baldosas o “tiles” con importantes novedades en todos los aspectos del SOC.
Novedades como nuevos gráficos más eficientes, nuevas unidades NPU de proceso para IA, más seguridad integrada en el hardware, más rendimiento por cada núcleo P-Core y también nuevas unidades E-Core más rápidas y eficientes. Pero de todas estas novedades para mí la más importante es que ahora el procesador cuenta con la memoria integrada en el Die, nada menos que 32GB de RAM LPDDR5x de alto rendimiento.
Esta nueva arquitectura dará vida a próximos ordenadores portátiles de ultra alta eficiencia que combinaran ahorros de energía hasta ahora desconocidos en el mundo x86 con nuevas capacidades gráficas y mejoras en todos los aspectos del SOC.
Los Intel Lunar Lake, al menos en esta variante que hoy conocemos, no vienen a sustituir toda la gama de procesadores Meteor Lake que vemos actualmente en ordenadores portátiles y de pequeño formato. Están destinados a una nueva generación de portátiles ultra eficientes que tendrán que competir con una competencia renovada.
Intel no tiene ahora solo que competir con unos procesadores de AMD realmente escalables en cuanto a consumo-rendimiento se refiere sino también a nuevas generaciones de procesadores ARM basados en los nuevos Snapdragon X tanto en sus variantes Plus como Elite.
Esta competencia renovada, de la que todos los usuarios deberíamos alegrarnos ampliamente ha hecho que Intel desarrolle su procesador más eficiente hasta la fecha sobre los cimientos del Meteor lake configurando la segunda generación de procesadores Intel basados en una arquitectura modular en base “tiles” o baldosas.
En esta baldosa encontramos algunos de los elementos más elaborados y también principales del procesador, aunque ya esta palabra se queda corta para todo lo que proporciona Intel dentro del mismo “die” o encapsulado. En esta zona del procesador encontramos tanto los nuevos núcleos P-Core como los nuevos E-Core, tanto más rápidos como eficientes, así como la nueva unidad GPU, la nueva unidad NPU para IA y la nueva unidad IPU para proceso de imagen.
Si bien Intel nos va a vender este procesador como una verdadera revolución del IA en el entorno del PC lo cierto es que para nosotros en Geeknetic, más allá de los eslóganes oportunos en los tiempos que corren, lo cierto es que esta generación es mucho más que más capacidad de computación local para IA. Las mejoras vienen en casi todos los elementos del procesador, incluidos los que siguen siendo los elementos principales, como son sus núcleos P-Core y E-Core. Ambos dentro del “tile” de computación.
Los nuevos P-Core, o núcleos de rendimiento, nombre en código Lion Cove recibe una completa remodelación de arquitectura que se traduce en varios elementos importantes. El más llamativo, sin duda, es el 14% de mejora de rendimiento por ciclo de reloj (IPC) pero también añade un nuevo nivel de cache, nivel L0, con hasta 48KB por núcleo, con más capacidad también para la L2, con hasta 3MB por núcleo. Se acompañan también de una cache L3 compartida por todos los núcleos de hasta 12MB.
La otra mejora sustancial que busca Intel en los nuevos Lion Cove es la eficiencia de la gestión de todos los núcleos, apoyados por un nuevo Thread director que ahora es capaz de gestionar mejor la necesidad del Hyperthreading de los núcleos P optar por los núcleos que no cuentan con esta tecnología cuando así considera el procesador que es más adecuado. De hecho, ahora esta gestión es dinámica, mediante IA, no mediante tablas de funcionamiento predeterminadas basadas fundamentalmente en datos de temperatura.
Los P-Core sin HT son hasta un 15% más rápidos al mismo nivel de consumo que los Meteor Lake, con un 10% más de rendimiento por superficie y hasta un 30% combinando rendimiento, consumo y superficie. Los núcleos P-Core que si cuentan con Hyperthreading son un 5% más rápidos al mismo nivel de consumo, un 15 menos rápidos teniendo en cuenta la superficie y hasta un 15% más rápidos si tenemos en cuenta rendimiento, consumo y superficie.
Otra novedad de estos núcleos es que aumenta de forma dramática la granularidad de ajuste de frecuencia del procesador. Hasta ahora los saltos venían dados por multiplicador interno, normalmente basados en una frecuencia base de 100MHz por multiplicador. Esto son saltos de 100MHz, ahora los P-Core basados en Lion Cove permiten ajustes mucho más detallados, de tan solo 16.67MHz.
Todo esto se traduce en una curva de rendimiento consumo mucho más elevada que en la generación anterior, en bajos consumos la mejora es de hasta el 18% siendo superior al 10% en consumos máximos con la generación anterior como referencia.
Otro de los elementos con importantes mejoras generacionales es la isla de computación de bajo consumo donde se encuentran los conocidos como E-Core. La nueva arquitectura Skymont introduce importantes mejoras, aunque algunas cosas se quedan como están, al menos para esta generación de procesadores orientados a sistemas de bajo perfil y consumo.
La isla de computación de bajo consumo seguirá manteniendo una estructura de cuatro núcleos alrededor de una cache L2 compartida que ahora aumenta desde los 3 hasta los 4MB de capacidad. Esta cache además recibe un bus de 128B por ciclo lo que hace que doble su rendimiento sobre la generación anterior. La cache L1 también permite transferencia L1 a L1 haciéndola también más predecible.
Introducen importantes mejoras de rendimiento sobre la generación anterior. En concreto un 38% más rápido en operaciones Integer y hasta un 68% más rápido en operaciones de coma flotante. En un solo hilo de proceso estas unidades permiten hasta un tercio del consumo al mismo rendimiento que la generación anterior, y hasta dos veces el rendimiento, con algo más de consumo y con un punto de convergencia de hasta 1.7 veces más rendimiento al mismo consumo que la generación.
En múltiples hilos de proceso simultaneo podemos obtener más rendimiento con un tercio de consumo, hasta 2.9 veces el rendimiento al mismo consumo del E-Core del Meteor Lake y hasta 4 veces el rendimiento consumiendo algo más de energía. Este nivel de rendimiento adicional en los E-Core ha hecho que Intel descarte los LP-Core de esta generación potenciando los P-Core de máximo rendimiento y dejando las tareas más “mundanas” a los renovados E-Core basados en Skymont.
Uno de los elementos que más ha crecido en las últimas generaciones de procesadores Intel es la gráfica integrada. La nueva generación Xe2 promete importantes mejoras de rendimiento grafico tradicional pero también de otros procesos adicionales como su capacidad de proceso como NPU de alto rendimiento.
Esta generación cuenta con 8 unidades de renderización, con 64 unidades de vectorización a razón de 8 unidades por cada unidad de renderización. Cuenta con 8 unidades de Raytracing completamente dedicadas que en esta generación son además más grandes y eficientes. Comparten hasta 8MB de cache de nivel L2 y dispone de una nueva matriz de memoria que ahora comunica directamente con la memoria embebida en el procesador.
Con este rediseño Intel promete hasta 1.5 veces más rendimiento que la generación anterior, de Meteor Lake de bajo consumo, e incluso mejoras sustanciales sobre la generación Meteor Lake H que como sabéis son modelos de más consumo y configuraciones de frecuencia más agresivas.
Estas mejoras se combinan también con nuevas extensiones XMX o Xe Matrix Extensions y nuevos niveles de rendimiento en operaciones IA con hasta 67 TOPS de potencia de proceso.
Intel ha querido renovar este Tile también con nuevos motores de pantalla y también una nueva unidad de proceso de imagen. Estos procesadores tienen ahora capacidad para tres pantallas simultaneas, que no es ninguna novedad, pero si lo es que soporte Displayport 2.1 y también HDMI 2.1 con VRR.
El resumen es que es capaz de dar vida a pantallas de hasta 8K@60Hz con HDR, o tres pantallas 4k@60Hz con HDR o pantallas de muy alta frecuencia de hasta 1440p360Hz. Se incluye también soporte para eDP 1.5, que se traduce en prestaciones similares las nombradas, pero con interfaz para pantallas integradas.
Mediante este interfaz el procesado es capaz de reducir y optimizar consumos dependiendo del contenido mostrado y la frecuencia de actualización necesaria. La pantalla es el elemento que más consume en un portátil moderno y esto es un paso adelante en la optimización de las prestaciones de las pantallas, incluidas de las de alta frecuencia de actualización, que consumen más.
Intel también incluye una nueva IPU (Image Processing Unit) que cuenta con 8MB de cache dedicadas para evitar el acceso a la RAM principal del sistema. Solamente esta mejora parece introducir hasta 3W de ahorro de consumo en reproducción de video 1080p, dejando el consumo global del procesador en poco más de 6W.
La nueva unidad soporta los estándares más extendidos, en codificación y decodificación de video de ultra alta definición. Soporta AVC, VP9, H.265 HEVC y AV1 en resoluciones de hasta 8k@60Hz con HDR. Esta generación además introduce un nuevo códec, aunque de momento solo con capacidad de decodificación, el VVC (Versatile Video Coding), también conocido como H.266.
Este nuevo estándar, que competirá con AV1, parece ofrecer hasta un 50% de reducción de bitrate a misma resolución, con respecto a H.265, mientras que AV1 hace lo mismo con un 30% de mejora. Adicionalmente la calidad del video también parece mejorar, 27% a favor de VVC frente a la mejora del 2% de AV1, ambos comparados con H.265 HEVC.
Esta nueva generación de gráficos Arc de Intel se apoya también en los últimos estándares de la industria con soporte completo para las más extendidas y además cuenta con 2 años de desarrollo de software de drivers por parte de Intel que ha introducido mejoras sustanciales en tecnologías como el escalado de resolución por IA que Intel denomina XeSS, su versión del DLSS de NVIDIA o el FSR de AMD.
La nueva NPU, de cuarta generación, es sensiblemente más grande, en la búsqueda de mucho más rendimiento, hasta tres veces más que la generación anterior. Está formada por 6 unidades de computación neural apoyadas en el doble de ancho de banda. Logra un pico de rendimiento de un máximo de 48 TOPS.
Los resultados, una vez más centrados en la eficiencia energética, es que la nueva unidad produce el doble de rendimiento al mismo consumo que la NPU 3 de Meteor Lake y logra, con más consumo, hasta cuatro veces más de rendimiento cuando sea necesario o deseable.
De forma combinada, aunque aquí tengo dudas serias de que fuera aprovechable en su totalidad sin un trabajo muy específico de la asignación de cargas, este nuevo procesador tiene una capacidad de proceso de IA de un total de 120 TOPS, 5 en la propia CPU, 48 en la NPU y hasta 67 TOPs proporcionados por la potente grafica basada en la arquitectura Xe2.
En esta baldosa Intel añade nuevas prestaciones de seguridad y conectividad. Por un lado, se introduce el Intel Partner Security Engine que se combina con las tecnologías ya existentes en la generación Meteor Lake, como las unidades SSE (Intel® Silicon Security Engine), GSC (Intel® Graphics Security Controller), CSME (Converged Security & Manageability Engine) para ofrecer nuevos niveles de seguridad por hardware.
Esta unidad cuenta con elementos propios como el bloqueo de descarga del subsistema de encriptación o la zona aislada de bloque y controlador fusible o las actualizaciones de firmware mediante encapsulado y ejecución en tiempo real. Todo esto permiten funcionalidades como acceso protegido a la memoria, sin posibilidad de acceder a otras zonas no protegidas, así como tampoco a elementos de comunicación.
Cuenta incluso con una secuencia de arranque protegida del resto del arranque del SOC que la aísla completamente del resto de subsistemas. Todo esto permite nuevos niveles de protección incluso en virtualización, donde la capa de abstracción de hardware ahora se controla de principio a fin evitando ataques de “alias” y también de “reorientación” de zonas de memoria.
Intel también trabaja con diferentes partners de software para introducir nuevos sistemas de protección, basados en cálculos de IA en el propio hardware, sin soporte en la nube para protección mejorada en ataques de “ransomware” o de “crypto-jacking”
Esta baldosa también se encarga de la conectividad del procesador. Podemos detallar el número de líneas PCI Express disponibles, cuatro de tipo PCI Express 4.0 y otras cuatro de tipo PCI Express 5.0, además de otros elementos importantes como el soporte para hasta tres puertos Thunderbolt 4.0 (40Gbps), con acceso a la nueva tecnología Thunderbolt Share que Intel presento hace unos días. Con esto, además de soporte nativo para Ethernet Gigabit, podemos concluir las capacidades conectivas “físicas” del nuevo SOC.
A estas tecnologías “cableadas” se le añade soporte para Wifi-7, con velocidades de acceso de hasta 5.8Gbps. Es la primera plataforma de Intel con esta tecnología integrada. Con ella no solo desarrollamos velocidades de acceso más rápidas, sino que tiene importantes mejoras en las prestaciones de conectividad múltiple (Wifi Multilink) y en cómo, con la ayuda de los puntos de acceso compatibles, podemos mantener más dispositivos con anchos de banda muy superiores a las tecnologías anteriores y latencias inferiores.
Meteor Lake podía acceder a esta tecnología, pero a través de controladoras dedicadas, como la Intel BE200, ahora está completamente soportada dentro del “tile” PCD. Esta tecnología también se combina con Bluetooth 5.4 que mejora la transferencia de audio de alta definición con consumos muy reducidos de energía.
Hasta ahora hemos visto como Intel ha mejorado casi todos los aspectos de la arquitectura en esta segunda generación de procesadores basados en la tecnología Foveros y su estructuración a través de baldosas funcionales que van dando forma a todas las prestaciones del SOC.
Mejoras en los núcleos de proceso, GPU, NPU, seguridad, conectividad inalámbrica. Todos los elementos del procesador se han revisado. Todo esto está muy bien, pero va dentro de lo que esperamos de una evolución a un agregado funcional que al final da vida a un SOC que no deja de ser eso un sistema completamente funcional e integrado en un solo “chip”.
Lo que no es tan habitual, ni tan siquiera en otros modelos de SOC más establecidos, es que se incluya la RAM en el propio encapsulado y sinceramente para mi es una magnífica noticia porque no es una cantidad nada desdeñable, nada más y nada menos que 32GB LPDDR5x, que hará que los portátiles basados en este nuevo SOC por fin tengan una cantidad de RAM decente para los tiempos que corren.
La memoria integrada tiene un “Bit-Width” de 16-Bit lo que se traduce en un ancho de banda de 64-Bit por canal, el procesador tiene la memoria configurada en doble canal así que tenemos el clásico bus de procesador de portátil de 128-Bit. Es memoria de calidad, con 8.5 Gigatransfers por chip. Integrar la memoria en el procesador permite una reducción del tamaño de la placa base, de hasta 250mm2, con menos consumo de energía, hasta un 40% menos. Ideal para el objetivo de Intel de rebajar los consumos generales de los equipos con esta nueva arquitectura integrada.
Hemos hablado de los nuevos P-Core y E-Core, en esta nueva generación juntos se combinan para reducir el consumo, con el mismo rendimiento de la generación anterior, en casi un 40%. Esto se logra, en buena medida, por la increíble mejora de rendimiento de los E-Core que limita la necesidad de introducir los P-Core a los escenarios más exigentes.
En aplicaciones como Teams reduce el consumo un 35%, por tener un ejemplo de una aplicación de uso intensivo en entornos donde los próximos ordenadores portátiles basados en esta tecnología tendrán una importancia capital. Todo esto se traduce también en mejoras sustanciales en conjunto de aplicaciones también muy extendidas, como Office.
Esta nueva arquitectura cuenta también con un nuevo sistema de entrega de energía basada en un nuevo sistema PMIC múltiple, concretamente cuatro unidades que proporcionan más etapas y mejor telemetría del estado energético del SOC. Es sin duda parte fundamental, además del nuevo aprendizaje por IA para el “Thread Director”, de los nuevos niveles de eficiencia que presenta esta arquitectura.
El procesador amplía la conectividad soportando puertos Thunderbolt 4 de forma nativa, añadiendo Wifi7 y Bluetooth 5.4 y manteniendo bastante capacidad de ampliación mediante múltiples líneas PCI Express tanto 4.0 como 5.0. Añade un mínimo de 32GB de RAM a estos sistemas, reduciendo consumos y espacio necesario para integrar la RAM.
Su gráfica mejora hasta en 1.5 veces la de la anterior generación, que ya era un salto importante sobre los estancados gráficos integrados de Intel de las generaciones anteriores. No solo es más rápida, sino que con las nuevas unidades de conectividad grafica soporta más resolución y pantallas de altas velocidades de frecuencia vertical. Le dan forma 8 unidades de computación y 8 unidades de Raytracing más grandes y rápidas.
La integración de eDP 1.5 también permite ahorrar energía de la pantalla del portátil, sobre todo aquellos con pantallas de alta velocidad, ajustando la frecuencia al contenido mostrado. Se introduce también una nueva unidad de proceso de imagen, ahora compatible con VVC con decodificación por hardware para este nuevo códec más eficiente incluso que el AV1 del que además ofrecer soporte tanto de decodificación como codificación.
La nueva NPU 4 del Lunar lake es hasta 3 veces más rápida que la de la generación anterior, pasando de 16 a 48 TOPS, gracias sobre todo a la integración de 6 nuevas unidades de cálculo neural aplicando además nuevas técnicas como la activación nativa o el soporte para conversión. De forma combinada, entre CPU, GPU y NPU este nuevo procesador ofrece hasta 120 TOPS (trillones de operaciones por segundo) de potencia de proceso para LLM.
Novedades impresionantes que ya tienen 80 diseños pendientes de presentarse al mercado, que llegaran seguramente antes de que acabe el año al mercado, de los principales integradores del mundo incluidas todas esas marcas que tenéis en mente como ASUS, MSI, Dell, HP, etc.