Intel Meteor Lake: Todos los Detalles de la Primera Arquitectura Híbrida 3D
por Antonio Delgado & Mikel Aguirre Actualizado: 20/09/2023 5La arquitectura Modular 3D llega a los procesadores con Meteor Lake
Con el lanzamiento de la duodécima generación de procesadores Intel Core, Intel introdujo por primera vez una arquitectura híbrida que combinaba núcleos de alta eficiencia (E-Cores) y núcleos orientados al rendimiento (P-Cores), teniendo así dos arquitecturas distintas dentro de un mismo procesador.
Ahora llega Meteor Lake, una arquitectura que ahonda aún más en el concepto de modularidad para conseguir la máxima eficiencia y rendimiento en portátiles, separando en distintos bloques o "tiles" (baldosas), encargados de distribuir las distintas funciones que tiene que realizar en procesador. Para conseguir esta combinación de bloques con distintos procesos de fabricación e interconexiones, entra en juego la tecnología Intel Foveros 3D, utilizada en el diseño y fabricación de los procesadores Meteor Lake para el "empaquetado" tridimensional de los distintos bloques.
Según Intel, Foveros y Meteor Lake suponen la evolución más grande en la arquitectura de procesadores en 40 años.
Tendremos un bloque de Cómputo donde irán los E-Cores y P-Cores de nueva generación fabricados en el proceso Intel 4. Otro bloque de la GPU Intel Arc integrada con funciones heredadas directamente de los modelos de sobremesa. Un tercer bloque para entrada y salida, con PCI Express 5.0, Thunderbolt 4, etc. Finalmente, el bloque central o "SoC Tile", será el que integre la NPU para IA, nuevos E-Cores de bajo consumo, WiFi 6E, HDMI y DisplayPort 2.1, y motores de multimedia y pantalla integrados.
Además de las nuevas arquitecturas de E-Cores (con E-Cores extra de bajo consumo) y P-Cores, también estrenarán nuevos gráficos basados en la arquitectura Intel Xe-LPG con hasta el doble de rendimiento o rendimiento por vatio que la generación anterior. Además, incorporará soporte para raytracing y DirectX 12 Ultimate. Junto a ella, el bloque con el SoC de Meteor Lake integrará la Xe Media Engine y Display Engine para poder gestionar la aceleración multimedia y la gestión de la pantalla sin necesidad de activar el bloque de la GPU integrada.
Tampoco podía quedar atrás la introducción de una nueva NPU para la aceleración de procesos de Inteligencia artificial, una tecnología en pleno auge y que pronto se integrará en distintos ámbitos de la computación, incluyendo sistemas operativos domésticos como Windows 11. Esta NPU trabajará codo con codo con la CPU y la GPU para acelerar distintos tipos de procesos de IA.
Conectividad WiFi 7, Bluetooth 5.4, Thunderbolt 4 y una plataforma específicamente creada para conseguir portátiles ligeros, finos y con altas capacidades, terminarán por dar forma a una nueva línea de portátiles.
A lo largo de este artículo, iremos desgranando todas estas y muchas otras novedades a fondo para conocer cómo se han diseñado los Intel Meteor Lake, su arquitectura en detalle y lo que ofrecerán en el competitivo mercado de los portátiles.
Así se crea un procesador Meteor Lake con Intel Foveros 3D
Antes de comenzar con los detalles de la arquitectura Intel Meteor Lake en detalle, debemos pararnos a hablar de Foveros 3D, ya que esta tecnología de empaquetado es la que hace posible tanto el diseño como la existencia de Meteor Lake.
A grandes rasgos, Foveros es la propuesta de Intel para la fabricación de procesadores mediante el apilado de módulos en 2D y 3D. Al igual que en la programación de software, donde suele ser habitual separar una tarea en funciones más pequeñas y hacer que trabajen juntas para resolver la tarea final, Foveros permite llevar eso al Hardware y separar cada tarea en pequeños módulos (cómputo, GPU, SOC (a su vez con otros pequeños módulos en su interior), entrada y salida, e interconectarlo todo para tener un procesador completo. El dividir en bloques facilita tanto la fabricación como el conseguir mayores eficiencias y menor consumo.
Además, al diseñar por separado los distintos bloques, se simplifica la creación de todo tipo de procesadores adaptados a tareas distintas. Es posible tener más núcleos de un tipo o de otro, combinar distintas tecnologías y unificarlo todo en un procesador, en vez de diseñar como un chip unificado. Tan solo hay que coger los bloques que se necesiten, y unirlos entre sí.
Estas ventajas también se notan en la producción de chips, ya que se consigue una tasa de hasta un 10% más de bloques por cada oblea fabricada, ya que todos los bloques tienen el mismo tamaño y diseño.
En comparación con Raptor lake, la interconexión de los módulos que permite Meteor Lake gracias al uso de Foveros reduce el consumo entre los bloques, y deja vía libre para optimizar los diseños tanto de bloques como de procesadores de cara al futuro, al compartir la misma tecnología de empaquetado "Foveros".
Todo ello ha llevado a Intel a considerar Foveros como una de las mayores evoluciones de arquitectura de los últimos 40 años.
Foveros aplicado en Meteor Lake
Una vez visto lo que es Foveros, pasamos a ver cómo se utiliza exactamente en la nueva arquitectura Meteor Lake.
Como hemos explicado, es una tecnología que permite interconectar o "empaquetar" en un mismo procesador, distintos bloques independientes para que trabajen juntos, combinando apilamiento 2D "horizontal" y 3D "vertical".
Meteor Lake está formado por 5 bloques principales (más adelante entraremos más en detalle para ver qué esconden en su interior): Por un lado, está el bloque de Cómputo, donde están los P-Cores, E-Cores y elementos asociados; le sigue el bloque de Gráficos, con la nueva arquitectura Intel Xe-LPG encargada de la aceleración gráfica; el bloque de entrada/salida y el bloque SoC, el principal, donde se integran la NPU, más E-Cores, y otros elementos que veremos más adelante.
Todo ello se coloca sobre el bloque base o "interposer".
Antes de unir todos los bloques, el diseño independiente permite realizar pruebas para comprobar el correcto funcionamiento y fabricación de cada bloque. Al poder realizar test a cada "die" se consiguen yields considerablemente mayores (yield es el porcentaje de chips o "dies" válidos de cada oblea fabricada).
Una vez todos los bloques están ya verificados, pasarían a la siguiente fase del proceso, donde se ensambla la oblea de procesadores con todos los bloques unidos y conectados.
Posteriormente, el chip resultante con todos los bloques unidos se coloca en el substrato y en la placa de sujección que se soldará directamente a la placa base del portátil. Hay que tener en cuenta que los procesadores Meteor Lake llegarán en formato BGA y, al menos de momento, no estarán disponibles para sockets LGA.
Una vez está todo integrado en el módulo BGA, se realizan las pruebas en los sistemas de Intel, donde cuentan con maquinaria para realizar pruebas de estrés, pruebas del sistema y pruebas finales para tener un procesador ya validado y listo para entregar.
Arquitectura Meteor Lake: Detalles y Bloques de la primera arquitectura 3D híbrida
Hemos comenzado este artículo con un resumen de las novedades más generales que traerá Meteor Lake. Estas novedades se pueden dividir en cuatro hitos que Intel asegura haber conseguido: Crear su procesador más eficiente en toda su historia, integrar su primer motor de IA en un procesador doméstico o NPU, dar un salto considerable en rendimiento gráfico, e introducir su proceso de fabricación Intel 4 con dos nuevas arquitecturas que darán vida a los P-Cores y E-Cores (Crestmont y Redwood Cove respectivamente)
Como dijimos al principio, la tecnología de empaquetado Foveros permite crear bloques independientes que luego se juntan entre sí en el procesador final, eso permite que Meteor Lake cuente con varios de esos bloques para distribuir las distintas funciones.
Por un lado tenemos el Bloque de Cómputo, donde van alojados los núcleos principales del procesador con las nuevas arquitecturas Redwood Cove para los P-Cores de alto rendimiento, y Crestmont para los E-Core de alta eficiencia, todos ellos fabricados con el proceso Intel 4.
Por otro lado, está el bloque del SoC o "System on a Chip", podríamos considerarlo el corazón del procesador, ya que aquí es donde tenemos el controlador de memoria e incluso memoria LPDDR5x integrada tal y como hemos visto ya, además de la NPU o aceleradora de Inteligencia artificial, y conectividad WiFi 6E con Bluetooth.
En el Bloque SoC aparecen unos elementos novedosos teniendo en cuenta la distribución de Meteor Lake: en una mano tenemos 2 E-Cores de bajo voltaje, con la misma arquitectura Crestmont que los E-Cores del bloque de cómputo, pero ajustados para un menor consumo reduciendo su frecuencia y caché. Están en este bloque para realizar tareas ligeras y no tener que utilizar los núcleos principales del bloque de Cómputo.
En la otra mano, nos encontramos con un chip para aceleración Multimedia y otro para la gestión de la pantalla, por lo que el propio bloque SOC puede encargarse de esas tareas sin activar el bloque de la GPU (que detallaremos a continuación).
El bloque de la GPU traerá varias funciones y características de la serie Intel Arc de sobremesa gracias a la nueva arquitectura Intel Xe-LPG, tendremos, entre otras cosas, soporte para Raytracing por hardware y también DirectX 12 Ultimate.
Intel promete el doble de rendimiento por vatio en esta nueva generación si la comparamos con las GPUs Intel Xe de las pasadas generaciones.
Finalmente, el bloque de entrada salida o "IO Tile" será el encargado de dotar a los portátiles con procesadores Meteor Lake de conectividad PCI Express Gen 5 y de Thunderbolt 4. Tendremos que esperar a nuevos diseños para ver el nuevo Thunderbolt 5 en acción.
El contar con este diseño de bloques, permite apagar y encender de manera independiente cada uno de ellos. Cada bloque tiene su propio acceso a la memoria y se pueden apagar o encender según las necesidades de cada momento.
Un ejemplo claro lo tenemos al reproducir, por ejemplo, una película. En ese caso, tanto el bloque gráfico como el bloque de cómputo se apagarán y solamente estará activo el bloque SoC con la parte de aceleración multimedia y de control de la pantalla.
El disponer de E-Cores de bajo consumo en el bloque del SoC permite no tener que encender el bloque de cómputo para tareas de baja intensidad, lo que cambia por completo cómo se gestiona la energía en esta arquitectura al no necesitar tener núcleos E-Cores normales o P-Cores en todo momento encendidos.
Nuevas arquitecturas de núcleos híbrida con Redwood Cove y CrestMont a Intel 4
Como hemos podido ver, los núcleos propiamente dichos de los procesadores Meteor Lake se distribuyen en dos bloques: el bloque SoC, donde se encuentran los dos núcleos LP E-Cores, y el Bloque de Cómputo formado por E-Cores y P-Cores. Los E-Cores están basados en la nueva arquitectura CrestMont, y los P-Cores en Redwood Cove, todos ellos fabricados con el proceso Intel 4.
Todos los procesadores Meteor Lake contarán con lo que Intel denomina "Low Power Island": una parte del SoC donde se integran los dos LP E-Cores. Estos núcleos mantienen la arquitectura Crestmont, pero reducen su frecuencia y su caché para ser más pequeños y reducir su consumo.
De esta manera, para la mayoría de tareas en segundo plano, no es necesario encender el bloque de Cómputo y despertar a los núcleos E-Core y P-Cores para tareas de mayor rendimiento. Esto permite una reducción en el consumo y la aplicación de nuevas políticas para distribuir los procesos entre estos tres tipos de núcleos.
Aquí entra en juego el Intel Thread Director, parte del chip que se encarga de comunicarse con el Sistema operativo para poder escoger la distribución de procesos entre los distintos núcleos dependiendo de su finalidad.
Los P-Cores se orientan a tareas pesadas, tanto donde se necesite mucho rendimiento de un solo hilo, como en rendimiento multihilo limitado.
Por otro lado, los E-Cores del bloque de cómputo se orientan a procesos multihilo donde la eficiencia sea clave más que la potencia en sí.
Finalmente, los LP-Cores se centran en tareas ligeras para ahorrar energía.
Los P-Cores con la arquitectura Redwood Cove mejoran también la eficiencia energética desde la pasada generación, además de contar con nuevos sistemas de monitorización de rendimiento y una mejor comunicación con el Intel Thread Director.
Los E-Cores "Crestmont" han mejorado el IPC o rendimiento por núcleo, por lo que, aun manteniendo un menor consumo, tendrán ahora más potencia para tareas multinúcleo. Al igual que los P-Cores, se ha mejorado la comunicación con El Thread Director, añadido mejoras de rendimiento para tareas de IA y mejorado la predicción de ramas.
El uso de los distintos núcleos de Meteor Lake está gestionado por el nuevo Intel Thread Director, que es el que le dice al planificador del Sistema Operativo, a qué núcleo deberían ir las distintas instrucciones dependiendo del tipo. Para ello los clasifica según deben ir hacia núcleos más eficientes o de más rendimiento.
El esquema de cómo se distribuye la carga entre los distintos núcleos cambia considerablemente desde la anterior arquitectura Raptor Lake.
Raptor Lake contaba únicamente con P-Cores y E-Cores en el propio procesador, pasaba directamente las cargas más altas a los P-Cores y las más bajas a los E-Cores. Cada cierto tiempo, los hilos de ejecución de los E-Cores se movían a los P-Cores y se reclasificaban, por lo que los P-Cores tenían una carga de trabajo bastante elevada.
En el caso de Meteor Lake, por defecto se intenta procesar en los LP E-Cores del bloque SoC, si el trabajo es demasiado alto como para procesarlo ahí, entonces se pasa al bloque de Cómputo, ahí, si el trabajo a realizar encaja en las capacidades de los E-Cores más potentes, se encargan de procesarlo, en caso contrario van a los P-Cores de alto rendimiento.
De esta forma, la distribución de los procesos se realiza de manera más eficiente y sin necesidad de que los P-Cores los reclasifiquen.
Además, gracias a la integración y soporte con Windows, se podrá cambiar la manera en la que el procesador gestiona la carga de trabajao según necesitemos mayor eficiencia o rendimiento.
Aquí podemos ver como sería un ejemplo de planificación en modo Eficiencia.
Y aquí en modo Rendimiento
Adicionalmente, las tareas relacionadas con procesado de Inteligencia Artificial también se benefician del diseño modular de Meteor Lake, ya que pueden participar tanto el bloque de cómputo con los núcleos E-Cores y P-Cores, para las tareas ligeras de inferencia de baja latencia; también la GPU del bloque propio para Inteligencia Artificial orientada a Multimedia, renderizado o 3D; y la NPU integrada en el bloque SoC para tareas donde se necesita rendimiento y eficiencia de manera sostenida.
GPU Intel Xe-LPG: Hasta el doble de rendimiento y con Raytracing y XeSS
Otra de las novedades de Meteor Lake es la inclusión de la nueva arquitectura Intel Xe-LPG de gráficos Integrados. Esta nueva versión da un salto de hasta el doble de rendimiento respecto de la anterior Xe-LP que daba vida a las gráficas integradas en las anteriores generaciones de Intel, acercándose en rendimiento y características a las Intel Xe-HPG que podemos encontrar en las Intel ARC A-Series de sobremesa.
Integrada dentro del Bloque de GPU en la arquitectura modular Meteor Lake, la GPU Xe-LPG se centra en la aceleración gráfica y también en tareas de aceleración de IA; ya que la gestión de aceleración multimedia y de pantalla está integrada en el bloque SoC para reducir el consumo y poder apagar el bloque de la GPU entero.
Para conseguir estas mejoras de rendimiento, la GPU Xe-LPG ha escalado el motor gráfico consiguiendo una GPU más grande, con frecuencias más altas, pero aprovechando la eficiencia de la arquitectura para no disparar su consumo, de hecho, mantiene un consumo similar al de pasadas generaciones.
La frecuencia boost máxima es bastante superior ahora, llegando a cifras cercanas a los 2,5 GHz, pero con voltajes bastante inferiores. Incluso en las frecuencias más bajas, el voltajke pasa de los 0,72 v de las Xe-LP a solo 0,56v.
Además del aumento de frecuencias. Ahora hay 8 nuevos Xe Cores con 128 motores de vectorizado, el doble de "tuberías de geometría" y, entre otras mejoras, 8 unidades de Raytracing como las que podemos ver en las Intel ARcv
Intel promete un rendimiento considerablemente superior a las Intel Xe-LP de Raptor Lake, de más del doble en tareas como procesado de vertex, 2,6 veces más rendimiento en dibujo de triángulos y hasta 6,6 veces más rendimiento en pruebas de profundidad.
En cuanto al soporte para raytracing, más allá del gaming (que con una gráfica integrada no será el uso principal), también hay soporte para la creación de contenidos o simulaciones, que ahora podrán realizarse en portátiles con estos procesadores sin necesidad de gráficos integrados.
Hablamos de más del doble de rendimiento en renderizado con raytracing en programas como blender gracias a estas GPUs, comparándolas con utilizar únicamente el procesador.
Además, también se incluye soporte para tecnologías como Intel Xe SS (Super Sampling) con las que conseguir mejoras importantes de rendimiento.
Los Bloques SoC y de entrada/salida
En las anteriores generaciones de procesadores de Intel, como Alder Lake o Raptor Lake, se introdujo la arquitectura híbrida de P-Cores y E-Cores. Sin embargo, el diseño no era modular en bloques, y tanto la GPU, como los núcleos de CPU, controlador de memora, conectividad USB4 o PCI Express iba en el mismo módulo. Junto a el, el PCH se encargaba de la conectividad externa.
Con Meteor Lake, ya hemos visto que se ha dividido el procesador en distintos bloques independientes utilizando la tecnología Foveros con ventajas tanto en la fabricación como a nivel de eficiencia y rendimiento
Hemos repasado el Bloque de Cómputo, el de GPU y ahora nos queda dar un repaso a fondo al Bloque SoC y al IO.
Dentro del bloque SoC se encuentran los elementos clave del procesador que quedan tras retirar la parte gráfica y la de cómputo, aunque ya hemos visto que parte del cómputo se puede realizar en este bloque con la inclusión de dos núcleos LP E-Cores.
Junto a ellos, encontramos también el controlador de memoria y la NPU para aceleración de procesamiento de Inteligencia artificial. También está en este bloque las partes encargadas de la pantalla, imagen y aceleración multimedia, por lo que el ordenador podrá funcionar con los bloques de Cómputo y de GPU desactivados, consumiendo únicamente energía en el bloque del SoC.
Todo ello se comunica con los bloques de CPU y de GPU mediante el NOC (Network on Chip), mientras que de la parte de la conectividad USB 3 y 2, SATA; PCI Express, Wifi 6E, SATA, Ethernet, e incluso el chip de seguridad entre otras cosas, se comunican internamente mediante la "IO Fabric" que comunica también con el bloque IO externo encargado de la comunicación PCI Express Gen 5 y Thunderbolt 5.
La razón de ser del bloque IO permite expandir la conectividad de manera sencilla dependiendo del modelo de procesador. Imaginemos, por ejemplo, un procesador para portátiles que no requieren de conectividad PCIe Gen 5 o Thunderbolt 4, se puede prescindir de este bloque, o si en un futuro cercano llega la anunciada conectividad Thunderbolt 5, se podría implementar sin un rediseño completo del procesador.
La clave de Meteor Lake: El Diseño de Chiplets
El verdadero avance de Intel, aparte del estreno del nuevo proceso de fabricación Intel 4, está en lo que Foveros les permite hacer: disponer de distintos bloques separados para cada cosa y ponerlo todo junto en un mismo procesador. Esto permite a Intel, no solo combinar chilets distintos, sino que además éstos pueden venir de otras fábricas y estar hechos a otros procesos de fabricación, y ser posteriormente ensamblados sobre la capa Foveros.
Además el hecho de que hayan pensando en disponer de una zona de baja potencia en el SoC que permita al sistema trabajar sin encender los bloques dedicados para CPU, GPU, etc. consigue un ahorro de potencia considerable, del que los portátiles de 2024 se beneficiarán en gran medida.
Intel sin duda conseguirá que los portátiles superen con soltura la autonomía y rendimiento que tenemos hoy en día, y pondrá las cosas bastante más dificiles para Qualcomm y AMD. Con respecto a sobremesa, por el momento no hay información sobre la llegada de Meteor Lake, pero salvo algunas filtraciones de dudosa credibilidad, no hay razon para pensar que no vayan a llegar.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!