ARM Neoverse CSS N2 : Así Permite Crear un Chip Personalizado en 13 meses
Las CPU ARM Neoverse V2 se anunciaron hace un año para sistemas de cómputo de alto rendimiento, como por ejemplo, para la parte de CPU de las NVIDIA Grace, donde ya están disponibles. Esta plataforma consigue desde un 13 a un 100% más de rendimiento en servidores de altas prestaciones y está creada exclusivamente para este sector donde el máximo rendimiento es clave.
Por otro lado, ARM ha desarrollado su plataforma Neoverse N2 orientada hacia servidores donde la eficiencia es más importante, como sistema en la Nube, gestión de redes, 5G, etc.. Y en el Hot Chips de este año, ARM ha desvelado un componente clave de esta plataforma como son sus Subsistemas de Cómputo (CSS) para la plataforma N2: Neoverse CSS N2.
La idea detrás del Neoverse CSS N2 es la de ofrecer una plataforma que facilite a las empresas desarrollar sus productos utilizando las tecnologías de la plataforma N2 para obtener Chips completos con núcleos ARM Neoverse N2, con el sistema de seguridad y control integrados, y permitiendo la adición de otros módulos adicionales por parte de cada empresa.
El Neoverse CSS N2 ya ofrece la optimización de los componentes propios de ARM, con soporte de referencia de software y hardware, y también la posibilidad de añadir tecnologías punteras como PCI Express Gen5, aceleradores de IA o módulos adicionales. De hecho, la plataforma soporta un diseño de chiplets donde cada tarea se encarga a un chip.
De esta manera, un fabricante que quiera diseñar sus propios chips para sus servidores o para otros clientes, podrá desarrollarlo de manera más sencilla desde el diseño inicial hasta la producción, sin renunciar a integrar características propias que lo diferencien de la competencia.
Por ejemplo, un SoC creado con las especificaciones base de ARM no ofrecería ninguna diferenciación respecto de otros SoCs con esas mismas especificaciones, pero utilizando el SSC N2 se puede partir de un diseño ya validado y añadirle nuevas funcionalidades y elementos para personalizarlo a sus necesidades. Todo ello sin irse a los costes y riesgos que supone diseñar desde 0 una arquitectura, o un diseño propio completo con todo lo que ello supondría.
Dado que el CSS N2 utiliza la plataforma N2 que hemos comentado, su utilidad se centra en sistemas en la nube, infraestructuras 5C y otros elementos donde la eficiencia es clave y donde las compañías busquen desarrollar sus soluciones semi personalizadas para su mercado.
Todo ello para conseguir un nuevo chip personalizado en 13 meses.
Entremos ahora un poco más en detalle en lo que supone la plataforma ARM Neoverse CSS N2. Dado que es una base para la creación de chips personalizados basados en esta arquitectura, hay multitud de opciones de configuración de la parte de CPU.
Tenemos opciones de integración de 24, 32 y hasta 64 núcleos Neoverse N2 con velocidades que van desde los 2,1 GHz hasta los 3,6 GHz. Este diseño está basado en el proceso de fabricación de 5 nanómetros, y se incluye una jerarquía de caché con 64K de caché L1 I-Caché y 64K D-Caché ECC, con caché L2 privada de hasta 1 MB y hasta 64 MB de caché del sistema.
Es compatible con las interfaces AMBA CHU/AXI con hasta 8 canales de memoria DDR5 o LPDDR5, y hasta cuatro canales de 16 líneas PCI Express Gen5.
El diseño de Neoverse CSS N2 soporta chips adicionales o aceleradores con intercomunicaciones UCIe o D2D PHY si el cliente necesita sus propios chips, también se soportan interfaces de expansión adicionales de manera general para conectar puertos más lentos como el USB.
El tamaño de un módulo CSS N2 de 24 núcleos es de 53 milímetros cuadrados, que sube hasta los 61 milímetros cuadrados en el caso del módulo de 61 núcleos y de 198 mm2 en el caso del modelo más grande de 64 núcleos
Naturalmente, el CSS N2 es compatible con la arquitectura base de sistemas ARM en su versión 1.0, la arquitectura de base de sistemas de servidores 6.1 y la arquitectura de Boot de servidores 1.2
Cada uno de los núcleos Neoverse N2 integrados en la plataforma CSS N2 sigue la arquitectura ARMv9, con soporte para SVE2 y las nuevas instrucciones ML. También soporta particionamiento y monitorización de memoria para asignar recursos a cada hilo y la prioridad QoS.
Soportan criptogradía con encriptado SHA2-512, SHA3, SM3 y SM4, además de soporte para gestión de energía avanzada y ahorro como MPMM, DT y PDT
Junto a los núcleos, el sistema de control SCP es un núcleo Cortex-M7 que se encarga de controlar el control de los relojes de los núcleos, energía, voltaje y toda la gestión de energía del procesador. Le acompaña el MCP, que se encarga de la gestión con otro núcleo Cortex-M7.
Para la gestión de las direcciones, virtualización y la comunicación con dispositivos conectados a través de PCIe o de otros aceleradores que se añadan al chip final, la plataforma CSS n2 incluye la MMU-700, mientras que el GIC-700 se encarga de controlar las interrupciones entre los núcleos y también entre cada núcleo y los periféricos asociados.
Todos estos componentes se interconectan entre sí por el sistema Neoverse CMN-700, que comparte una caché del sistema de tipo SLC para la entrada/salida y las CPUs. utiliza una tipología de "rejilla" o "Mesh" para la interconexión de los distintos elementos, soportando varios chips de manera simultánea.
Por otro lado, para dar soporte a los aceleradores que se puedan añadir en la fase de diseño de un chip basado en CSS N2, tenemos un bloque de entrada y salida (IO Block) con toda la lógica para interrupciones y traducción de direcciones para que los clientes puedan añadir sus propios chips aceleradores directamente o a través de controladoras PCI Express externas.
La propia plataforma permite crear sistemas con dos sockets, y cada socket estar formado por dos chiplets. Por tanto, en las configuraciones más potentes, podremos tener cuatro subsistemas CSS N2, cada uno con sus 64 núcleos para un total de 256 núcleos interconectados.
También se incluyen las tecnologías de interconexión necesarias para crear estos sistemas multichip, y añadir aceleradores PCIe 5.0 y otros dispositivos de manera externa.
En un sistema con un módulo de 64 núcleos, la distribución de los núcleos se realiza en 32 pequeños tiles de 5 nanómetros, cada uno con dos núcleos N2 en su interior.
Además de toda la especificación y componentes Hardware, la plataforma ARM Neoverse CSS N2 también va acompañada de un conjunto de software y firmware adaptado para su funcionamiento y despliegue rápido, con todo tipo de funciones y documentación para que los usuarios de esta plataforma puedan desarrollar sistemas completos.
Con todo esto en cuenta, ARM busca que sus clientes puedan desarrollar sus propios chips en poco más de 1 año, ahorrándose 80 años de ingeniería y experiencia al tener una plataforma base preparada para todo tipo de necesidades.