El procesador más grande del mundo multiplica por más de dos los núcleos y transistores al pasar a 7 nanómetros
por Juan Antonio Soto Actualizado: 21/04/2021 2Cerebras ha lanzado la segunda versión del procesador para IA Wafer Scale Engine. Este nuevo procesador WSE-2 viene con mejoras respecto a la primera generación, pasando de los 16 nm a un proceso de 7 nm y de 1.200 billones de transistores a más del doble con 2.600 billones y un ancho de banda de 220 PB/s respecto a los 100 PB/s de la primera generación. Sin embargo, el tamaño es el mismo que en WSE-1, esto es porque no se puede realizar un mayor al ocupar toda una oblea de silicio de 12 pulgadas siendo finalmente de 46.225 mm2 como el anterior.
En comparación con una GPU NVIDIA A100, esta tiene un tamaño de 826 mm2 y 54.000 millones de transistores, el ancho de banda de la memoria es de 2 TB/s y la comunicación entre las A100 va hasta los 600 GB/s. Veamos los datos en una tabla para compararlos más fácilmente.
Wafer Scale Engine 2 | Nvidia A100 | |
---|---|---|
Tamaño | 46.225 mm2 | 826 mm2 |
Proceso de fabricación | 7 nm | 7 nm |
Transistores | 2.600 billones | 54.000 millones |
Núcleos | 850.000 |
- 6.912 FP32 - 3.456 FP64 - 432 Tensor Core |
SRAM | 40 GB | 40 MB |
Ancho de banda de la memoria | 9 PB/s | 2 TB/s |
Ancho de banda de la conexión | 100 PB/s | 600 GB/s |
También se ha mejorado el número de núcleos SLAC para la IA pasando de 400.000 a 850.000 con una nueva microarquitectura de la que no han dado muchos detalles, además cuenta con entre un 1 y un 2% de núcleos IA adicionales por si falla alguno de los principales puede hacer uso de estos. Otros cambios pasan por una estructura contando con 84 troqueles que permanecen en la oblea y así disponer de 84 velocidades de reloj independientes. Más mejoras son el aumento de memoria SRAM que pasa de 18 GB a 40 GB, con un ancho de banda mejorado de 20 PB/s.
Para hacer funcionar este WSE-2 es necesario que disponga de alimentación suficiente, el consumo es de 20 kW y para la comunicación con otros sistemas se usará una línea de 12 conexiones de 100 GbE. Con estas cifras no se podría mantener frío este chip más grande del mundo sin una buena refrigeración líquida.
Además de mejorar el WSE-2 Cerebras también trabaja en mejorar su software para aprovechar todo el potencial de los núcleos SLAC y disponen de un compilador de gráficos CGC para transferir datos a la red de aprendizaje.
Se espera entregar el primer CS-2 con una unidad WSE-2 a partir del tercer trimestre con un precio de varios millones de dólares, sin especificar la cantidad. El precio del CS-1 con la generación anterior de WSE costó algo más de 2 millones de dólares.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!