Tachyum ha publicado oficialmente el whitepaper de su procesador universal Prodigy de 5 nm, que fue desvelado ya en 2018.

Tachyum procesador Prodigy

Tachyum promete grandes cifras en el whitepaper del procesador universal Prodigy de 5 nm, con una eficiencia de rendimiento hasta 9 veces superior a la del H100 de NVIDIA

Las CPU Tachyum Prodigy utilizan un diseño de procesador universal, lo que significa que pueden ejecutar tareas de CPU, GPU y TPU en el mismo chip, ahorrando costes respecto a los productos de la competencia y ofreciendo además un rendimiento realmente alto.

La empresa pretende hacer frente a los tres gigantes del chip, AMD, Intel y NVIDIA, con su línea Prodigy y, en sus presentaciones, Tachyum ha estimado un aumento del rendimiento 4 veces superior al de las CPU Xeon de Intel, en el ámbito de la computación de alto rendimiento (HPC), un aumento 3 veces superior al H100 de NVIDIA y un aumento 6 veces superior del rendimiento bruto en las cargas de trabajo de IA e inferencia.

También se dice que los chips ofrecen más de 10 veces el rendimiento de los sistemas de sus competidores con el mismo consumo. Algunas de las principales características de las CPU son

  • 128 núcleos unificados de 64 bits de alto rendimiento que funcionan a 5,7 GHz
  • 16 controladores de memoria DDR5
  • 64 carriles PCIe 5.0
  • Compatibilidad con multiprocesadores para plataformas de 4 y 2 zócalos
  • Soluciones de rack para centros de datos refrigerados por aire y por líquido
  • Rendimiento de enteros SPECrate 2017 de alrededor de 4x Intel 8380 y alrededor de 3x AMD 7763HPC
  • El rendimiento en coma flotante de doble precisión es 3x NVIDIA H100
  • El rendimiento de FP8 de IA es 6x NVIDIA H100

Tachyum procesador Prodigy

Tachyum ha publicado el libro blanco completo de su procesador universal Prodigy, en el que se detalla la arquitectura de la CPU, la plataforma y la gama de productos, que abarca desde la CPU de bajo consumo T8232-LP de 32 núcleos con un TDP de 180 W, hasta el buque insignia T16128-AIX, que cuenta con un total de 128 núcleos.

Arquitectura de CPU universal Tachyum Prodigy – Diseño personalizado de 64 bits

El Tachyum Prodigy utiliza una arquitectura OOD (Out-Of-Order) que puede descodificar y retirar hasta 8 instrucciones por reloj, emitir hasta 11 instrucciones por reloj, con una cola de instrucciones que admite hasta 48 instrucciones y un planificador que admite 12 colas de 15 entradas de profundidad. Cuenta con cuatro ALU, una unidad de carga, una unidad de almacenamiento, una unidad de carga/almacenamiento, una unidad de máscara y dos unidades vectoriales de 1024 bits. Cada núcleo tiene también un subsistema de IA que incluye una unidad de matriz de 4096 bits. Cada núcleo es un diseño de hardware de un solo hilo.

En cuanto a la configuración de la caché, cada núcleo dispone de 64 KB de I-Cache y 64 KB de D-Cache con SECDED ECC. Cada núcleo dispone también de 1 MB de L2 con ECC de doble corrección de errores y triple detección de errores DECTED. Los núcleos activos también pueden agrupar la caché L2 de los núcleos inactivos de la CPU para que actúe como caché L3 compartida.

Todos los chips se fabrican en el nodo de proceso de 5 nm (N5P) de TSMC, que es una variante ligeramente optimizada del nodo estándar de 5 nm (N5), y ejecutan binarios nativos y x86, Arm y RISC-V. En cuanto a las características específicas de HPC e IA, la línea Tachyum Prodigy incluye

  • 2 unidades vectoriales de 1024 bits por núcleo
  • Procesadores de matriz de 4096 bits por núcleo
  • Tipos de datos FP64, FP32, TF32, BF16, Int8, FP8, TAI
  • Los tipos de datos dispersos optimizan la eficiencia
  • Soporte de cuantificación mediante tipos de datos de baja precisión
  • Scatter/Gather para almacenar y cargar matrices de forma eficiente

Gama/plataforma de CPU universales Tachyum Prodigy – Escala de consumos de 180 W a 900 W

Los 128 núcleos de la CPU insignia tienen una frecuencia de 5,7 GHz y, además, los clientes de IA dispondrán de hasta 16 canales de memoria, que admiten hasta 32 TB (64 DIMM) de DDR5-7200. El procesador también contará con 64 carriles PCIe Gen 5.0 y vendrá en un paquete TDP de 950 W.

Tachyum espera que las primeras unidades de Prodigy comiencen a ser probadas a finales de este año y se espera que la producción en volumen tenga lugar en la segunda mitad de 2023. La actualización de la próxima generación de Prodigy, conocida como Prodigy 2, también figura en la hoja de ruta de Tachyum y ofrecerá una nueva arquitectura de 3 nm con aún más núcleos, mayor ancho de banda de memoria, compatibilidad con PCIe 6.0 + CXL y conectividad mejorada. El lanzamiento debería comenzar en la segunda mitad de 2024.

Fuente

Por Netón

Apasionado de la tecnología, el hardware y los videojuegos. Capitán del pequeño barco que es El Refugio 101.