Dell Technologies, Hewlett Packard Enterprise, Lenovo, Meta, Microsoft, Oracle, Supermicro y otros exhiben hardware AMD para computación de alto rendimiento y aplicaciones de IA generativa. AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300.
El ecosistema de software abierto ROCm 6 combina hardware y software de última generación para ofrecer un aumento en 8 veces del rendimiento generacional, impulsar avances en la IA generativa y simplificar la implementación de las soluciones de IA de AMD.
Anuncio: AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300
AMD (NASDAQ: AMD) anunció la disponibilidad de los aceleradores AMD Instinct™ MI300X, con ancho de banda de memoria líder en la industria para IA[1] generativa y rendimiento de liderazgo para capacitación e inferencia de Modelos de Lenguaje de Gran Tamaño (LLM), así como la unidad de procesamiento acelerado (APU) AMD Instinct™ MI300A, que combina la última arquitectura AMD CDNA™ 3 y CPU “Zen 4” para ofrecer un rendimiento innovador para cargas de trabajo de computación de alto rendimiento (HPC) e IA. AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300.
“Los aceleradores de la Serie AMD Instinct MI300 están diseñados con nuestras tecnologías más avanzadas, ofreciendo un rendimiento líder y estarán en implementaciones empresariales y en la nube a gran escala”, dijo Victor Peng, presidente de AMD. «Al aprovechar nuestro liderazgo en hardware, software y enfoque de ecosistema abierto, los proveedores de nube, fabricantes de equipos originales, y fabricantes de diseño original (OEM y ODM por sus siglas en inglés) están llevando al mercado tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA.”
Los clientes que aprovechan la última cartera de aceleradores AMD Instinct incluyen a Microsoft, que recientemente anunció la nueva Serie de máquinas virtuales (VM) Azure ND MI300x v5, optimizadas para cargas de trabajo de IA y con tecnología de aceleradores AMD Instinct MI300X. Además, se espera que El Capitan, una supercomputadora impulsada por una unidad de procesamiento acelerado AMD Instinct MI300A y alojada en el Laboratorio Nacional Lawrence Livermore, sea la segunda supercomputadora de clase exaescala impulsada por AMD, que ofrezca más de dos exaflops de rendimiento de doble precisión cuando esté completamente implementada. Oracle Cloud Infrastructure planea agregar instancias bare metal basadas en AMD Instinct MI300X a las instancias informáticas aceleradas de alto rendimiento para IA de la compañía. Está previsto que las instancias basadas en MI300X admitan OCI Supercluster con redes RDMA ultrarrápidas. AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300.
Varios fabricantes de equipos originales importantes también exhibieron sistemas informáticos acelerados, durante el evento AMD Advancing AI. Dell presentó el servidor Dell PowerEdge XE9680 con ocho aceleradores AMD Instinct y el nuevo diseño validado de Dell para IA generativa con frameworks de IA impulsados por AMD ROCm. HPE anunció recientemente el HPE Cray Supercomputing EX255a, el primer acelerador blade de supercomputación impulsado por unidades de procesamiento acelerado (APU) AMD Instinct MI300A, que estará disponible a principios de 2024. Lenovo anunció su soporte de diseño para los nuevos aceleradores Serie AMD Instinct MI300 a disposición durante la primera mitad de 2024. Supermicro anunció nuevas incorporaciones a su generación H13 de servidores acelerados por CPUs AMD EPYC de cuarta generación y aceleradores Serie AMD Instinct MI300.
AMD Instinct MI300X
Los aceleradores AMD Instinct MI300X funcionan con la nueva arquitectura AMD CDNA 3. En comparación con los aceleradores AMD Instinct MI250X de la generación anterior, MI300X ofrece casi un 40 % más de unidades de cómputo, 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórico máximo, así como soporte para nuevos formatos matemáticos como FP8 y sparsity; todo orientado a cargas de trabajo de IA y HPC. AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300.
Los LLM actuales continúan aumentando en tamaño y complejidad, y requieren cantidades masivas de memoria y computación. Los aceleradores AMD Instinct MI300X cuentan con 192 GB de capacidad de memoria HBM3, la mejor de su clase, así como un ancho de banda de memoria máximo de 5,3 TB/s2 para ofrecer el rendimiento necesario para cargas de trabajo de IA cada vez más exigentes. La plataforma AMD Instinct es una plataforma de IA generativa construida sobre un diseño OCP estándar de la industria con ocho aceleradores MI300X para ofrecer una capacidad de memoria HBM3 de 1,5 TB líder en la industria. El diseño estándar de la industria de la plataforma AMD Instinct permite a los socios OEM diseñar aceleradores MI300X en ofertas de IA existentes y simplificar la implementación y acelerar la adopción de servidores basados en aceleradores AMD Instinct.
En comparación con la Nvidia H100 HGX, la plataforma AMD Instinct puede ofrecer un aumento de rendimiento de hasta 1,6 veces cuando se ejecuta inferencia en LLM como BLOOM 176B y es la única opción en el mercado capaz de ejecutar inferencia para un modelo de parámetros de 70B, como Llama2. en un único acelerador MI300X; simplificando las implementaciones de LLM de clase empresarial y ofreciendo un costo total de la propiedad (TCO) excepcional. AMD Ofrece una cartera líder de soluciones de inteligencia artificial para centros de datos con la Serie AMD Instinct MI300.
AMD Instinct MI300A
AMD Instinct MI300A, la primera APU del mundo para centros de datos enfocada en HPC e IA, aprovecha el apilado 3D y la arquitectura AMD Infinity de cuarta generación para ofrecer un rendimiento líder en cargas de trabajo críticas ubicadas en la convergencia de HPC e IA. Las APU MI300A combinan núcleos de GPU AMD CDNA™ 3 de alto rendimiento, los últimos núcleos de CPU basados en AMD “Zen 4” x86 y 128 GB de memoria HBM3 de próxima generación, para ofrecer 1,9 veces el rendimiento por vatio en cargas de trabajo de computación de alto rendimiento FP32 e IA, en comparación con la generación anterior AMD Instinct MI250X.
La eficiencia energética es de suma importancia para las comunidades de HPC e IA; sin embargo, estas cargas de trabajo requieren un gran uso de datos y recursos. Las APU AMD Instinct MI300A se benefician de la integración de núcleos de CPU y GPU en un solo paquete, lo que brinda una plataforma altamente eficiente y, al mismo tiempo, proporciona el rendimiento informático para acelerar el entrenamiento de los últimos modelos de IA. AMD está marcando el ritmo de la innovación en eficiencia energética con el objetivo 30×25 de la compañía de ofrecer una mejora de 30 veces la eficiencia energética en procesadores y aceleradores de servidores para capacitación en IA y HPC entre 2020 y 2025.
La ventaja de las unidades de procesamiento acelerado significa que las APU AMD Instinct MI300A cuentan con memoria unificada y recursos de caché, lo que brinda a los clientes una plataforma GPU fácilmente programable, computación de alto rendimiento, entrenamiento rápido de IA y una impresionante eficiencia energética para impulsar las cargas de trabajo de HPC e IA más exigentes.
Software ROCm y Socios de Ecosystem
AMD anunció la última plataforma de software abierto AMD ROCm™ 6, así como el compromiso de la compañía de contribuir con bibliotecas de última generación a la comunidad de código abierto, impulsando su visión sobre el desarrollo de software de IA. El software ROCm 6 representa un avance significativo para las herramientas de AMD, ya que aumenta el rendimiento de aceleración de IA en aproximadamente 8 veces cuando se ejecuta en aceleradores de la Serie MI300 en la generación de texto Llama 2 en comparación con el hardware y software de la generación anterior. Además, ROCm 6 agrega soporte para varias características clave nuevas para la IA generativa, incluidas FlashAttention, HIPGraph y vLLM, entre otras. Como tal, AMD está en una posición única para aprovechar los modelos, algoritmos y marcos de software de IA de código abierto más utilizados, como Hugging Face, PyTorch, TensorFlow y otros, impulsando la innovación, simplificando la implementación de las soluciones de IA de AMD y liberando el verdadero potencial. de IA generativa.
AMD también continúa invirtiendo en capacidades de software a través de las adquisiciones de Nod.AI y Mipsology, así como a través de asociaciones estratégicas de ecosistemas como Lamini (que ejecuta LLM para clientes empresariales) y MosaicML (que aprovecha AMD ROCm para permitir la capacitación de Modelos de Lenguaje de Gran Tamaño en aceleradores AMD Instinct con cero cambios de código.
Especificaciones de Producto
AMD Instinct™ | Arquitectura | GPU CUs | Núcleos de CPU | Memoria | Ancho de Banda de Memoria | Nodos de Proceso | Apilado 3D con Arquitectura AMD Infinity de 4a Generación |
MI300A | AMD CDNA™ 3 | 228 | 24 “Zen 4” | 128GB HBM3 | 5.3 TB/s | 5nm / 6nm | SI |
MI300X | AMD CDNA™ 3 | 304 | N/A | 192GB HBM3 | 5.3 TB/s | 5nm / 6nm | Si |
Plataforma | AMD CDNA™ 3 | 2,432 | N/A | 1.5 TB HMB3 | 5.3 TB/s per OAM | 5nm / 6nm | Si |
Recursos de apoyo
- Ve la Key note complete de AMD Advancing AI.
- Aprende más de los Aceleradores AMD Instinct.
- Sigue a AMD en X.
- Conecta con AMD en LinkedIn.
Acerca de AMD
Durante más de 50 años, AMD ha impulsado la innovación en tecnologías de computación, gráficos y visualización de alto rendimiento. Miles de millones de personas, los principales negocios de Fortune 500 e instituciones de investigación científica de vanguardia de todo el mundo confían diariamente en la tecnología de AMD para mejorar su forma de vivir, trabajar y jugar. Los empleados de AMD se centran en crear productos líderes, de alto rendimiento y adaptables que amplíen los límites de lo posible. Para obtener más información sobre cómo AMD hace posible el presente e inspira el futuro, visite el sitio web, blog, LinkedIn y Twitter de AMD (NASDAQ: AMD).
AMD, el logotipo de flecha de AMD, AMD Instinct, ROCm y sus combinaciones son marcas comerciales de Advanced Micro Devices, Inc. Otros nombres tienen fines informativos únicamente y pueden ser marcas comerciales de sus respectivos propietarios.
DECLARACIÓN DE PRECAUCIÓN
Este comunicado de prensa contiene declaraciones prospectivas relacionadas con Advanced Micro Devices, Inc. (AMD), tales como las características, funcionalidad, rendimiento, disponibilidad, calendario y beneficios esperados de los aceleradores AMD Instinct™ MI300X; APUs AMD Instinct™ MI300A ; El Capitan, la super computadora impulsada por aceleradores AMD Instinct™ MI300; la meta de eficiencia energética 202-2025 de AMD’s 30x; la plataforma AMD Instinct™; Instancias bare metal basadas en AMD Instinct MI300X; la plataforma de software abierto ROCm™, que se realizan de conformidad con las Disposiciones de Puerto Seguro de la Ley de Reforma de Litigios Sobre Valores Privados de 1995. Las declaraciones prospectivas suelen identificarse con palabras como «haría», «podría», «espera», «cree», «planea», «pretende», «proyecta» y otros términos de significado similar. Se advierte a los inversionistas que las afirmaciones de carácter prospectivo contenidas en este comunicado de prensa se basan en creencias, suposiciones y expectativas actuales, se refieren únicamente a la fecha de este comunicado de prensa e implican riesgos e incertidumbres que podrían hacer que los resultados reales difirieran materialmente de las expectativas actuales. Tales afirmaciones están sujetas a ciertos riesgos e incertidumbres conocidos y desconocidos, muchos de los cuales son difíciles de predecir y generalmente están fuera del control de AMD, que podrían causar que los resultados reales y otros eventos futuros difieran materialmente de los expresados, implícitos o proyectados en la información y afirmaciones prospectivas. Entre los factores materiales que podrían causar que los resultados reales difieran materialmente de las expectativas actuales se incluyen, sin limitación, los siguientes: el dominio de Intel Corporation del mercado de microprocesadores y sus agresivas prácticas comerciales; la incertidumbre económica; la naturaleza cíclica de la industria de semiconductores; las condiciones de mercado de las industrias en las que se venden los productos de AMD; la pérdida de un cliente importante; el impacto de la pandemia COVID-19 en los negocios, la situación financiera y los resultados de las operaciones de AMD; los mercados competidos en los que se venden los productos de AMD; los patrones de ventas trimestrales y estacionales; la capacidad de AMD para proteger adecuadamente su tecnología u otra propiedad intelectual; las fluctuaciones desfavorables de los tipos de cambio; la capacidad de terceros fabricantes para hacer los productos de AMD a tiempo, en cantidades suficientes y utilizando tecnologías competitivas; la disponibilidad de equipos, materiales, sustratos o procesos de fabricación esenciales; la capacidad para alcanzar los rendimientos de fabricación previstos para los productos de AMD; la capacidad de AMD para introducir productos a tiempo con las características y niveles de rendimiento esperados; la capacidad de AMD para generar ingresos a partir de sus productos SoC semipersonalizados; las posibles vulnerabilidades de seguridad; los posibles incidentes de seguridad, incluidos los cortes de suministro de TI, pérdida de datos, filtraciones de datos y ciberataques; las posibles dificultades en la puesta en marcha del recién actualizado sistema de planificación de recursos empresariales de AMD; las incertidumbres relacionadas con los pedidos y el envío de los productos de AMD; la dependencia de AMD de la propiedad intelectual de terceros para diseñar e introducir nuevos productos en el momento oportuno; la dependencia de AMD de terceras empresas para el diseño, fabricación y suministro de placas base, software, memoria y otros componentes de plataformas informáticas; la dependencia de AMD del apoyo de Microsoft y otros proveedores de software para diseñar y desarrollar software que se ejecute en los productos de AMD; la dependencia de AMD de terceros distribuidores y socios de placas base; el impacto de la modificación o interrupción de los procesos empresariales internos y los sistemas de información de AMD; la compatibilidad de los productos de AMD con algunos o todos los programas y equipos estándar del sector; costos relacionados con productos defectuosos; eficiencia de la cadena de suministro de AMD; capacidad de AMD para confiar en funciones logísticas de la cadena de suministro de terceros; capacidad de AMD para controlar eficazmente las ventas de sus productos en el mercado gris; impacto de las acciones y normativas gubernamentales, como normativas de exportación, aranceles y medidas de protección comercial; la capacidad de AMD para realizar sus activos fiscales diferidos; los posibles pasivos fiscales; reclamaciones y litigios actuales y futuros; el impacto de las leyes medioambientales, las disposiciones conflictivas relacionadas con minerales y otras leyes o normativas; el impacto de adquisiciones, proyectos conjuntos y/o inversiones en los negocios de AMD y la capacidad de AMD para integrar los negocios adquiridos; el impacto de cualquier deterioro de los activos de la empresa combinada; las restricciones impuestas por los acuerdos que rigen los pagarés de AMD, las garantías de los pagarés de Xilinx y la línea de crédito renovable; el endeudamiento de AMD; la capacidad de AMD para generar suficiente efectivo para satisfacer sus necesidades de capital circulante o generar suficientes ingresos y flujo de caja operativo para realizar todas sus inversiones estratégicas o de R&D previstas; riesgos políticos, legales y económicos y desastres naturales; futuros deterioros de las compras de licencias tecnológicas; la capacidad de AMD para atraer y retener personal cualificado; y la volatilidad del precio de las acciones de AMD. Se insta a los inversionistas a revisar en detalle los riesgos e incertidumbres en los documentos presentados por AMD ante la Securities and Exchange Commission, incluidos, entre otros, los informes más recientes de AMD en los formularios 10-K y 10-Q.
[1] MI300-05A: Cálculos realizados por AMD Performance Labs al 17 de noviembre de 2023 para el acelerador AMD Instinct™ MI300X OAM de 750 W (192 GB HBM3) diseñado con la tecnología de proceso AMD CDNA™ 3 FinFet de 5 nm dieron como resultado una capacidad de memoria de 192 GB HBM3 y 5,325 TFLOPS alcanza el máximo rendimiento teórico del ancho de banda de la memoria.
La interfaz del bus de memoria MI300X es 8192 y la velocidad de datos de la memoria es de 5,2 Gbps para un ancho de banda de memoria máximo total de 5,325 TB/s (interfaz del bus de memoria de 8192 bits * velocidad de datos de la memoria de 5,2 Gbps/8).
Los resultados más altos publicados sobre el acelerador de GPU SXM NVidia Hopper H200 (141 GB) dieron como resultado una capacidad de memoria HBM3e de 141 GB y un rendimiento de ancho de banda de memoria de GPU de 4,8 TB/s.
Los resultados más altos publicados sobre el acelerador de GPU NVidia Hopper H100 (80 GB) SXM5 dieron como resultado una capacidad de memoria HBM3 de 80 GB y un rendimiento de ancho de banda de memoria de GPU de 3,35 TB/s.