Connect with us

Notizie

L’APU AMD Instinct MI300A con GPU CDNA 3, CPU Zen 4 e memoria unificata offre fino a 4 volte di velocità rispetto alle GPU discrete in HPC

L’APU AMD Instinct MI300A con GPU CDNA 3, CPU Zen 4 e memoria unificata offre fino a 4 volte di velocità rispetto alle GPU discrete in HPC

Le APU Instinct MI300A di AMD offrono un sostanziale miglioramento delle prestazioni nei carichi di lavoro HPC rispetto alle tradizionali GPU discrete.

Oltre alle GPU discrete, le APU Instinct MI300A di AMD potenziano i carichi di lavoro HPC con prestazioni fino a 4 volte superiori

L’AMD Instinct MI300A è la realizzazione della piattaforma “Exascale APU” realizzata anni fa. L’idea era quella di inserire una GPU ad alte prestazioni insieme a una CPU ad alte prestazioni nello stesso pacchetto che sfrutta un pool di memoria unificato. Per l’HPC, questi progetti di acceleratori/coprocessori offrono vantaggi in termini di prestazioni per watt più elevate, ma richiedono molte operazioni di porting, messa a punto e manutenzione di applicazioni con milioni di righe di codice, il che può essere un po’ complicato. Tuttavia, sembra che i ricercatori abbiano utilizzato due modelli di programmazione popolari, OpenMP e OpenACC, per sfruttare appieno il colosso APU di nuova generazione di AMD.

Per questo documento di ricerca, intitolato “Porting delle applicazioni HPC su AMD Instinct MI300A utilizzando Unified Memory e OpenMP“, viene utilizzato il framework OpenFOAM, che è una libreria C++ open source:

  • Forniamo un modello del modello di programmazione APU e dimostriamo la facilità e la flessibilità del porting dei codici su MI300A con OpenMP.
  • Elaboriamo il nostro metodo per l’accelerazione incrementale della produzione ampiamente utilizzato nel codice di settore: OpenFOAM.

Poiché l’acceleratore AMD Instinct MI300A utilizza un’interfaccia HBM unificata, elimina la necessità di replica dei dati e non richiede una distinzione di programmazione tra gli spazi di memoria dell’host e del dispositivo. Inoltre, la suite software ROCm di AMD fornisce ulteriori ottimizzazioni che aiutano a combinare tutti i segmenti dell’APU in un unico pacchetto coerente ed eterogeneo. Per riassumere brevemente le APU Instinct MI300A di AMD:

  • Primo pacchetto CPU+GPU integrato
  • Mirare al mercato dei supercomputer Exascale
  • AMD MI300A (CPU + GPU integrate)
  • 153 miliardi di transistor
  • Fino a 24 Zen 4 core
  • Architettura GPU CDNA 3
  • Fino a 192 GB di memoria HBM3
  • Fino a 8 chiplet + 8 stack di memoria (processo da 5 nm + 6 nm)
Fonte immagine: Aarxiv

Di conseguenza, le prestazioni ottengono un enorme vantaggio. Nella valutazione utilizzando il benchmark HPC per motociclette di OpenFOAM, l’APU AMD Instinct MI300A è stata testata rispetto alla GPU AMD Instinct MI210, NVIDIA A100 80 GB e NVIDIA H100 (80 GB). Le GPU AMD erano in esecuzione sullo stack ROCm 6.0 e le GPU NVIDIA erano in esecuzione sullo stack CUDA 12.2.2. Il benchmark è stato configurato per essere eseguito per 20 fasi temporali con il tempo medio di esecuzione per fase temporale (secondi) preso come figura di merito (FOM). Tutte e tre le configurazioni, oltre all’Instinct MI300A, utilizzavano una CPU discreta, quindi è stata configurata una CPU con socket con gestione della memoria eterogenea per consentire alle GPU di indirizzare la memoria di sistema ed eseguire il benchmark.

Venendo ai test, i risultati sono stati normalizzati per il sistema NVIDIA H100 che offriva le migliori prestazioni GPU discrete tra i tre chip discreti, ma l’APU Instinct MI300A ha ottenuto un guadagno 4x rispetto a NVIDIA H100 e un guadagno 5x rispetto all’acceleratore Instinct MI210. .

  • Sulle GPU, oltre il 65% del tempo viene impiegato nelle migrazioni delle pagine: aggiornamento delle tabelle GPU e copia dei dati tra host e dispositivo.
  • Sull’APU, la memoria fisica unificata condivisa tra i core della CPU e le unità di calcolo della GPU rimuove completamente il sovraccarico delle migrazioni delle pagine, con un conseguente aumento significativo delle prestazioni.
Fonte immagine: Aarxiv

È stato inoltre scoperto che l’AMD Instinct MI300A con un singolo pacchetto CPU Zen 4 era due volte più veloce di una CPU Zen 4 a socket singolo eseguita con una soluzione GPU discreta. Il sovraccarico dell’APU MI300A con più processi ha ulteriormente migliorato le prestazioni di 2 volte (test con 3-6 core CPU per APU), il che è molto migliore della mancanza di scalabilità su una configurazione dGPU+dCPU.

Di conseguenza, sembra che le capacità di calcolo dell’APU AMD Instinct MI300A non avranno eguali nel segmento HPC. NVIDIA ha fatto un passo indietro rispetto alle tradizionali prestazioni HPC nella sua gamma Blackwell di nuova generazione poiché l’intelligenza artificiale sembra essere la principale mania in questi giorni e mentre AMD affronterà questo problema con i suoi acceleratori MI300X e i suoi futuri aggiornamenti, sembra che il segmento HPC porterà AMD in evidenza.

Fonte della notizia: Nicola Malaya

Condividi questa storia

Facebook

Twitter