Connect with us

Notizie

La GPU AMD Instinct MI200 CDNA 2 MCM è una bestia: clock da 1,7 GHz, 47,9 TFLOP FP64 e aumento di oltre 4 volte delle prestazioni FP64/BF16 rispetto a MI100

blank

Published

blank

L’ammiraglia di AMD Instinct MI200 è sull’orlo del lancio e sarà la prima GPU per il segmento HPC a presentare un design MCM basato sull’architettura CDNA 2. Sembra che la GPU offrirà alcuni numeri di prestazioni folli rispetto alla GPU Instinct MI100 esistente con un aumento di 4 volte nel calcolo FP16.

AMD Instinct MI200 con design GPU CDNA 2 MCM presto in arrivo su HPC, con numeri di prestazioni mostruosi e un aumento di calcolo 4x rispetto a Instinct MI100

Dobbiamo imparare le specifiche dell’acceleratore Instinct MI200 nel tempo, ma le sue prestazioni complessive sono rimaste un mistero fino ad ora. Insider e divulgatore di Twitter, ExecutableFix, ha condiviso le prime metriche delle prestazioni per l’acceleratore GPU MCM basato su CDNA 2 di AMD ed è una bestia.

AMD e Microsoft rilasciano patch ufficiali per errori di Windows 11 per risolvere i problemi di CPU Ryzen L3 e CCPC2

Secondo i tweet di ExecutableFix, AMD Instinct MI200 raggiungerà una velocità di clock fino a 1,7 GHz, con un aumento del 13% rispetto all’Instinct MI100. La GPU MCM alimentata da CDNA 2 offre anche quasi il doppio del numero di stream processor a 14.080 core, racchiusi in 220 unità di calcolo. Mentre ci si aspettava che la GPU avrebbe oscillato 240 unità di calcolo con 15.360 core, la configurazione è stata sostituita da una variante ridotta a causa dei rendimenti. Detto questo, è possibile che in futuro vedremo il lancio completo della SKU, offrendo prestazioni ancora più elevate.

In termini di prestazioni, l’acceleratore HPC AMD Instinct MI200 offrirà quasi 50 TFLOP (47,9) TFLOP di potenza di calcolo FP64 e FP32. contro il Istinto MI100, si tratta di un aumento di 4,16 volte nel segmento FP64. In effetti, i numeri FP64 dell’MI200 superano le prestazioni FP32 del suo predecessore. Passando ai numeri FP16 e BF16, stiamo osservando un folle 383 TFLOP di prestazioni. Per prospettiva, l’MI100 offre solo 92,3 TFLOP di prestazioni di picco BFloat16 e 184,6 TFLOP di prestazioni di picco FP16.

Si dice che le GPU AMD entry-level Navi 24 “RDNA 2” Radeon RX saranno lanciate nel primo trimestre, design Super-Clocked da 120 W rivolto a RTX 3050 Ti e Intel ARC

Come per HPCWire, AMD Instinct MI200 alimenterà tre supercomputer di alto livello che includono il sistema Exascale Frontier degli Stati Uniti; il sistema LUMI pre-esascala dell’Unione Europea; e il sistema australiano Setonix a petascala. La concorrenza include l’A100 da 80 GB che offre 19,5 TFLOP di FP64, 156 TFLOP di FP32 e 312 TFLOP di potenza di calcolo FP16. Ma probabilmente sentiremo parlare della GPU Hopper MCM di NVIDIA il prossimo anno, quindi ci sarà un’accesa competizione tra i due colossi delle GPU nel 2022.

Ecco cosa aspettarsi dall’acceleratore GPU AMD Instinct MI200 “CDNA 2”

All’interno dell’AMD Instinct MI200 c’è una GPU Aldebaran con due die, uno secondario e uno primario. Ha due die con ciascuno composto da 8 shader engine per un totale di 16 SE. Ogni Shader Engine racchiude 16 CU con FP64 full rate, FP32 imballato e un Matrix Engine di seconda generazione per operazioni FP16 e BF16. Ogni die, in quanto tale, è composto da 128 unità di calcolo o 8192 stream processor. Questo arrotonda fino a un totale di 220 unità di calcolo o 14.080 stream processor per l’intero chip. La GPU Aldebaran è inoltre alimentata da una nuova interconnessione XGMI. Ogni chiplet presenta un motore VCN 2.6 e il controller IO principale.

È stato visualizzato il diagramma a blocchi della GPU Aldebaran alimentata da CDNA 2 di AMD che alimenterà l’acceleratore HPC Instinct MI200. (Crediti immagine: Locuza)

Per quanto riguarda la DRAM, AMD ha scelto un’interfaccia a 8 canali composta da interfacce a 1024 bit per un’interfaccia bus wide a 8192 bit. Ogni interfaccia può supportare moduli DRAM HBM2e da ​​2 GB. Questo dovrebbe darci fino a 16 GB di capacità di memoria HBM2e per stack e poiché ci sono otto stack in totale, la quantità totale di capacità sarebbe di ben 128 GB. Sono 48 GB in più rispetto all’A100 che ospita 80 GB di memoria HBM2e. La visualizzazione completa della GPU Aldebaran sull’Instinct MI200 è disponibile qui.

Acceleratori AMD Radeon Instinct 2020

Nome acceleratore AMD Instinct MI300 AMD Instinct MI200 AMD Instinct MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
Architettura GPU TBA (CDNA 3) Aldebaran (CDNA 2) Arturo (CDNA 1) Vega 20 Vega 20 Vega 10 Figi XT Polare 10
Nodo processo GPU Nodo di processo avanzato Nodo di processo avanzato 7nm FinFET 7nm FinFET 7nm FinFET 14nm FinFET 28nm 14nm FinFET
GPU muore 4 (MCM)? 2 (MCM) 1 (monolitico) 1 (monolitico) 1 (monolitico) 1 (monolitico) 1 (monolitico) 1 (monolitico)
Core GPU 28.160? 14.080? 7680 4096 3840 4096 4096 2304
Velocità di clock della GPU TBA ~1700 MHz ~1500 MHz 1800 MHz 1725 MHz 1500 MHz 1000 MHz 1237 MHz
FP16 Calcolo TBA 383 TOP 185 TFLOP 29,5 TFLOP 26.5 TFLOP 24.6 TFLOP 8.2 TFLOP 5.7 TFLOP
FP32 Calcolo TBA 95.8 TFLOP 23.1 TFLOP 14.7 TFLOP 13.3 TFLOP 12.3 TFLOP 8.2 TFLOP 5.7 TFLOP
Elaborazione FP64 TBA 47.9 TFLOP 11.5 TFLOP 7.4 TFLOP 6.6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP
VRAM TBA 64/128 GB HBM2e? 32 GB HBM2 32 GB HBM2 16 GB HBM2 16 GB HBM2 HBM1 da 4 GB 16 GB GDDR5
Memoria orologio TBA TBA 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz
Bus di memoria TBA 8192 bit Bus a 4096 bit Bus a 4096 bit Bus a 4096 bit Bus a 2048 bit Bus a 4096 bit bus a 256 bit
Banda di memoria TBA ~2 TB/s? 1,23 TB/sec 1 TB/s 1 TB/s 484 GB/s 512 GB/s 224 GB/s
Fattore di forma TBA Doppio slot, lunghezza intera / OAM Doppio slot, lunghezza intera Doppio slot, lunghezza intera Doppio slot, lunghezza intera Doppio slot, lunghezza intera Doppio slot, mezza lunghezza Slot singolo, lunghezza intera
Raffreddamento TBA Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo
TDP TBA TBA 300W 300W 300W 300W 175W 150W