Connect with us

Notizie

GPU di gioco NVIDIA Ada Lovelace ‘GeForce RTX 40’ dettagliata: raddoppio dei ROP, enorme cache L2 e 50% in più di unità FP32 rispetto ad Ampere, tensore di quarta generazione e core RT di terza generazione

GPU di gioco NVIDIA Ada Lovelace ‘GeForce RTX 40’ dettagliata: raddoppio dei ROP, enorme cache L2 e 50% in più di unità FP32 rispetto ad Ampere, tensore di quarta generazione e core RT di terza generazione

Sono stati rivelati i dettagli sulla GPU NVIDIA Ada Lovelace Gaming che alimenterà le schede grafiche della serie GeForce RTX 40. La nuova informazione viene da Kopte7kimi & parla del diagramma a blocchi dell’architettura di nuova generazione.

Diagramma a blocchi di NVIDIA GeForce Ada Lovelace GPU SM dettagliato: più grande e migliore che mai per i giocatori!

L’architettura della GPU NVIDIA Ada Lovelace non è più un mistero. Abbiamo appreso le configurazioni specifiche che alimenteranno le SKU della serie AD10* di prossima generazione per le schede grafiche GeForce RTX serie 40 e abbiamo anche visto trapelare le specifiche della gamma. Ora è il momento di parlare esclusivamente del chip grafico di prossima generazione stesso.

NVIDIA GeForce RTX 4090 ottiene 24 GB di memoria GDDR6X a 21 Gbps e 600 W TDP, RTX 4070 ottiene 12 GB di memoria GDDR6 a 18 Gbps e 300 W TDP

Diagramma a blocchi “SM” della GPU da gioco NVIDIA AD102 “Ada Lovelace” (Crediti immagine: Kopite7kimi):

Diagramma a blocchi “SM” della GPU da gioco NVIDIA GA102 “Ampere”:

A partire dalla configurazione della GPU, Kopite7kimi confronta la migliore GPU AD102 con varie altre GPU del team verde. Questi includono Ampere GA102 e Turing TU102 focalizzati sul gioco, mentre ci sono anche l’Hopper incentrato sull’HPC GH100 e Ampere GA100 aggiunti all’elenco. Confronterò solo l’AD102 con i suoi predecessori di gioco poiché i design incentrati sull’HPC sono molto diversi dalle offerte incentrate sul consumatore.

Aggiornamento dei prezzi delle GPU NVIDIA e AMD per maggio 2022: le schede grafiche GeForce ora superano il prezzo consigliato del 14%, Radeon supera il prezzo consigliato di appena il 6%

La GPU NVIDIA Ada Lovelace AD102 includerà fino a 12 GPC (Graphics Processing Clusters). Si tratta di un aumento del 70% rispetto a GA102 che presenta solo 7 GPC. Ogni GPU sarà composta da 6 TPC e 2 SM che è la stessa configurazione del chip esistente. Ogni SM (Streaming Multiprocessor) ospiterà quattro sub-core che è anche lo stesso della GPU GA102. Ciò che è cambiato è la configurazione principale di FP32 e INT32. Ogni sub-core includerà 128 unità FP32 ma le unità FP32+INT32 combinate saliranno a 192. Questo perché le unità FP32 non condividono lo stesso sub-core delle unità IN32. I 128 core FP32 sono separati dai 64 core INT32.

Quindi, in totale, ogni sub-core sarà composto da 128 unità FP32 più 64 unità INT32 per un totale di 192 unità. Ogni SM avrà un totale di 512 unità FP32 più 256 unità INT32 per un totale di 768 unità. E poiché ci sono un totale di 24 unità SM (2 per GPC), stiamo guardando a 12.288 unità FP32 e 6.144 unità INT32 per un totale di 18.432 core. Ogni SM includerà anche due Wrap Schedule (32 thread/CLK) per 64 wrap per SM. Si tratta di un aumento del 50% sui core (FP32+INT32) e del 33% in Wraps/Threads rispetto alla GPU GA102.

Specifiche della GPU NVIDIA Ada Lovelace “Preliminari”:

Nome GPUAD102GA102TU102GA100GH100
GPC12 (per GPU)1,7x2x1,5 volte1,5 volte
TPC6 (per GPC)StessoStesso0,75x0,67x
SM2 (per TPC)StessoStessoStessoStesso
Sottonucleo4 (per SM)StessoStessoStessoStesso
FP32128 (per SM)Stesso2x2xStesso
FP32+INT32192 (per SM)1,5 volte1,5 volte1,5 volteStesso
Orditi64 (per SM)1,33x2xStessoStesso
Fili2048 (per SM)1,33x2xStessoStesso
L1 cache192 KB (per SM)1,5 volte2xStesso0,75x
Cache L296 MB (per GPU)16x16x2,4x1,6x
ROP32 (per GPC)2x2x2x2x

Passando alla cache, questo è un altro segmento in cui NVIDIA ha dato un grande impulso rispetto alle GPU Ampere esistenti. Le GPU Ada Lovelace impacchettano 192 KB di cache L1 per SM, con un aumento del 50% rispetto ad Ampere. Si tratta di un totale di 4,5 MB di cache L1 sulla GPU AD102 superiore. La cache L2 verrà aumentata a 96 MB come menzionato nelle perdite. Si tratta di un aumento di 16 volte rispetto alla GPU Ampere che ospita solo 6 MB di cache L2. La cache verrà condivisa attraverso la GPU.

Infine, abbiamo i ROP, anch’essi aumentati a 32 per GPC, un aumento di 2 volte rispetto ad Ampere. Stai guardando fino a 384 ROP sull’ammiraglia di nuova generazione rispetto a soli 112 sulla GPU Ampere più veloce, l’RTX 3090 Ti. Ci saranno anche gli ultimi core Tensor di 4a generazione e RT (Raytracing) di 3a generazione infusi nelle GPU Ada Lovelace che aiuteranno a migliorare le prestazioni DLSS e Raytracing al livello successivo. Nel complesso, la GPU Ada Lovelace AD102 offrirà:

  • 2x GPC (contro Ampere)
  • 50% di core in più (rispetto ad Ampere)
  • 50% in più di cache L1 (rispetto ad Ampere)
  • 16 volte più cache L2 (rispetto ad Ampere)
  • Raddoppia i ROP (contro Ampere)
  • Tensor di quarta generazione e core RT di terza generazione

Si noti che le velocità di clock, che si dice siano comprese tra 2-3 GHz, non sono incluse nell’equazione, quindi svolgeranno anche un ruolo importante nel migliorare le prestazioni per core rispetto ad Ampere. Le schede grafiche della serie NVIDIA GeForce RTX 40 con le GPU di gioco Ada Lovelace di nuova generazione dovrebbero essere lanciate nella seconda metà del 2022 e si dice che utilizzino lo stesso nodo di processo TSMC 4N della GPU Hopper H100.

GPU NVIDIA CUDA (RUMORED) Preliminare:

GPUTU102GA102AD102
SKU di puntaRTX 2080 TiRTX 3090 TiRTX 4090?
ArchitetturaTuringAmpereAda Lovelace
ProcessiTSMC 12nm NFFSamsung 8nmTSMC 4N?
Dimensione del dado754 mm2628 mm2~600 mm2
Cluster di elaborazione grafica (GPC)6712
Cluster di elaborazione delle texture (TPC)364272
Multiprocessori in streaming (SM)7284144
Nuclei CUDA46081075218432
Cache L26 MB6 MB96 MB
TFLOP teorici16 TFLOP40 TFLOP~90 TFLOP?
Tipo di memoriaGDDR6GDDR6XGDDR6X
Capacità di memoria11 GB (2080 Ti)24 GB (3090 Ti)24 GB (4090?)
Velocità di memoria14 Gbps21 Gbps24 Gbps?
Banda di memoria616 GB/s1.008 GB/s1152 GB/s?
Bus di memoria384 bit384 bit384 bit
Interfaccia PCIePCIe Gen 3.0PCIe Gen 4.0PCIe Gen 4.0
TGP250 W350 W600 W?
LiberareSettembre 201820 settembre2H 2022 (da confermare)