22. března zveřejnila Nvidia pouze rendery 4nm GPU GH100 / akcelerátoru H100, takže na snímky skutečného hardwaru padlo NDA až nyní. Možnost vyfotit vzorek reálný akcelerátor dostaly redakce webů ServeTheHome a CNet:
Nvidia H100, zadni strana; zdroj: ServeTheHome
Patrick J Kennedy ze ServeTheHome (jehož snímky vidíte výše) měl možnost kartu (modul) vyfotit již 7. dubna; svolení k publikaci však Nvidia dala až nyní v květnu.
zdroj: CNet
Na SXM modulu nejsou patrné žádné zvláštnosti, snad jen stojí za pozornost, že oproti Ampere došlo k pootočení GPU o 90°, takže trojice HBM pamětí z každé strany jádra je orientována „podélně“ k delší stran.
AMD MI250X | AMD MI300 | NVIDIA Tesla V100 | NVIDIA A100 | NVIDIA H100 | ||
---|---|---|---|---|---|---|
Grafikkarte | Aldebaran | Riegel | GV100 | GA100 | GH100 | |
Architektur | cDNA 2 | cDNA 3 | Volta | Ampere | Trichter | |
Format | OAM | OAM | SXM2 | SXM4 | SXM5 | |
CU/SM | 220 | ? | 80 | 108 | 132 | |
FP32 Jader | 14080 | ? | 5120 | 6912 | 15872 16896 | |
FP64 Jader | – | – | 2560 | 3456 | 8448 | |
INT32 Jader | – | – | 5120 | 6912 | 8448 | |
Tensor-Kerne | 880 | ? | 640 | 432 | 528 | |
Takt | 1700 MHz | ? | 1530MHz | 1410MHz | ? | |
↓↓↓ T(FL)OPS ↓↓↓ | ||||||
FP16 | 383 | ? | 31,4 | 78 | 120 | |
BF16 | 383 | ? | ![]() | 39 | 120 | |
FP32 | 95,7 47,8 | ? | 15,7 | 19,5 | 60 | |
FP64 | 47,8 | ? | 7,8 | 9,7 | 30 | |
INT4 | 383 | ? | ? | ? | ? | |
INT8 | 383 | ? | ? | ? | ? | |
INT16 | ? | ? | ? | ? | ? | |
INT32 | ? | ? | 15,7 | 19,5 | 30 | |
FP8-Tensor | ![]() | ? | ![]() | ![]() | 2000/4000* | |
FP16-Tensor | 383 | ? | 125 | 312/624* | 1000/2000* | |
BF16-Tensor | 383 | ? | ![]() | 312/624* | 1000/2000* | |
FP32-Tensor | 95,7 | ? | ![]() | 19,5 | 60? | |
TF32-Tensor | ![]() | ? | ![]() | 156/312* | 500/1000* | |
FP64-Tensor | 95,7 | ? | ![]() | 19,5 | 60 | |
INT8-Tensor | 383 | ? | ![]() | 624/1248* | 2000/4000* | |
INT4-Tensor | ? | ? | ![]() | 1248/2496* | ? | |
↑↑↑ T(FL)OPS ↑↑↑ | ||||||
TMU | –? | ? | 320 | 432 | 528 | |
GMBH | 16MB | ? | 6MB | 40MB | 50MB | |
sbernice | 8192bit | ? | 4096bit | 5120bit | 5120bit | |
paměť | 128GB | 128GB | 32 GB / 16 GB | 40GB | 80GB | 80GB |
HBM | 3,2 GHz | ? | 1.755 GHz | 2,43 GHz | 3,2 GHz | 4,8 GHz |
pam. Stütze. | 3277 GB/s | ? | 900GB/Sek | 1555 GB/s | 2048 GB/s | 3072 GB/s |
TDP | 500 W 560 W | ? | 300 W | 400 W | 700 W | |
Transistor | 58,2 mld. | ? | 21,1 mld. | 54,2 mld. | 80 ml. | |
plocha-GPU | 2× ? | 4× ? | 815 mm² | 826mm² | 814 mm² | |
Prozesse | 6 nm | 5nm | 12 nm | 7 nm | 4nm | |
Datum | 11. 2021 | 2022? | 2017 | 5. 2020 | 11. 2020 | 2022? |
Podle informací z doby březnového představení nemá být novinka dostupná v prvním pololetí letošního roku. V Japonsku se objevila možnost preedobjednávek PCIe-Variante (o 20 % nižší počet funkčních bloků, HBM2E namísto HBM3) za $33 000.
Source: Diit.cz by diit.cz.
*The article has been translated based on the content of Diit.cz by diit.cz. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!
*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.
*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!