Procesor graficzny NVIDIA Ampere A100 250 W TDP na PCIe 4.0 Stworzony dla sztucznej inteligencji, nauki o danych i superkomputerów wprowadzony na rynek z obiecaną 90-procentową wydajnością modelu 400 W

Sprzęt komputerowy / Procesor graficzny NVIDIA Ampere A100 250 W TDP na PCIe 4.0 Stworzony dla sztucznej inteligencji, nauki o danych i superkomputerów wprowadzony na rynek z obiecaną 90-procentową wydajnością modelu 400 W 2 minuty czytania

Nvidia



Firma NVIDIA oficjalnie wprowadziła na rynek A100, procesor graficzny zgodny ze standardem PCIe 4.0 oparty na architekturze Ampere nowej generacji. Pomimo niższego profilu 250 W TDP, NVIDIA obiecuje, że GPU PCIe 4.0 Ampere A100 będzie w stanie zaoferować do 90 procent wydajności pełnego 400W A100 HGX GPU. Trzeci wariant rosnącej rodziny procesorów graficznych Ampere A100, A100 PCIe, jest przeznaczony dla serwerów z klastrami sztucznej inteligencji (AI), nauki o danych i superkomputerów.

NVIDIA ujawniła wersję PCI-Express 4.0 GPU A100. Procesor graficzny oparty jest na mikroarchitekturze Ampere 7 nm. Ponadto firma ogłosiła również kilka systemów opartych na A100 wiodących producentów serwerów, w tym Asus, Dell, Cisco, Lenovo i innych. Akcelerator GPU 250 W A100 PCIe 4.0 jest dość podobny do pełnego wariantu 400 W TDP, a NVIDIA również obiecuje prawie identyczną wydajność pomimo znacznego spadku profilu TDP.



Procesor graficzny NVIDIA A100 Ampere w formacie PCIe 4.0 z taką samą konfiguracją GPU 400 W A100 HGX, ale przy 250 W:

NVIDIA ogłosiła wprowadzenie akceleratora GPU PCIe 4.0 A100 PCIe. Procesor graficzny Ampere jest dostępny dla różnorodnych zastosowań przemysłowych z systemami od pojedynczego procesora graficznego A100 PCIe po serwery wykorzystujące dwie karty w tym samym czasie przez 12 kanałów NVLINK, które zapewniają łączną przepustowość połączenia międzysieciowego 600 GB / s. Akcelerator GPU 250 W TDP A100 PCIe nie zmienia się zbytnio pod względem konfiguracji rdzenia w porównaniu z GPU 400 W A100 HGX.



GPU GA100 ma specyfikacje wariantu A100 HGX 400 W z 6912 rdzeniami CUDA rozmieszczonymi w 108 jednostkach SM, 432 rdzeniami Tensor i 40 GB pamięci HBM2, która zapewnia taką samą przepustowość pamięci 1,55 TB / s (zaokrągloną do 1,6 TB / s). Jednak wdrożenie pakietu GPU na platformie Standard PCIe 4.0 miał swoją wadę polegającą na znacznym zmniejszeniu TDP. Podobno oznacza to od 10 do 50 procent spadku wydajności w zależności od obciążenia. Co więcej, wariant 250 W TDP GPU A100 jest bardziej przystosowany do krótkich serii niż do ciągłego obciążenia.

Procesor graficzny NVIDIA A100 Ampere w formacie PCIe 4.0 Wydajność:

Ze względu na znaczne zmniejszenie profilu TDP można było założyć, że karta będzie miała niższe zegary, aby skompensować mniejsze wejście TDP. Jednak wskaźniki wydajności, które opublikowała firma NVIDIA, są naprawdę zaskakujące, ponieważ zbliżają się do wariantu 400W TDP. Wydajność FP64 jest nadal oceniana na 9,7 / 19,5 TFLOP, wydajność FP32 jest oceniana na 19,5 / 156/312 TFLOP (Sparsity), FP16 jest oceniana na 312/624 TFLOP (Sparsity), a INT8 jest oceniana na 624/1248 TOP ( Rzadkość).



Prosta matematyka wskazuje, i NVIDIA zapewnia, że ​​oparty na Ampere procesor graficzny PCIe 4.0 250 W A100 może zapewnić 90 procent wydajności karty A100 HGX (400 W) w najpopularniejszych aplikacjach serwerowych. Jest to uzasadnione, ponieważ nowy wariant zajmuje mniej czasu, aby wykonać powyższe zadania. Jednak liczby powinny obowiązywać tylko w krótkich odstępach czasu. W złożonych sytuacjach, które wymagają trwałych możliwości GPU, GPU 250 W PCIe 4.0 może zapewnić od 90% do 50% wydajności 400 W A100 HGX.

Mikroarchitektura Ampere z pewnością przyniesie korzyści nowemu A100. NVIDIA obiecuje co najmniej 20-krotny wzrost wydajności w stosunku do poprzednika opartego na Volcie. Procesor graficzny PCIe 4.0 A100 obsługuje technologię wielu instancji GPU. Oznacza to, że pojedynczy procesor A100 można podzielić na nawet siedem oddzielnych procesorów graficznych w celu obsługi różnych zadań obliczeniowych. Chociaż zwiększa to segmentację, istnieje NVLink trzeciej generacji, który umożliwia połączenie kilku procesorów graficznych w jeden gigantyczny GPU.

Tagi nvidia