A100 SXM4 80 GB vs A40 PCIe

Победитель по сводному баллу — A100 SXM4 80 GB (быстрее на 18%).

vs
Поменять карты — альтернативы по соседнему рейтингу

Сводный балл

A100 SXM4 80 GB быстрее на 18% по сводному баллу.

Позиция в линейке

Где обе карты находятся относительно референс-GPU разных тиров.

По сценариям

Сравнение по 5 component-баллам. Шкала 0-100, где 100 — лидер по этому сценарию во всей нашей базе.

Гейминг +15%
21.5
18.6
AI-инференс +110%
28.4
13.5
3D-рендер −17%
21.4
25.8
Вычисления −12%
21.9
25.1
Энергоэффект. −14%
21.4
24.8
A100 SXM4 80 GB A40 PCIe

Плюсы и минусы

A100 SXM4 80 GB

  • Производительность выше на 18%
  • Энергопотребление выше (400 Вт vs 300 Вт)
  • Больше видеопамяти (80 ГБ vs 48 ГБ)

A40 PCIe

  • Производительность ниже на 15%
  • Энергопотребление ниже (300 Вт vs 400 Вт, на 25% экономнее)
  • Меньше видеопамяти (48 ГБ vs 80 ГБ)
  • Есть RT-ядра (84) для трассировки лучей
  • Выше пик FP32 (37.4 TFLOPS vs 19.5)

Реальные бенчмарки

Усреднённые результаты из публичных баз: PassMark, Geekbench Browser, 3DMark Hall of Fame.

Geekbench 6 OpenCL
A100 SXM4
205 180
A40 PCIe
Geekbench 6 Vulkan
A100 SXM4
183 725
A40 PCIe

Чип и ядра

ПараметрA100 SXM4 80 GBA100 SXM4A40 PCIeA40 PCIe
АрхитектураAmpereAmpere
ЧипGA100GA102
CUDA-ядра6 91210 752
RT-ядра84
Tensor-ядра432336
ROPs160112
TMUs432336
Базовая частота1 275 МГц1 305 МГц
Boost-частота1 410 МГц1 740 МГц
FP32 пик19.49 TFLOPS37.42 TFLOPS
FP16 пик77.97 TFLOPS37.42 TFLOPS
Транзисторы54.2 млрд28.3 млрд
Площадь чипа826 мм²628 мм²
Техпроцесс7 нм8 нм
Дата выпуска2020-11-162020-10-05

Память

ПараметрA100 SXM4 80 GBA100 SXM4A40 PCIeA40 PCIe
Объём80 ГБ48 ГБ
ТипHBM2eGDDR6
Шина5 120 бит384 бит
Частота1 593 МГц1 812 МГц
Bandwidth2040 ГБ/с696 ГБ/с
L2 cache40 МБ6 МБ

Питание и форм-фактор

ПараметрA100 SXM4 80 GBA100 SXM4A40 PCIeA40 PCIe
TDP400 Вт300 Вт
Рекомендуемый БП800 Вт700 Вт
Разъём питания8-pin EPS
ИнтерфейсPCIe 4.0 x16PCIe 4.0 x16
Длина267 мм
Слотов2
HDMI
DisplayPort3× 1.4a

Технологии и API

ПараметрA100 SXM4 80 GBA100 SXM4A40 PCIeA40 PCIe
DirectX12.2
Vulkan1.4
OpenGL4.6
OpenCL3.03.0
CUDA8.08.6
DLSSдада
FSR
XeSS
Resizable BARдада