A40 PCIe vs H100 CNX

Победитель по сводному баллу — H100 CNX (быстрее на 124%).

vs
Поменять карты — альтернативы по соседнему рейтингу

Сводный балл

H100 CNX быстрее на 124% по сводному баллу.

Позиция в линейке

Где обе карты находятся относительно референс-GPU разных тиров.

По сценариям

Сравнение по 5 component-баллам. Шкала 0-100, где 100 — лидер по этому сценарию во всей нашей базе.

Гейминг −51%
18.6
38.1
AI-инференс −76%
13.5
56.2
3D-рендер −36%
25.8
40.6
Вычисления −46%
25.1
46.0
Энергоэффект. −43%
24.8
43.5
A40 PCIe H100 CNX

Плюсы и минусы

A40 PCIe

  • Производительность ниже на 55%
  • Энергопотребление ниже (300 Вт vs 350 Вт, на 14% экономнее)
  • Меньше видеопамяти (48 ГБ vs 80 ГБ)
  • Есть RT-ядра (84) для трассировки лучей

H100 CNX

  • Производительность выше на 124%
  • Энергопотребление выше (350 Вт vs 300 Вт)
  • Больше видеопамяти (80 ГБ vs 48 ГБ)
  • Выше пик FP32 (53.8 TFLOPS vs 37.4)

Чип и ядра

ПараметрA40 PCIeA40 PCIeH100 CNXH100 CNX
АрхитектураAmpereHopper
ЧипGA102GH100
CUDA-ядра10 75214 592
RT-ядра84
Tensor-ядра336456
ROPs11224
TMUs336456
Базовая частота1 305 МГц690 МГц
Boost-частота1 740 МГц1 845 МГц
FP32 пик37.42 TFLOPS53.84 TFLOPS
FP16 пик37.42 TFLOPS215.40 TFLOPS
Транзисторы28.3 млрд80.0 млрд
Площадь чипа628 мм²814 мм²
Техпроцесс8 нм5 нм
Дата выпуска2020-10-052023-03-21

Память

ПараметрA40 PCIeA40 PCIeH100 CNXH100 CNX
Объём48 ГБ80 ГБ
ТипGDDR6HBM2e
Шина384 бит5 120 бит
Частота1 812 МГц1 593 МГц
Bandwidth696 ГБ/с2040 ГБ/с
L2 cache6 МБ50 МБ

Питание и форм-фактор

ПараметрA40 PCIeA40 PCIeH100 CNXH100 CNX
TDP300 Вт350 Вт
Рекомендуемый БП700 Вт750 Вт
Разъём питания8-pin EPS8-pin EPS
ИнтерфейсPCIe 4.0 x16PCIe 5.0 x16
Длина267 мм267 мм
Слотов22
HDMI
DisplayPort3× 1.4a

Технологии и API

ПараметрA40 PCIeA40 PCIeH100 CNXH100 CNX
DirectX12.2
Vulkan1.4
OpenGL4.6
OpenCL3.03.0
CUDA8.69.0
DLSSда
FSR
XeSS
Resizable BARдада