A100 PCIe 40 GB vs L4

Победитель по сводному баллу — A100 PCIe 40 GB (быстрее на 68%).

vs
Поменять карты — альтернативы по соседнему рейтингу

Сводный балл

A100 PCIe 40 GB быстрее на 68% по сводному баллу.

Позиция в линейке

Где обе карты находятся относительно референс-GPU разных тиров.

По сценариям

Сравнение по 5 component-баллам. Шкала 0-100, где 100 — лидер по этому сценарию во всей нашей базе.

Гейминг +37%
8.3
6.1
AI-инференс +172%
23.7
8.7
3D-рендер
6.8
6.9
Вычисления
6.1
5.8
Энергоэффект. −61%
19.1
48.4
A100 PCIe 40 GB L4

Плюсы и минусы

A100 PCIe 40 GB

  • Производительность выше на 68%
  • Энергопотребление выше (250 Вт vs 72 Вт)
  • Больше видеопамяти (40 ГБ vs 24 ГБ)

L4

  • Производительность ниже на 40%
  • Энергопотребление ниже (72 Вт vs 250 Вт, на 71% экономнее)
  • Меньше видеопамяти (24 ГБ vs 40 ГБ)
  • Есть RT-ядра (60) для трассировки лучей
  • Выше пик FP32 (30.3 TFLOPS vs 19.5)

Реальные бенчмарки

Усреднённые результаты из публичных баз: PassMark, Geekbench Browser, 3DMark Hall of Fame.

Geekbench 6 OpenCL +27%
A100 PCIe
178 627
L4
141 113
Geekbench 6 Vulkan +22%
A100 PCIe
146 380
L4
119 711
PassMark G3D Mark
A100 PCIe
L4
10 153

Чип и ядра

ПараметрA100 PCIe 40 GBA100 PCIeL4L4
АрхитектураAmpereAda Lovelace
ЧипGA100AD104
CUDA-ядра6 9127 424
RT-ядра60
Tensor-ядра432240
ROPs16080
TMUs432240
Базовая частота765 МГц795 МГц
Boost-частота1 410 МГц2 040 МГц
FP32 пик19.49 TFLOPS30.29 TFLOPS
FP16 пик77.97 TFLOPS30.29 TFLOPS
Транзисторы54.2 млрд35.8 млрд
Площадь чипа826 мм²294 мм²
Техпроцесс7 нм5 нм
Дата выпуска2020-06-222023-03-21

Память

ПараметрA100 PCIe 40 GBA100 PCIeL4L4
Объём40 ГБ24 ГБ
ТипHBM2eGDDR6
Шина5 120 бит192 бит
Частота1 215 МГц1 563 МГц
Bandwidth1560 ГБ/с300 ГБ/с
L2 cache40 МБ48 МБ

Питание и форм-фактор

ПараметрA100 PCIe 40 GBA100 PCIeL4L4
TDP250 Вт72 Вт
Рекомендуемый БП600 Вт250 Вт
Разъём питания8-pin EPS
ИнтерфейсPCIe 4.0 x16PCIe 4.0 x16
Длина267 мм169 мм
Слотов21
HDMI
DisplayPort

Технологии и API

ПараметрA100 PCIe 40 GBA100 PCIeL4L4
DirectX12.2
Vulkan1.4
OpenGL4.6
OpenCL3.03.0
CUDA8.08.9
DLSSдада
FSR
XeSS
Resizable BARдада