Карты равны по производительности — разница менее 0.5%. Различаются по сценариям и характеристикам.
Паритет по чистой производительности, поэтому выбор зависит от типа вашей инфраструктуры: PCIe для стандартных серверов или SXM4 для специализированных суперкомпьютерных узлов.
Загружается каталог…
Где обе карты находятся относительно референс-GPU разных тиров.
Сравнение по 5 component-баллам. Шкала 0-100, где 100 — лидер по этому сценарию во всей нашей базе.
Усреднённые результаты из публичных баз: PassMark, Geekbench Browser, 3DMark Hall of Fame.
| Параметр | A100 PCIe 40 GBA100 PCIe | A100 SXM4 40 GBA100 SXM4 |
|---|---|---|
| Архитектура | Ampere | Ampere |
| Чип | GA100 | GA100 |
| CUDA-ядра | 6 912 | 6 912 |
| RT-ядра | — | — |
| Tensor-ядра | 432 | 432 |
| ROPs | 160 | 160 |
| TMUs | 432 | 432 |
| Базовая частота | 765 МГц | 1 095 МГц |
| Boost-частота | 1 410 МГц | 1 410 МГц |
| FP32 пик | 19.49 TFLOPS | 19.49 TFLOPS |
| FP16 пик | 77.97 TFLOPS | 77.97 TFLOPS |
| Транзисторы | 54.2 млрд | 54.2 млрд |
| Площадь чипа | 826 мм² | 826 мм² |
| Техпроцесс | 7 нм | 7 нм |
| Дата выпуска | 2020-06-22 | 2020-05-14 |
| Параметр | A100 PCIe 40 GBA100 PCIe | A100 SXM4 40 GBA100 SXM4 |
|---|---|---|
| Объём | 40 ГБ | 40 ГБ |
| Тип | HBM2e | HBM2e |
| Шина | 5 120 бит | 5 120 бит |
| Частота | 1 215 МГц | 1 215 МГц |
| Bandwidth | 1560 ГБ/с | 1560 ГБ/с |
| L2 cache | 40 МБ | 40 МБ |
| Параметр | A100 PCIe 40 GBA100 PCIe | A100 SXM4 40 GBA100 SXM4 |
|---|---|---|
| TDP | 250 Вт | 400 Вт |
| Рекомендуемый БП | 600 Вт | 800 Вт |
| Разъём питания | 8-pin EPS | — |
| Интерфейс | PCIe 4.0 x16 | PCIe 4.0 x16 |
| Длина | 267 мм | — |
| Слотов | 2 | — |
| HDMI | — | — |
| DisplayPort | — | — |
| Параметр | A100 PCIe 40 GBA100 PCIe | A100 SXM4 40 GBA100 SXM4 |
|---|---|---|
| DirectX | — | — |
| Vulkan | — | — |
| OpenGL | — | — |
| OpenCL | 3.0 | 3.0 |
| CUDA | 8.0 | 8.0 |
| DLSS | да | да |
| FSR | — | — |
| XeSS | — | — |
| Resizable BAR | да | да |
NVIDIA A100 базируется на архитектуре Ampere и стала фундаментом для обучения нейросетей в начале 2020-х. Обе версии, PCIe и SXM4, используют 6912 ядер CUDA и 40 ГБ памяти HBM2e. Разница кроется не в вычислительной мощности, а в способе подключения и питании. Модель PCIe устанавливается в обычные слоты расширения и имеет лимит потребления 250 Вт. Она работает через стандартный интерфейс PCI Express. Версия SXM4 требует специальной материнской платы с разъемами HGX. Этот форм-фактор позволяет подавать до 400 Вт энергии на чип. Высокий TDP помогает поддерживать стабильные частоты при длительных нагрузках. В задачах, где важна плотность вычислений, SXM4 обходит PCIe за счет лучшего охлаждения и пропускной способности шины между картами. Однако для сборки рабочего места на базе существующего сервера лучше подойдет PCIe-версия.
Обе карты не предназначены для игр, так как не имеют видеовыходов.
Использование этих чипов в играх бессмысленно из-за отсутствия драйверов и интерфейсов вывода.
SXM4 лучше подходит для крупных LLM за счет более эффективного взаимодействия карт в связке.
В рендеринге Blender или V-Ray производительность идентична из-за одинакового числа ядер.
PCIe версия потребляет на 37% меньше энергии при той же вычислительной мощности.
Если вы строите свой сервер с нуля, берите SXM4. Если нужно доукомплектовать готовый сервер — PCIe.
Нет, для этой карты нужна специализированная платформа HGX и мощное питание.
При 250 Вт стандартного серверного обдува достаточно, но корпус должен иметь хороший поток воздуха.