Победитель по сводному баллу — L20 (быстрее на 36%).
Паритет, выбор зависит от доступности и конкретных задач по работе с памятью.
Загружается каталог…
L20 быстрее на 36% по сводному баллу.
Где обе карты находятся относительно референс-GPU разных тиров.
Сравнение по 5 component-баллам. Шкала 0-100, где 100 — лидер по этому сценарию во всей нашей базе.
Усреднённые результаты из публичных баз: PassMark, Geekbench Browser, 3DMark Hall of Fame.
| Параметр | A100XA100X | L20L20 |
|---|---|---|
| Архитектура | Ampere | Ada Lovelace |
| Чип | GA100 | AD102 |
| CUDA-ядра | 6 912 | 11 776 |
| RT-ядра | — | 92 |
| Tensor-ядра | 432 | 368 |
| ROPs | 160 | 128 |
| TMUs | 432 | 368 |
| Базовая частота | 795 МГц | 1 440 МГц |
| Boost-частота | 1 440 МГц | 2 520 МГц |
| FP32 пик | 19.91 TFLOPS | 59.35 TFLOPS |
| FP16 пик | 79.63 TFLOPS | 59.35 TFLOPS |
| Транзисторы | 54.2 млрд | 76.3 млрд |
| Площадь чипа | 826 мм² | 609 мм² |
| Техпроцесс | 7 нм | 5 нм |
| Дата выпуска | 2021-06-28 | 2023-11-16 |
| Параметр | A100XA100X | L20L20 |
|---|---|---|
| Объём | 80 ГБ | 48 ГБ |
| Тип | HBM2e | GDDR6 |
| Шина | 5 120 бит | 384 бит |
| Частота | 1 593 МГц | 2 250 МГц |
| Bandwidth | 2040 ГБ/с | 864 ГБ/с |
| L2 cache | 80 МБ | 96 МБ |
| Параметр | A100XA100X | L20L20 |
|---|---|---|
| TDP | 300 Вт | 275 Вт |
| Рекомендуемый БП | 700 Вт | 600 Вт |
| Разъём питания | 1x 16-pin | 1x 16-pin |
| Интерфейс | PCIe 4.0 x8 | PCIe 4.0 x16 |
| Длина | 267 мм | 267 мм |
| Слотов | 2 | 2 |
| HDMI | — | — |
| DisplayPort | — | 4× 1.4a |
| Параметр | A100XA100X | L20L20 |
|---|---|---|
| DirectX | — | 12.2 |
| Vulkan | — | 1.4 |
| OpenGL | — | 4.6 |
| OpenCL | 3.0 | 3.0 |
| CUDA | 8.0 | 8.9 |
| DLSS | да | да |
| FSR | — | — |
| XeSS | — | — |
| Resizable BAR | да | да |
A100X и L20 представляют разные подходы к вычислениям. A100X ориентирован на работу с огромными массивами данных благодаря 80 ГБ памяти стандарта HBM2e. Эта память обеспечивает колоссальную пропускную способность, которая критична для обучения нейросетей. Чип имеет 6912 ядер и потребляет 300 Вт. L20 — это решение с большим количеством вычислительных блоков. У него 11776 ядер, но память здесь медленнее. Вместо HBM2e используется 48 ГБ GDDR6. TDP у L20 составляет 275 Вт. Разница в общей производительности между картами составляет всего 2%. A100X выигрывает в задачах, где объем видеопамяти является узким местом. L20 лучше справляется с чистой математикой за счет большего числа ядер. Выбор между ними зависит от того, что важнее: пропускная способность шины или количество потоковых процессоров.
L20 лучше за счет большего количества ядер для отрисовки кадров.
Большое число ядер дает преимущество в частоте кадров на этом разрешении.
A100X выигрывает из-за 80 ГБ памяти, что позволяет запускать более тяжелые модели.
L20 быстрее в рендеринге за счет превосходства в количестве ядер.
L20 потребляет на 25 Вт меньше при более высокой производительности.
A100X предпочтительнее, так как объем памяти в 80 ГБ позволяет загружать веса моделей без квантования.
Проверьте блок питания. Несмотря на TDP 275 Вт, пиковые скачки нагрузки требуют качественного питания.
Да, обе карты рассчитаны на серверную продувку. Обычный корпус с пассивным охлаждением их не спасет.