AMD AMD Instinct MI355X

288 ГБ · 2025
Сервер

AMD Instinct MI355X — это специализированный ускоритель на архитектуре CDNA 4 для работы с огромными весами моделей. Памяти здесь запредельно много: 288 ГБ HBM3e. Шина составляет 8192 бит, что дает пропускную способность в районе 8.5 ТБ/с. Карта не предназначена для игр или рендеринга. Она создана исключительно под инференс и обучение LLM. В 2026 году в бюджетном сегменте серверных решений ей будет тяжело из-за специфики софта. Основной конкурент — NVIDIA H200, который выигрывает за счет экосистемы CUDA. Также стоит смотреть на Intel Gaudi 3, если нужен более дешевый вход в AI-вычисления. Потребление энергии здесь колоссальное. TDP достигает 750 Вт. Обычный системный блок не потянет такую нагрузку без серверного шасси и специализированного охлаждения. Это железка для дата-центров. Она работает только через интерфейс Infinity Fabric или PCIe Gen5 в правильных конфигурациях. Если вы планируете запускать Llama 3 70B или Qwen 2.5 72B, объем памяти станет решающим фактором. Большинство потребительских карт задохнутся на этапе загрузки весов. MI355X позволяет держать такие модели целиком в VRAM без использования медленного системного RAM. Это критично для скорости ответа (tokens per second). Но приготовьтесь к боли с настройкой ROCm вместо привычного CUDA.

Производительность по сценариям

5 component-баллов — сильные стороны и слабости карты в разных задачах.

Шкала 0-100. Топовая карта в каждом сценарии = 100. Кликни строку — увидишь полный топ-100 в этой категории. Подробнее — методика.

Характеристики

Чип

Частоты

Память

Объём
288 ГБ

Питание и форм-фактор

Выходы и интерфейс

Интерфейс
PCIe 5.0 ×16 (OAM)

API и технологии

Соседи по рейтингу

Под какие задачи подходит

Балл 1-10 для каждого сценария — пригодность именно для этой задачи (не общий perf-rank).

4K-гейминг 1 / 10

Карта не имеет видеовыходов и драйверов для игр.

1440p 1 / 10

Использовать невозможно.

1080p 1 / 10

Бессмысленно.

AI-инференс 9 / 10

Идеально для локальных LLM вроде Llama 3 70B благодаря 288 ГБ памяти.

AI-обучение 7 / 10

Подходит для fine-tuning больших моделей, если есть инфраструктура.

3D-рендер 1 / 10

Нет поддержки ускорения через CUDA или OptiX.

Видеомонтаж 1 / 10

Аппаратные декодеры для видеомонтажа отсутствуют.

Офис 1 / 10

Не подходит даже для вывода изображения на монитор.

Стоит ли покупать в 2026?

Брать MI355X в 2026 году стоит только под конкретную задачу по инференсу. Если ваша цель — запуск тяжелых LLM локально, объем памяти оправдывает всё. Она обходит потребительские RTX 4090 по объему VRAM в три раза. Однако в плане скорости работы с библиотеками NVIDIA всё еще впереди. Покупать её для домашних нужд — ошибка. Вам понадобится серверная стойка и мощный блок питания. Для сравнения, прошлое поколение MI300X имело меньше памяти и медленнее шину. Новая архитектура CDNA 4 дает прирост в вычислениях FP8. Если бюджет ограничен, посмотрите на б/у решения прошлых лет или специализированные китайские ускорители. Они могут быть дешевле, хотя и проигрывают в стабильности софта. MI355X — это инструмент для инженеров, а не для обычных пользователей. Не ждите от неё универсальности. Она умеет только одно: перемалывать веса нейросетей в огромных объемах.

Обновлено редакцией: 2026-05-17.

Плюсы и минусы

Сильные стороны

  • 288 ГБ сверхбыстрой памяти HBM3e
  • Пропускная способность 8.5 ТБ/с
  • Поддержка FP8 и FP4 для инференса
  • Огромный объем VRAM для LLM

Слабые стороны

  • TDP 750 Вт требует серверного питания
  • Отсутствие видеовыходов и игровых драйверов
  • Сложность настройки софта под ROCm
  • Требуется специализированное охлаждение

Часто задаваемые вопросы

Можно ли запустить на ней Stable Diffusion?

Да, через ROCm можно запускать SDXL или Flux.1. Однако из-за специфики архитектуры настройка окружения займет несколько часов. Вам придется вручную компилировать некоторые расширения под конкретные ядра CDNA 4.

Подойдет ли обычный БП на 1000 Вт?

Теоретически хватит, но есть нюанс. Карта потребляет 750 Вт в пике, и скачки тока могут вызвать срабатывание защиты. Лучше использовать серверные блоки питания с поддержкой стандарта 12VHPWR или специализированных разъемов для ускорителей.

Чем она лучше RTX 6000 Ada?

У MI355X почти в три раза больше памяти. RTX 6000 Ada имеет 48 ГБ, что мало для современных моделей уровня 70B+. Если модель не влезает в VRAM, скорость падает в десятки раз.

Как запустить Llama 3 70B?

Модель весит около 40 ГБ в квантовании 4-bit. На MI355X она займет лишь малую часть памяти, что позволит использовать огромные контекстные окна. Это даст высокую скорость генерации текста без задержек.