Кто сможет сломать доминировать Nvidia?

Кто сможет сломать доминировать Nvidia?

Сейчас Nvidia держит около 88% общемирового рынка вычислительной мощности под ИИ в расчете на FLOPS, но Китай быстро развивается, а в США наступают AMD, Google и Amazon.

Это не так просто – сейчас «голое» железо мало, что решает. Например, последнее поколение чипов AMD не так далеки от легендарных Blackwell, но выручка AMD – 32 млрд, а у Nvidia – 187 млрд с потенциалом выхода на 250-270 млрд.

Что здесь не так?

Nvidia контролирует всю архитектуру ИИ фабрики:

Вычислительные кластеры в полном стеке (GPU/CPU и вся сопряженная инфраструктура).

Интерконнект и высокоразвитая сетевая инфраструктура для взаимодействия чипов между собой, как «единый организм», как в рамках вычислительного кластера, так и по всем фермам/модулям, вплоть до целостной ИИ фабрики (NVLink/InfiniBand/Ethernet Spectrum-X).

DPU/контроль трафика (BlueField-4 и арм-платформы с NVLink Fusion) для связывания всей инфраструктуры в единую оболочку с минимальными задержками.

Программная экосистема на всех программных слоях (CUDA и связанные модули) через оптимизированные до совершенства драйвера, библиотеки, компиляторы, SDK, оптимизированный фрейморки, специализированный ИИ софт и т.д.

Любой серьёзный фреймворк (PyTorch, JAX, TensorFlow, Triton, множество MLOps-решений) первым делом оптимизируется под CUDA.

Вокруг CUDA сформирован многолетний человеческий капитал: университетские курсы, SDK, терабайты кода и тысячи готовых ИТ решений.

CUDA – это отраслевой стандарт, который позволяет работать ИИ чипам с предельной нагрузкой, а оптимизированное железо устраняет задержки в обмене данных. Так и формируется успех.

AMD с ROCm, всё ещё догоняет по зрелости и удобству, а CUDA держит преимущество и по производительности, и по экосистеме.

Это и есть ответ на вопрос, как сломать доминирование Nvidia – помимо чипов уровня Blackwell (даже по отдельности это произведение инженерного искусства), необходимы аналоги NVLink, Spectrum-X и высокоразвитая экосистема ИИ стека (от драйверов до готовых ИИ решений).

Миграция крупных кодовых баз с CUDA на ROCm/HIP – это масштабный инженерный и валидационный проект, который мало кто хочет финансировать в момент, когда у него очередь на GPU и горит задница перед венчурными инвесторами, вложившихся миллиардами в проекты на энтузиазме и без концепции монетизации. Очевидно, что все идут по «готовым путям» и по оптимизированной траектории.

AMD продаёт конкурентное железо, но экосистема и инструменты отстают, а для крупного заказчика именно они определяют риск и стоимость владения. Google и Amazon замкнуты сами на себя, а все остальные пока существуют больше на уровне прототипов.

Крупные игроки сидят на сотнях миллионах строк кода, собранных вокруг CUDA / NVIDIA Triton / TensorRT, на отлаженных MLOps-процессах, мониторинге, профилировании под Nvidia и связанной ИТ инфраструктуре. Нельзя просто так взять и перейти без ущерба для производительности и эффективности.

Что предлагает AMD? Мы вам отличные чипы, но … соберите и настройте их сами, которые нужно долго собирать в «единое целое», проигрывая в итоге по межпроцессорному взаимодействию для ИИ решений, написанных на плохо оптимизированной инфраструктуре ROCm. При этом мы не гарантируем, что через 3 года не перепишем архитектуру и вам не придется заново оптимизировать код под новые библиотеки. С вас $1 млрд за чипы.

Что предлагает Nvidia? Мы вам с нуля построим ИИ-фабрику, все подключим, откалибруем, настроим и оптимизируем, а с вас $45 млрд за 1ГВт мощностей.

С точки зрения крупного дата-центр архитектора преимущество здесь у того, кто закрывает всю архитектуру и её эволюцию, а не один слой.

Чтобы сломать Nvidia, необходимо:

• Догнать не только по FLOPS/HBM, но и по ИИ и ИТ экосистеме;

• Жестко демпинговать для завоевания клиентской базы и воспитания поколения разработчиков;

• Выстроить сетевую и системную историю хотя бы на уровне партнёрств;

• Профинансировать массовую миграцию экосистемы (буквально, когда инженеры AMD сами будут «пилить» код).

Надеюсь, понятно объяснил логику доминирования Nvidia?

Источник: Telegram-канал "Spydell_finance"

Топ

Лента новостей