На каких ИИ чипах «обучается» Китай?

24 ноября 2025, 16:04

На каких ИИ чипах «обучается» Китай?

То, к чему Китай подошел к концу 2025 – это 8 лет гиперинтенсивных усилий всей китайской экономики и государственной машины, работающих заодно, высочайшей китайской дисциплины и нацеленности на достижения задачи с инвестициями в сотни миллиардов долларов.

«Принцип 10 лет», который был заложен в 2017 году для преодоления технологического отставания от ведущих стран, вероятно, не будет реализован в 2027 году, хотя отставание интенсивно сокращается, но до лидирующих позиций добраться будет невероятно сложно.

Долгосрочно – разумно ставить на Китай, но тактически – доминирование США все еще прочно.

Ранее описывал пять фундаментальных ограничений от развитых стран: литография EUV, ультрабыстрая память HBM3e и следующие поколения, интегрирование компонентов CoWoS, интерконнект уровня NVlink от Nvidia (даже AMD минимум вдвое отстает и на 3 года) и программная экосистема, как на низком уровне (драйвера, компиляторы и библиотеки), так и на высоком уровне (программы проектирования и ИТ-сервис).

Ставлю на то, что первое, что преодолеет Китай – интегрирование компонентов, далее попробует унифицировать стандарты, чтобы не плодить зоопарк библиотек, а с памятью, GPU и сетевым взаимодействием еще много работы.

Проблемы с памятью Китай закрывает теневыми поставками, а с GPU и интерконнектом все намного сложнее.

Верифицируемых и достоверных данных о китайских ИИ чипах мало – все нюансы и технологии находятся под грифом секретно и охраняются китайским государством возможно даже сильнее, чем военные и политические «секреты».

Для Китая, полупроводники и ИИ – это государственный приоритет номер 1, но все же некоторая информация есть.

• Сейчас самый передовой ИИ чип в Китае – это Huawei Ascend 910B/910C, при этом с середины 2025 Ascend 910C (7 нм, 64–128 GB HBM2e/HBM3, производительность до 600-800 TFLOPS при FP16) станет основным ИИ-чипом для китайских компаний вместо Nvidia.

•Biren BR100 (7 нм, 64 GB HBM2e, до 500-700 TFLOPS);

•Cambricon MLU590 (7 нм, 48 GB LPDDR5, до 400-500 TFLOPS);

•Baidu Kunlun P800 (7 нм, 32 GB HBM2e, до 350-400 TFLOPS) активно развертывается с 1кв25 и используется для обучения моделей уровня DeepSeek;

•Moore Threads MTT S4000 (7 нм, 48 GB GDDR6, до 100-150 TFLOPS);

•Iluvatar CoreX TianGai-100 (7 нм, 32 GB HBM2, до 100-150 TFLOPS).

Сейчас топовая производительность одного чипа B200 (Blackwell) до 2300 TFLOPS (примерно в 3.5 раза быстрее, чем Ascend 910C) при пропускной способности памяти 8 ТБ/с (сейчас лучшие китайские чипы дают 2-2.5 ТБ/с, а избранные, почти штучные партии Ascend 910C на чипах HBM3 дают 3.2 ТБ/с) при интерконнекте NVlink 5 на уровне 1.8 ТБ/с у Nvidia, тогда как Huawei имеет втрое ниже через интерконнект HCCS (Huawei Cache Coherent System).

Таким образом, самый топовый китайский чип примерно в три раза отстает от самого топового американского чипа.

А что такое производительность 150 TFLOPS? Это экспортные урезанные версии чипов Nvidia H20 и Intel Gaudi 3. Вот именно поэтому Китаю не смысла покупать американские чипы, т.к. Moore Threads MTT S4000 и Iluvatar CoreX TianGai-100 дают сопоставимую производительность, хотя при более медленной памяти, а интегральная производительность Baidu Kunlun P800 или Biren BR100 / BR200 уже точно выше урезанных американских чипов.

Что такое производительность около 500 TFLOPS в флагманских китайских чипах – это половина производительности от Nvidia H100 (SXM) – флагман 2023-2024 при пропускной способности памяти до 3.7 ТБ/с и интерконнекте NVlink 4 на уровне 0.9 ТБ/с.

По номинальным (заявленным) характеристикам схожий интерконнект имеет архитектурный шедевр Biren BR100 BLink, но «убитый» санкциями и не производится массово.

0.9 ТБ/с у Biren BLink существуют только в теории на заводах TSMC (запрет на производство), а в китайских версиях реально около половины.

• Таким образом, китайский пик производительности GPU – 700-800 TFLOPS vs 2200 TFLOPS;

• Память – 2.2-3.2 ТБ/с vs 8 ТБ/с в США;

• Интерконнект – 0.6 ТБ/с vs 1.8 ТБ/с в США.

Схожее межпроцессорное взаимодействие у последнего чипа от AMD.

Источник: Telegram-канал "Spydell_finance"

Топ

Марат Баширов: Мифы о "Ёлке". Миф 1. "Ёлка" не может нести боевую часть (БЧ)

Мифы о "Ёлке"Миф 1. "Ёлка" не может нести боевую часть (БЧ).Факт. "Ёлка" может нести боевую часть (один из вариантов расположения БЧ - на фото).Некоторое количество оборудованных БЧ "Ёлок" из числа первых партий уже применялись в зоне СВО.По...