На каких ИИ чипах «обучается» Китай?
То, к чему Китай подошел к концу 2025 – это 8 лет гиперинтенсивных усилий всей китайской экономики и государственной машины, работающих заодно, высочайшей китайской дисциплины и нацеленности на достижения задачи с инвестициями в сотни миллиардов долларов.
«Принцип 10 лет», который был заложен в 2017 году для преодоления технологического отставания от ведущих стран, вероятно, не будет реализован в 2027 году, хотя отставание интенсивно сокращается, но до лидирующих позиций добраться будет невероятно сложно.
Долгосрочно – разумно ставить на Китай, но тактически – доминирование США все еще прочно.
Ранее описывал пять фундаментальных ограничений от развитых стран: литография EUV, ультрабыстрая память HBM3e и следующие поколения, интегрирование компонентов CoWoS, интерконнект уровня NVlink от Nvidia (даже AMD минимум вдвое отстает и на 3 года) и программная экосистема, как на низком уровне (драйвера, компиляторы и библиотеки), так и на высоком уровне (программы проектирования и ИТ-сервис).
Ставлю на то, что первое, что преодолеет Китай – интегрирование компонентов, далее попробует унифицировать стандарты, чтобы не плодить зоопарк библиотек, а с памятью, GPU и сетевым взаимодействием еще много работы.
Проблемы с памятью Китай закрывает теневыми поставками, а с GPU и интерконнектом все намного сложнее.
Верифицируемых и достоверных данных о китайских ИИ чипах мало – все нюансы и технологии находятся под грифом секретно и охраняются китайским государством возможно даже сильнее, чем военные и политические «секреты».
Для Китая, полупроводники и ИИ – это государственный приоритет номер 1, но все же некоторая информация есть.
• Сейчас самый передовой ИИ чип в Китае – это Huawei Ascend 910B/910C, при этом с середины 2025 Ascend 910C (7 нм, 64–128 GB HBM2e/HBM3, производительность до 600-800 TFLOPS при FP16) станет основным ИИ-чипом для китайских компаний вместо Nvidia.
•Biren BR100 (7 нм, 64 GB HBM2e, до 500-700 TFLOPS);
•Cambricon MLU590 (7 нм, 48 GB LPDDR5, до 400-500 TFLOPS);
•Baidu Kunlun P800 (7 нм, 32 GB HBM2e, до 350-400 TFLOPS) активно развертывается с 1кв25 и используется для обучения моделей уровня DeepSeek;
•Moore Threads MTT S4000 (7 нм, 48 GB GDDR6, до 100-150 TFLOPS);
•Iluvatar CoreX TianGai-100 (7 нм, 32 GB HBM2, до 100-150 TFLOPS).
Сейчас топовая производительность одного чипа B200 (Blackwell) до 2300 TFLOPS (примерно в 3.5 раза быстрее, чем Ascend 910C) при пропускной способности памяти 8 ТБ/с (сейчас лучшие китайские чипы дают 2-2.5 ТБ/с, а избранные, почти штучные партии Ascend 910C на чипах HBM3 дают 3.2 ТБ/с) при интерконнекте NVlink 5 на уровне 1.8 ТБ/с у Nvidia, тогда как Huawei имеет втрое ниже через интерконнект HCCS (Huawei Cache Coherent System).
Таким образом, самый топовый китайский чип примерно в три раза отстает от самого топового американского чипа.
А что такое производительность 150 TFLOPS? Это экспортные урезанные версии чипов Nvidia H20 и Intel Gaudi 3. Вот именно поэтому Китаю не смысла покупать американские чипы, т.к. Moore Threads MTT S4000 и Iluvatar CoreX TianGai-100 дают сопоставимую производительность, хотя при более медленной памяти, а интегральная производительность Baidu Kunlun P800 или Biren BR100 / BR200 уже точно выше урезанных американских чипов.
Что такое производительность около 500 TFLOPS в флагманских китайских чипах – это половина производительности от Nvidia H100 (SXM) – флагман 2023-2024 при пропускной способности памяти до 3.7 ТБ/с и интерконнекте NVlink 4 на уровне 0.9 ТБ/с.
По номинальным (заявленным) характеристикам схожий интерконнект имеет архитектурный шедевр Biren BR100 BLink, но «убитый» санкциями и не производится массово.
0.9 ТБ/с у Biren BLink существуют только в теории на заводах TSMC (запрет на производство), а в китайских версиях реально около половины.
• Таким образом, китайский пик производительности GPU – 700-800 TFLOPS vs 2200 TFLOPS;
• Память – 2.2-3.2 ТБ/с vs 8 ТБ/с в США;
• Интерконнект – 0.6 ТБ/с vs 1.8 ТБ/с в США.
Схожее межпроцессорное взаимодействие у последнего чипа от AMD.






































