微纳制造
服务信息网

中国人工智能:谁将填补空白?

2025-11-11

中美两国正就关税问题展开一场激烈的较量。而这背后是在科技尤其是人工智能的竞争。

美国生产全球顶尖的人工智能企业:英伟达、AMD、谷歌、AWS……等等。但美国担心中国可能将这些加速器用于军事用途,因此实施了严格的出口管制,导致中国只能获得次优的人工智能加速器。作为关税谈判的一部分,这些出口管制进一步收紧,至少目前来看,GPU的销售受到了限制。例如,字节跳动取消了与博通的人工智能加速器合同。

今年8月,中国政府规定数据中心使用的芯片中,50%必须为中国制造。看来中国认为自主研发人工智能芯片才是更好的选择。即便美国放宽对GPU的出口限制,这种情况也不太可能改变。

英伟达在中国的市场份额已跌至0%。黄仁勋最近表示,这每年给英伟达造成350亿美元甚至更多的损失。即使GPU出口恢复,美国GPU的销售额也可能仅限于50%。那么,谁将填补中国人工智能市场的空白?他们能否与英伟达匹敌?

我的结论是华为目前处于最佳位置;阿里巴巴百度紧随其后。由于中国晶圆代工、先进封装技术和高带宽内存(High Bandwidth Memory,HBM)等方面的限制,它们短期内很难与英伟达匹敌。但它们足以支撑GenAI在中国的发展。让我们深入探讨一下背后的原因。

中国在人工智能半导体领域实力雄厚,但并非领先者。

中国每年获得的电子工程博士毕业生人数超过美国,这还不包括在美国攻读博士学位的人(他们中的许多人现在都回国了)。中国大学的电子工程研究生教育质量仅次于美国大学。

中国是世界第二大经济体。中国在高科技的许多领域处于领先地位,并控制着电动汽车、电池、太阳能等许多关键技术的一半以上市场份额。

中国的电力基础设施发展迅速。中国的电力价格较低,是因为中国拥有全球最大的太阳能、水力、风能装机容量,并且对核电进行了大规模投资。如有需要,中国也会使用煤炭。《纽约时报》近期报道了连接中国西北部人口稀少地区和东部人口稠密地区的大型太阳能和风能设施的输电线路网络:中国拥有超过40条输电线路,总长度达2000英里,其输电量超过美国任何一条输电线路。

但在人工智能半导体领域,中国并非主要参与者。中国的晶圆代工厂和芯片公司落后于美国,尤其是在先进工艺节点、先进封装和人工智能加速器方面。要在先进工艺节点上迎头赶上,就需要像ASML步进式晶圆机这样的晶圆厂设备,而这些设备正受到美国的压力,后者限制先进技术的出口。此外,所有人工智能加速器的关键组件——高带宽内存(High Bandwidth Memory,HBM)——目前在中国还无法生产。

中国拥有一些实力强劲的新一代人工智能(GenAI)模型,例如Deepseek和Qwen(阿里巴巴旗下)。它们虽然落后于OpenAI和Anthropic,但差距并不大。如果中国半导体能够满足需求,新一代人工智能市场将拥有巨大的潜力。

中国主要的数据中心运营商有哪些?他们使用的是什么技术?

据《南华早报》报道,预计到2025年,中国人工智能数据中心的总资本支出将接近1000亿美元。这大约是美国人工智能资本支出的20%至25%(摩根士丹利估计,美国六大超大规模数据中心运营商到2025年将投资4300亿美元)。

根据数据中心动态公司的数据,中国最大的云服务提供商是阿里巴巴(33%)、华为(18%)和腾讯(10%)。

美国主要云服务提供商在中国几乎没有业务:

AWS 拥有两个独立于 AWS 全球基础设施运营的数据中心;

微软拥有由本地合作伙伴运营的数据中心,这些数据中心独立于 Azure 云平台。

谷歌云在中国大陆没有数据中心。

以下是近期中国数据中心投资和选定的AI芯片的详细信息(作为对比,AWS为Anthropic建设的数据中心是一个价值110亿美元的项目,目前运行着50万颗Trainium-2芯片,并计划在2026年扩展到100万颗Trainium-2芯片):

阿里云

  • 宣布计划在未来 3 年内投资 500 亿美元(MIT 技术评论)。
  • 使用其定制芯片来制造更小的 AI 模型(这类似于 Meta),其新的训练芯片 T-Head PPU(并行处理单元);以及一些寒武纪思源芯片。

华为云

  • 所有数据中心均采用华为昇腾AI加速器,并部署在CloudMatrix集群中。

腾讯云

  • 它采用了多种中国芯片,包括华为昇腾AI加速器和腾讯紫霄AI加速器用于推理。

字节跳动云

  • 投资 200 亿美元用于数据中心。
  • 订购了超过10万颗华为昇腾芯片。

百度云

  • 30,000 个用于培训的 P800 昆仑芯片集群(InfotechLead)。
  • 最近,百度昆仑被选中参与一个投资额超过1亿美元的项目。

中国移动

  • 20,000 张 AI 加速卡,85% 为中国产;很可能大部分是华为 Ascend 系列。

中国联通

  • 4亿美元的投资。
  • 目前有 23,000 个 AI 加速器正在运行;其中 72% 是阿里巴巴 T-Head 的加速器。

大多数数据中心都使用华为的设备;少数数据中心使用阿里巴巴和百度的设备。

中国主要的AI加速器公司有哪些?

华为似乎是取代英伟达的首选。预计到2025年,Ascend的产量将达到40万颗,并计划在2026年突破100万颗。最新的Ascend的推理性能约为英伟达H100的三分之二(数据来源:Data Center Dynamics)。华为之前使用台积电(TSMC)的芯片,但已转向中芯国际(SMIC)的7nm工艺。一个主要问题是,HBM内存来自韩国,而韩国受到出口管制。华为目前已储备了HBM内存,但为了维持产能,出口管制需要在2026年的某个时候放宽。华为似乎已经开发出定制的HBM内存,可能采用了中国长鑫存储技术有限公司(CXMT)的产品。

由于采用了全对全拓扑结构和全光纤(但非CPO)纵向扩展网络(来源:SemiAnalysis),使用昇腾910C的Cloud Matrix 384集群性能比Nvidia GB200 NVL72高出2倍(成本也更高)。这种互连方式支持比NVL72更大的pod规模,对于大型模型而言,足以弥补昇腾GPU性能上的不足。在相同吞吐量下,Cloud Matrix的功耗是GB200 NVL72的4倍。但在中国,电力成本更低且供应充足。因此,Cloud Matrix 384可以帮助中国数据中心大规模运行大型GenAI模型。Cloud Matrix 384在美国和欧洲电力供应有限的情况下无法与Nvidia竞争,但在电力供应充足的沙特阿拉伯和阿联酋,如果GPU供应短缺,它则有可能成为竞争对手。

在2025年9月华为全通大会上,华为公布了雄心勃勃的发展路线图,并承认在可预见的未来,中国晶圆代工厂在先进工艺节点方面仍将落后。他们的战略是基于SuperPod互连技术打造全新的计算架构。华为宣布将在未来三年内推出三个全新的Ascend芯片系列,这些芯片的性能将每年翻一番,并增强对低精度数据格式的支持,从而提高吞吐量/功耗比。此外,他们还将互连带宽以每年两倍甚至更高的速度提升。

这些新芯片将与 Atlas SuperPOD 配合使用,该 SuperPOD 可容纳 8192 颗 Ascend 芯片,并通过全光互连连接。该产品将于明年年底上市。更大的 SuperPOD 配备低延迟互连(华为尚未公布具体方案),可显著提升训练性能以及大型推理/智能体模型的性能。下一步是拥有超过 50 万个 AI 加速器的 Atlas 超级集群。华为的雄心壮志远不止于此。

他们还宣布未来将转向使用自主研发的HBM芯片,这种芯片成本更低,也更符合他们的需求。制造商似乎是国内厂商(CXMT或SMIC似乎是仅有的选择)。

华为并未透露其产品路线图在吞吐量/功耗方面与英伟达相比如何。他们正在改进架构,但由于必须使用落后的制程工艺,可能意味着他们在吞吐量/成本方面表现尚可,但在吞吐量/功耗方面则不尽如人意。当然,在中国,吞吐量/功耗并非那么重要。

阿里巴巴的T-Head似乎是替代英伟达显卡的第二选择。据报道,它的性能与英伟达的H2O显卡(《南华早报》)相当,均采用HBM2e显存。T-Head采用中芯国际7nm工艺制造,芯片间互连带宽高达700GB/s,在云栖大会上发布的搭载128颗AI芯片的攀九128超级节点机架中,这一带宽得到了充分体现。借助T-Head和HPN 8.0高性能横向扩展网络,阿里巴巴可以连接多达10万个GPU进行训练。

百度第三代7nm昆仑万维网处理器针对模型训练进行了优化,百度部署了一个由3万颗芯片组成的集群,据称可以训练超过1000亿个参数的模型。这些加速器通过XPU Link互连技术连接。

还有其他选择。腾讯是另一家拥有自主研发推理芯片——紫霄芯片的云服务提供商(CSP)。其他公司则并非云服务提供商,包括寒武纪、Iluvatar、Enflame、MetaX、Moore Threads 和 Biren。

中国的最终赢家可能由政治和市场力量共同决定。

中国的晶圆代工和HBM

中国最大的软肋在于无法获得台积电的供货,而台积电为英伟达、AMD、AWS 和谷歌等公司生产所有 GPU/XPU。此外,他们也无法获得为这些 GPU/XPU 提供支持的领先 HBM 供应商的供货。

中国在全球范围内唯一重要的晶圆代工厂是中芯国际(SMIC),预计到2025年第二季度市场份额为5%(Counterpoint)。台积电(TSMC)占据主导地位,市场份额为71%,三星为8%,联电为5%,Global为4%,其他厂商为8%。

中芯国际最先进的制程节点是7纳米,而台积电是2纳米;5纳米制程正在研发中,预计将于2026年推出。中芯国际落后两代,部分原因是其规模只有台积电的十分之一,研发能力无法与之匹敌,但更重要的是,它缺乏先进制程节点所需的ASML步进式光刻机。即使要达到7纳米制程,中芯国际也必须使用其现有的上一代步进式光刻机进行昂贵且缓慢的多重曝光。中国有一些公司在生产步进式光刻机,但没有一家能够接近ASML的先进制程节点能力。此外,中芯国际的先进封装能力和产能也远远落后于台积电。由于中国加速器厂商的市场份额直到最近还不到5%,而其中一些产品是由台积电和三星生产的,但由于美国的出口限制,这种情况已不复存在,中芯国际可能难以满足中国加速器厂商的需求。

中国还有其他晶圆代工厂,但没有先进的制程节点。华宏最先进的制程节点是28/22nm。

DRAM对于GenAI加速器至关重要。它必须采用HBM技术,才能实现内存和加速器在中间层上的耦合。目前中国领先的DRAM厂商是长鑫存储(CXMT),其HBM2已实现量产,HBM3计划于2026年推出,HBM3E计划于2027年推出。虽然长鑫存储落后于三星、SK海力士和美光等厂商,但HBM2/3足以构建具有相当竞争力的AI加速器。武汉新芯集成电路股份有限公司(XMC)是一家NOR/闪存厂商,目前正在努力提升其HBM产能。

中国的AI加速器目前无法与英伟达竞争,因为他们的晶圆代工厂和HBM供应商落后一到两代。但中芯国际和中芯国际有能力制造GenAI芯片,填补这一空白,并支持GenAI的快速增长——当然,成本和功耗也会更高。中国拥有巨大的潜力,因此随着时间的推移,他们或许能够发展出本土技术以与之竞争,但即便如此,也至少要等到2030年代。

这篇文章《China GenAI: Who Will Fill The Vacuum?》最初发表于 Semiconductor Engineering网站。

Share this on