动态精准为美国提供了一种更智能的方法,既可以减缓中国人工智能的攀升,又能让开发者与美国的生态系统和标准紧密相连。
来源:国家利益(National Interest)2025年8月22日
作者:杨建利
译者:Fred
DeepSeek的迅速崛起——以及随之而来的跌宕起伏——鲜明地表明,如今中美人工智能(AI)竞争的焦点更多地在于生态系统和标准,而非单一某个芯片。今年早些时候,DeepSeek凭借一个开源权重推理模型震惊了业界,该模型在开源社区引发了一波复制和变体浪潮。但当该公司转向训练其后续模型 R2时,却遭遇了地缘政治的严峻考验:美国的出口规则和供应限制拖延了项目进度,而北京方面力推国内领军企业采用华为昇腾处理器,进一步加剧了项目的拖延。这一事件并非个例,而是一场更大的战略竞争,即哪种全栈(硬件、软件和开发工具)将成为中国乃至整个发展中国家的默认体系。如果华盛顿方面采取粗暴的、断断续续的禁令作为回应,则可能会加速中国对自主全栈的追求。相反,如果美国采取动态精准控制——根据技术指标和市场现实情况进行有针对性的控制——则可能会减缓北京方面的爬升,削弱其完全自给自足的决心,并扩大全球对美国主导标准的采用。
DeepSeek的冲击及其放缓的真正原因
今年1月,DeepSeek的 R1在排行榜和社交媒体上爆红,标志着“开源权重”推理模型可以高效训练,并被其他人复现。几天之内,独立团队就发布了 R1方法的完全开放复现版本,将该模型的影响力扩展到远远超出了其最初的实验室范围。重点并非单一架构的新颖性,而是发布可用权重的传播优势——这与许多美国供应商青睐的“封闭权重、仅限应用程序编程接口(API)”模型截然相反。这种传播为真正的竞争奠定了基础:每个人会基于谁的全栈进行构建?
然而,到了夏天,DeepSeek推迟了 R2的发布。报道称,推迟发布的原因包括美国出口规则以及在华为昇腾芯片上进行大规模训练的难度—— 中共当局出于主权和控制方面的考虑,一直鼓励国内人工智能公司采用这种硬件。8月,《金融时报》总结称,DeepSeek在这些限制因素的影响下“推迟”了 R2的开发。而行业追踪者则描述了更广泛的趋势:中国最大的实验室被迫依赖华为硬件,即使开发工具和吞吐量仍然对英伟达有利。这种摩擦正是需要战略的原因。
北京对英伟达的双轨制立场:形象和激励
过去两个月,北京看似矛盾的立场变得更明确了。在华盛顿于7月允许恢复向中国出口英伟达降级的 H20芯片后,中国监管机构迅速发出了谨慎信号。7月31日,中国国家互联网信息办公室召集英伟达,调查 H20芯片涉嫌“后门”风险,官方媒体也敦促企业避免使用该芯片。英伟达则断然否认存在任何后门,并重申 H20并非为军事或政府基础设施设计。与此同时,中国工信部还单独向领先的互联网平台施压,要求它们在采购方面做出选择,这进一步加大了国内采购的政治压力。表面上是出于安全考虑,但其根本目标是培育一个本土控制的技术栈,即使这会损害性能或缩短上市时间。
华盛顿自身的立场也随之转变。今年5月,美国商务部曾短暂告知跨国公司,在全球任何地方使用华为的人工智能芯片都可能触犯美国出口法。这一笼统的解读立即引发了强烈反对,并在几周内进行了修订。随后,在7月和8月,美国政府允许英伟达和AMD恢复对华部分销售,但条件是,双方必须签署出口许可证,并向美国政府支付其在华销售额的15%分成。无论如何评判其优劣,这些快速的转变凸显了在快速变化的市场中,僵硬的“开启或关闭”管控措施为何难以奏效。
全栈之争的真正意义
新闻头条的背后是一场技术应用竞赛。英伟达的芯片与其统一计算架构(CUDA,一种专有的编程模型)紧密绑定,同时还配套有深度优化的 PyTorch构建版本、容器镜像、驱动程序和软件库。这种全栈锁定是 CUDA自2006年首次亮相以来近二十年投入的结晶,也是 Nvidia持久优势的核心支柱。对于中国 AI开发者来说,选择英伟达通常意味着选择 CUDA;这也意味着受益于其在模型工具和推理框架方面最丰富的第三方生态系统。华为的昇腾生态系统——神经网络计算架构(CANN)、MindSpore以及不断增长的 PyTorch兼容层——已经快速改进,但仍然需要迁移工作、团队再培训,有时为了应对尖端的训练工作负载,以单位美元计量的吞吐量也会有所降低。正因如此,即使在没有政治压力的情况下,许多中国实验室仍然更愿意在英伟达上进行训练。
北京深知这一点,因此政府在民族主义的劝诫与选择性打击之间摇摆不定。其目标不仅是购买中国产品,更要确保中国的生态系统尽快发展到足够完善的水平,以避免长期依赖美国标准。这一战略与习*近*平在科技领域“自力更生、自强不息”的号召以及像东方数据、西部计算这样的基础设施项目完美契合,这些项目为自主的AI全栈构建了电网、数据中心和网络基础。“扩散优先”的方法——开放权重、快速部署公共服务,以及将人工智能与数字基础设施出口捆绑在一起——有助于中国AI全栈在其顶级训练性能赶超美国之前就已在“一带一路”市场推广。
静态禁令为何适得其反——以及动态精准度如何?
对于追求不断变化的性能的领域,全面禁令或放任不管并非明智之举。自2022年10月以来,美国的管控措施越来越多地与技术指标(计算密度、互连带宽、内存和系统规模)挂钩,因为这些参数与训练前沿模型和大规模推理密切相关。2025年1月的修订则更进一步,校准了训练最先进权重所需计算能力的阈值,并解决了超出单个芯片范围的模型扩散风险。这种框架为动态精准策略奠定了良好的基础。
最佳策略是动态精准:允许并鼓励销售性能足以超越中国本土硬件的芯片,以确保中国开发者能够继续使用美国平台。同时,此类出口应保持在足够低的水平,以保持与美国开发者可用的硬件系统之间的显著性能差距,使美国领先中国一到两代。
在实践中,动态精准意味着三件事。
首先,持续更新与可测的性能相关的阈值:集群可用的每秒有效浮点运算次数(FLOP)、实现高效并行的互连特性,以及支持大上下文推理的高带宽内存(HBM)容量。阈值应随着前沿技术的发展而变化,并设置通知期,以最大程度地减少对盟友的冲击,同时不留任何套利空间。其目的并非将中国冻结在琥珀中——这是不可能的——而是在最重要的环节减缓其发展速度。
其次,生态系统意识。将中国开发者从英伟达转移到华为的控制措施最终会加速北京的自主架构。相比之下,允许降级的、经过严格审核的英伟达部件进入中国的商业(非国有)云平台——并结合禁止军事或关键基础设施使用的许可条件——可以将中国开发者限制在 CUDA/PyTorch的轨道内。即使原芯片仍然落后一到两代,这也保留了美国在标准、文档和工具方面的影响力。英伟达的 H20事件以及北京内部对于是否回避该事件的分歧就是一个缩影。
第三,出口管制应与全球扩散相协调。问题不仅在于“什么不能进入中国”,还在于“世界其他国家会采用什么”。如果美国的技术栈无法进入增长最快的市场,它就无法在生态系统竞争中获胜。正因如此,新的美欧贸易安排——将采购承诺(包括400亿美元的人工智能芯片采购承诺)与采用与美国兼容的安全标准以避免技术泄露结合起来——具有战略重要性。它将盟友的需求与兼容的规则联系起来,为美国的技术栈创造了一个更大的安全市场。美国也应该与日本、韩国、台湾以及中东和东南亚的主要合作伙伴建立类似的框架。
预测和管理真正的风险
有两个反对意见值得认真回应。首先,恢复向中国销售合规的英伟达部件可能会暴露敏感代码或带来后门风险。在这里,记录至关重要。当中国网络空间监管机构就H20芯片发出“后门”警报时,英伟达公开否认存在此类能力,并重申其销往中国的芯片是为商业市场设计的,而非国家或军事用途。华盛顿完全可以、也应当将透明且可验证的保证作为任何许可的条件,但那种笼统地暗示商用部件被秘密武器化的说法,尚无证据支持。有验证支撑的精确控制比谣言更能保障安全。
第二个反对意见是,任何对华销售都只是为华为和其他国内龙头企业释放国内资本。这部分是正确的——这也是强调任何获得许可的出口都要降低性能和严格限制最终用途,并积极打击走私的另一个原因。今年夏天,美国对非法向中国运送H100级部件的美国走私者的起诉,凸显了黑市的规模。静态禁令会滋生灰色市场泄漏;而智能门槛加上积极的执法则限制了这种泄漏。
北京的愿望和担忧
从北京的角度来看,这种逻辑显而易见。国家愿意承受短期性能损失,以构建一个自主的全栈并改写其相关规则。正因如此,“自力更生”才成为科技政策的主导理念,也正因如此,国家计算基础设施项目与开放式权重模型的推广以及国家支持的医疗、教育和公共安全领域的部署相辅相成。与此同时,中国企业和研究人员仍然重视吞吐量、开发者的人体工程学和产品上市时间——而英伟达的生态系统在这些领域保持领先地位。就连华为的创始人也承认,在单芯片层面至少还存在一代的差距,不过因为集群级工程技术有所弥补。美国采取的动态精准战略,让中国开发者在限制高端能力的同时,也不得不绕开美国技术栈的轨道,这正中北京的核心痛点:在制定规则时依赖外部标准。
打造“射击移动目标”的作战能力
将出口管制视为一个动态系统,而非年度规则制定,需要进行运营变革。商务部及其跨部门合作伙伴应建立技术监督平台——一个每周跟踪前沿模型训练运行、值得关注的扩展实验、互连架构和软件突破的分析单元。其职责是基于经验能力而非传言或滞后的指标,及时建议阈值调整和许可条件。由于计算效率和软件层(编译器、图形优化器、推理运行时环境)可以替代原始硅片,因此该监督平台必须包括软件工程师和模型系统研究人员,而不仅仅是硬件专家。2023年和2025年的规则确立了一项原则,即管制措施取决于系统的功能;现在,美国必须建立反应能力,随着前沿技术的变化而更新这些阈值。
精心设计的跨国行动
最后,这不能是单边行动。美国应继续将合作伙伴的采购转化为政策:越多的盟国政府和云服务提供商预先承诺使用与美国兼容的技术栈(并筛查数据泄漏到令人担忧的目的地),动态精准性就越可行。欧盟协议展示了如何将市场创造与安全标准相结合;美国应与英国、七国集团合作伙伴以及服务定义实际计算访问的领先云服务提供商探索类似的协议。与此同时,华盛顿应支持中国以外的开源权重研究——资助共享模型安全测试平台、开放评估套件以及在美国硬件上蓬勃发展的工具。目标是将全球创新能量保持在一个与规则兼容的生态系统内,同时缩小在敌对控制下复制尖端技术的渠道。
前进的道路
DeepSeek的策略曲线——开源权重冲击、试图转向国产芯片以及延迟——不应被解读为昙花一现。它是下一阶段竞争的模板:中国将容忍短期摩擦以实现长期主权;美国必须容忍短期的复杂性,才能保持长期的生态系统领导地位。静态禁令或一刀切的放松都无法切中要害。动态精准——按节奏更新的可衡量阈值、保持美国开发者技术栈重心的许可以及符合可互操作安全标准的联盟采购——才是华盛顿减缓北京推进、阻止其完全自给自足并扩大美国规则和标准范围的方法。
在一个模型、编译器和互连技术在每个季度都会重塑分母的领域,没有终点线。但必须保持优势并制定标准。要做到这一点,就意味着要将出口管制视为方向盘,而不是一堵墙——一个随着道路转向而调整的方向盘,它可以让世界各地的开发者,无论是选择还是设计,都沿着美国努力铺设的道路前进。
关于作者:杨建利博士
杨建利博士是哈佛大学肯尼迪政府学院的研究员。他是中国公民力量倡议的创始人和主席,也是《为了我们,活着:照亮真理的旅程》和《是时候建立一个基于价值观的“经济北约”了》的作者。