华泰证券——大模型后训练：中美路径与商业闭环

点击次数：136 发布日期：2025-12-12 13:16

华泰证券最近发布了一份重磅报告《大模型后训练：中美路径与商业闭环》，这份深度研究揭示了一个深刻的事实：中美两国的大模型竞赛已经走到了一个关键的分岔口。这不是简单的技术追赶故事，而是一场因资源禀赋差异导致的根本性路径分化。当所有人都在盯着模型排行榜上的分数高低时，华泰证券的研究团队看到了更本质的东西——算力结构正在重塑全球AI产业的竞争格局。

一、核心结论：算力决定路径，生态定义未来

第一，中美大模型的差异并非技术强弱，而是算力结构决定的路线选择。海外依托高密度集群深化后训练与推理扩展，国内在算力约束下以架构优化追求单台算力效率。

第二，AI应用大规模落地的转折点正在逼近。电商等高频率垂类已具备先行条件，OpenAI打造的“统一模型+Pulse+ACP”生态闭环将AI从“能用”推进到“可经营”。

第三，数据标注的重要性被系统性低估。高质量的标注数据是模型能力上限的关键投入，这个行业正迎来需求扩张和定价权抬升的双重利好。

二、Scaling Law 2.0时代：中美走上不同道路

Scaling Law的演进逻辑

要理解当前的竞争格局，首先要理解Scaling Law的演变：

Scaling Law 1.0时代：主要关注预训练阶段。通过同步放大模型参数、数据量和算力来实现性能提升，核心是“大力出奇迹”。Scaling Law 2.0时代（以2024年9月OpenAI发布o系列为标志）：重点转向后训练与推理端。强化学习被系统性地引入后训练流程，模型在推理阶段可以通过消耗更多算力（延长思考时间、生成更多Token）来释放复杂能力。

现在的逻辑已经演变为 “预训练 → 后训练 → 推理”的全链路扩展。在这个新阶段，中美选择了不同的实现路径。

美国路径：算力的“暴力美学”

美国公司的最大优势在于算力基础设施。以xAI为例，其依托约20万卡级别的Colossus大规模集群进行训练，能够在后训练环节持续投入巨量算力。

xAI的Grok系列完美诠释了Scaling Law的演进：

Grok 2到Grok 3：预训练算力扩大约10倍（Scaling Law 1.0）Grok 3到Grok 4：后训练算力再扩大约10倍（Scaling Law 2.0）Grok 4.1：后训练强化学习规模比Grok 4又扩大了一个数量级

这种路径的核心是 “只要有足够的算力，就能持续提升模型性能”。OpenAI虽然没有公布具体数据，但从其规划的超过36GW的算力中心（“Stargate”项目）来看，同样在沿着这条路径前进。

中国路径：架构创新的“效率革命”

相比之下，中国面临的是高性能算力供给受限的现实。据报告引用，受美国出口限制影响，NVIDIA在中国先进芯片市场的份额已从95%降至接近0。

在这种约束下，中国厂商无法简单复制美国的规模扩展模式，转而走上了一条 “单位算力效率最大化”的技术路径，在架构和算法层面进行深度创新：

1. 阿里Qwen3-Next：混合注意力机制的突破

引入“75%线性注意力+25%传统注意力”的混合机制80B总参数中仅激活约3B，激活率仅3.7%MoE专家数量扩大至512个（前代的两倍）

2. DeepSeek V3.2：动态稀疏注意力的效率跃升

核心创新是DSA（动态稀疏注意力）架构通过“先粗筛、后精算”的双阶段机制，将长上下文计算复杂度从O(L²)降至O(Lk)API输入成本下降约50%，输出成本下降约75%

3. Kimi K2：Scaling规律的验证与优化

验证了在激活参数不变的情况下，单纯提升MoE总参数量仍符合Scaling规律减少注意力头数量，优化路由器设计，以更低成本实现相当的效果

这些创新有一个共同特点：在算力受限的条件下，通过架构层面的“精耕细作”，实现在性能基本持平前提下的效率大幅提升。

三、商业化生态：OpenAI构建的新范式

AI应用大规模落地的转折点正在逼近，而OpenAI已经构建了完整的商业化生态。

OpenAI的三级火箭：从技术到商业的闭环

第一级：统一模型底座GPT-5确立了“统一系统”的方向，在一个框架内整合了快速响应模型（Instant）和深度思考模型（Thinking），通过路由器动态调度，平衡速度与深度。这解决了底层能力的一致性问题。

第二级：主动智能体（Pulse）Pulse让AI从被动问答工具转变为能进行异步推理、主动分析的智能体。

这意味着：

算力需求从“交互次数”驱动转向“持续在线的智能体数量”驱动AI可以在用户离线时持续工作，生成个性化内容为个性化推荐、数字助理等场景打开了新空间

第三级：交易闭环（ACP）这是最关键的一步。OpenAI与Stripe合作推出的Agentic Commerce Protocol（ACP），在对话场景内实现了即时支付功能。

用户可以在ChatGPT内直接完成购物，无需跳转首批接入Shopify、Etsy等电商平台后续扩展到Salesforce、Walmart等多类应用

生态系统的爆炸式增长

OpenAI的生态系统正在以前所未有的速度扩张：

用户增长：ChatGPT周活用户达8亿

开发者生态：从2023年的200万开发者增长到2025年的400万API调用量：从每分钟3亿Token激增至60亿Token合作伙伴：从算力端的微软、AMD、Oracle，到应用端的Shopify、Salesforce、Walmart，形成了完整的软硬件朋友圈

据The Information数据，OpenAI已将2030年营收预期上调至约2000亿美元，收入结构从订阅/API扩展至Agent与新产品。

中国的商业化路径：2B先行，生态追赶

相比之下，中国的商业化路径有所不同：

1. 2B成为主战场报告指出，国内2C商业化（尤其是AI原生应用）稍慢于海外，因此企业级（2B）成为大厂的主要选择。阿里云百炼平台过去一年模型日均调用量增长约15倍，阿里云FY26Q1云业务收入增速达25.8%，反映出强劲的B端需求。

2. 应用层的差异化突破

智谱AutoGLM：在Agent应用层占据先机，实现了从操作手机/电脑到“云端常驻执行”的进阶，在设备操控智能体领域展现全球级领先能力。

阿里千问APP：以All-in-One形态进军C端AI入口，试图打造统一的AI交互框架。

3. 多模态生成的领先优势在文生图、文生视频、图生视频、TTS等领域，腾讯、字节、快手、MiniMax等国内厂商位居全球排行榜前列，尤其在视频生成方面展现出系统性优势。

四、被低估的关键环节：数据标注的价值重估

市场普遍认为数据标注技术含量低、价值有限，但报告用数据证明了这个观点是错误的。

数据标注公司的高增长与高价值

Scale AI：

收入从2022年2.5亿美元升至2023年7.6亿美元、2024年8.7亿美元2025年6月，Meta以143亿美元收购其49%股权，对应估值约290亿美元

Surge AI：

2024年营收超过10亿美元并实现盈利单笔合同与客单价多在八位数至九位数美元区间计划进行首轮融资，估值可能从150亿美元提升至250亿美元以上

Mercor：

从2023年ARR约100万美元，快速爬升至2025年年化收入逼近4.5亿美元2025年上半年净利润约600万美元

行业增长的三大驱动力

更高LLM性能需求：模型越强大，对训练数据质量的要求越高基于LLM的Agent数据：智能体需要更复杂、更多样化的交互数据垂直场景的深度渗透：医疗保健、金融科技等专业领域对标注数据的需求激增

供给端的结构性变化

2025年6月Meta战略入股Scale AI后，部分大型实验室为降低信息外泄风险，更倾向于选择与大型互联网公司股权关系更疏的独立标注方。这种对数据隔离与供应链独立性的偏好增强，为Surge AI、Mercor等公司创造了结构性增长机遇。

据Mordor Intelligence数据，全球AI数据标注市场规模预计从2025年约19亿美元增至2030年近55亿美元，年复合增长率超过20%。

五、投资启示：聚焦四大基础设施方向

大模型产业的发展将长期驱动对底层基础设施的需求，投资应把握以下四个方向：

1. 算力：产业基座，国产化接棒

需求端的双重驱动：

训练侧：预训练与后训练迭代持续推高需求推理侧：AI搜索、Agent应用爆发，对并发和时延要求更高

国产化的历史性机遇：

NVIDIA在中国先进芯片市场份额已从95%降至接近0国内互联网厂商采购国产芯片趋势明确外采第三方与自研并行的策略将推动国产算力链规模化落地

推荐标的：沪电股份（PCB）、翱捷科技、芯原股份（国产算力）

2. 存储：多模态驱动容量跃升

需求的数量级变化：

单图约1MB、音频约5MB、视频按分钟计约50MB多模态数据体量远超文本，对存储容量、吞吐和可靠性提出更高要求

分层架构的演进：

训练侧：注重数据规模与分层管理推理侧：视频生成与分发需要边缘低时延存储与SSD加速

产业链标的：兆易创新、德明利、信维存储；海外如希捷科技、西部数据

3. 电力：AI时代的稀缺资源

成为核心瓶颈：

AI训练与推理耗电巨大，彭博新能源财经预测美国数据中心电力需求将从2024年的35吉瓦激增至2035年的78吉瓦获得稳定、低价的电力成为算力竞争的结构性优势

两大解决方案：

核能（尤其是SMR小型模块化反应堆）：微软、Google、亚马逊、Meta等均已与SMR厂商签订电力购买协议矿场改造：比特币矿场改造成本（500-800万美元/兆瓦）远低于新建AI数据中心，可快速提供算力产能

产业链机会：涉及核电全产业链及矿场改造企业

4. 应用：商业化落地的核心战场

筛选逻辑：遵循 “生态优先”框架，看好具备平台级入口、拥有大量2B/2C用户基础、并能与模型/支付/分发渠道形成闭环的公司。

细分领域机会：

2C应用：奥多比（Adobe）、金山办公、福昕软件2B应用：微软、泛微网络、鼎捷数智、用友网络、虹软科技基础设施与数据标注：Snowflake、MongoDB、海天瑞声

六、风险提示与未来展望

主要风险

宏观经济波动：可能影响AI产业资本投入技术进步不及预期：大模型技术或应用发展若放缓，将影响行业增长中美竞争加剧：可能进一步影响国内算力供应链

产业趋势展望

短期（1-2年）：

美国继续沿着算力扩张路径前进，中国深化架构优化OpenAI的生态效应开始显现，商业化案例快速增加国内2B场景加速落地，2C生态逐步构建

中期（3-5年）：

算力基础设施差距可能收窄，中国国产化方案成熟应用生态形成多极格局，不同垂类出现领导厂商数据标注、合成数据等数据服务行业标准化、规模化

长期（5年以上）：

技术路径可能出现新的融合与创新AI深度融入各行业，成为基础生产力工具全球AI治理和监管框架逐步建立

七、写在最后：产业转折点的战略思考

华泰证券的这份报告揭示了一个重要的产业转折点：大模型竞争的主战场正在从实验室的技术比拼，转向现实世界的商业落地和生态构建。

对于从业者来说，这意味着：

技术路径的选择比技术本身更重要：在算力约束下寻找效率最优解，可能比盲目追求绝对性能更有实际价值。生态位比单点技术更关键：在OpenAI等巨头构建的生态中，找到自己的差异化定位，可能比从头构建一个大模型更有商业前景。基础设施的价值被重新定义：算力、存储、电力这些传统基础设施，在AI时代被赋予了新的战略意义。数据的重要性被系统性重估：高质量的数据供给正在成为AI产业的“石油”，拥有数据优势的公司将在竞争中占据有利位置。

这场由大模型引发的产业变革才刚刚开始。中美不同的发展路径，反映了各自资源禀赋和市场环境的差异，也预示着未来全球AI产业可能形成多元化的竞争格局。

对于投资者而言，理解这场变革的底层逻辑，把握基础设施投资的主线，在应用层寻找生态卡位的机会，可能是未来几年最重要的投资主题之一。

正如报告所指出的，AI应用从“能用”到“可经营”的转折点正在逼近。当技术开始创造真实的商业价值时，整个产业将进入一个全新的发展阶段。而在这个过程中，能够提前布局、深度理解产业逻辑的参与者，将有机会分享这场数万亿美元变革的红利。

本文基于公开研究报告内容整理分析，不构成任何投资建议。详情请参阅完整报告。请点击上方名片，关注本公众号。由于微信公众号平台改变了推送机制，凡是点“赞”、点“在看”、转发、添加过“星标”的同学，都会优先接收到我的文章推送，所以麻烦大家添加“星标”，读完后顺手点一下“在看”和“赞”。大家都在看：长江证券-光模块投资框架深度解析高盛——美国就业市场出现日益疲软的迹象解数咨询——泡泡玛特LABUBU：年轻人的茅台高盛——燃料电池可以帮助满足数据中心的电力需求智次方研究院——2026中国AIoT产业全景图谱报告摩根大通——在市场收紧下，铜价可能进一步飙升中国银河证券——固态电池春山可望，工艺设备体系重塑固态电池设备行业深度报告民生证券——解构“第五消费时代”：精神消费崛起与投资启示高盛——预计未来十年全球股票年回报率为7.7%，中国超过10%浙商证券——房地产行业深度报告：个税收入视角下的房价支撑逻辑安永——2025 年专精特新上市公司创新与发展报告安信证券——投资策略定期报告：做时间的朋友，与伟大企业共同成长申万宏源——2026年中国AI投资策略申万宏源——日本经济全景分析（1945-2024）：从复兴到通缩突围的启示爱建证券——储能行业全景深度报告：出海与AI驱动新增长极东兴证券——人形机器人传感器技术与产业全景报告（2025）深企投产业研究院——固态电池产业研究报告（2025年）高盛——AI与数据中心电力需求研究报告摩根大通——亚太电池设备行业研究报告弗若斯特沙利文&头豹研究院——中国未来50年产业发展趋势白皮书消费纪——中国消费人群心智地图与品牌未来战略白皮书伯恩斯坦（Bernstein）——中国半导体：中国AI芯片供需规模分析概率的魔法：当3%的毁灭可能遇上100%的人生哲学免责声明：本文仅为投资知识分享，不构成任何投资建议。文中提及个股仅为举例说明，并非推荐。市场有风险，投资需谨慎。

下一篇：雷军也赚不了中年人的钱？上一篇：甘肃布下新棋局：“证券+上市公司+招商”三方联动，意在何为？

意昂体育介绍

华泰证券——大模型后训练：中美路径与商业闭环

推荐资讯

热点资讯

最新资讯

友情链接：