每日经济新闻
要闻

每经网首页 > 要闻 > 正文

三年蛰伏、匿名冲榜杀进全球前三,美团龙猫2.0能否改写“万亿级”参数模型国产算力新叙事?

2026-07-01 04:25:00

6月30日,美团发布新一代万亿参数大模型龙猫2.0,系国内首个在五万卡国产算力集群完成全流程训练的模型。此前其测试版调用量已居全球前三。美团自2023年起聚焦国产算力适配,近期成立AI转型部。此外,国产算力支撑大模型训练的案例涌现,专家称龙猫2.0验证了可行性,将推动技术路径多元化和产业融合。

每经记者|赵雯琪    每经编辑|魏文艺    

6月30日,美团正式发布新一代基础大模型龙猫2.0(LongCat-2.0)。据官方披露,这是国内首个在五万卡国产算力集群上完成训练与推理全流程的万亿参数大模型。

而此前的4月底,龙猫2.0测试版本以匿名身份“Owl Alpha”接入全球最大API(应用程序编程接口)路由平台OpenRouter,其截至6月底的总调用量已悄然跻身全球前三。在Hermes、Claude Code等核心Agent(智能体)场景中,其月调用量分别位列全球第一、第二。

一位大模型行业人士在接受《每日经济新闻》记者(以下简称“每经记者”)采访时表示:“在国产芯片上训练出大MoE(混合专家模型)模型还是很厉害的。”他提到,国产芯片集群训练模型的稳定性不太好,缺乏算子还需要专门优化,软件生态不足是很大的瓶颈,这些都会影响大模型训练。“而龙猫能够实现用国产算力训练出万亿大模型的主要原因,可能是他们很早就尝试用国产算力训练模型。”

近半年以来,国产算力支撑大模型训练的案例正在密集涌现。今年4月29日,科大讯飞董事长刘庆峰在2025年年报及2026年一季报发布后的财报电话会上明确判断,随着中美科技博弈长期化,算力自主可控已从“可选项”变为“必选项”,具备国产算力平台完整训练能力的企业,在国家战略需求与政企市场中赢得的空间将越来越大。

从“能不能用”到“好不好用”,国产算力正在跨越第一道门槛。但真正的分水岭在于:当技术路线的争议逐步平息,行业竞争的核心终究要回归最朴素的商业逻辑——谁的模型在真实场景中跑得更快、更稳、成本更低?

笃定国产算力已三年,美团AI走到台前

万亿参数大模型与国产算力的组合,在一年前仍被行业视为“不可能完成的任务”。彼时主流判断认为,国产算力卡在单卡性能、软件生态、集群稳定性等方面与英伟达体系存在代际差距,难以承载前沿大模型的训练需求。LongCat-2.0的出现,或许正在改写这一认知。

公开信息显示,美团龙猫团队自2023年起便聚焦国产算力适配,从千卡规模起步,逐步攻克算子适配、通信优化等底层难题。

从官方发布的技术指标看,LongCat-2.0总参数达1.6万亿,采用MoE架构,平均激活参数约480亿,原生支持1M超长上下文。龙猫团队在五万卡集群上通过弹性扩缩卡、自动故障恢复等机制,将月均日故障率降低70%以上;通过流水线调度与显存优化,训练MFU(模型算力利用率)提升1.5倍,稳态日吞吐突破1T(万亿) Tokens(词元)。

值得一提的是,近两年来,美团CEO(首席执行官)王兴在多个场合表达过对AI(人工智能)的判断。在2025年3月的业绩电话会上,他表示美团的AI策略是“进攻,不是防守”,“当AI这样革命性的事物到来时,唯一合理的策略,不是试图捍卫你现有的模式,而是尝试利用你已有的资源进攻”。

2026年3月,王兴进一步向投资者披露,自2023年初以来,美团在资本支出和AI人才上进行了持续的大规模投入,“除有云计算业务的企业外,美团在AI上的投入规模,大概率是国内企业里最大的,且已经坚持布局三年多”。

在组织架构上,美团近期新成立了AI Transformation(人工智能转型部)部门,与外卖、闪购等核心业务平行,由前大众点评总经理牧遥负责,向美团核心本地商业CEO王莆中汇报。这标志着,AI在美团内部已从技术探索上升为战略核心。

国产算力阵营扩围,芯模协同进入关键期

不仅是美团,过去半年,国产算力支撑大模型训练的案例正在密集涌现,产业链的“去英伟达化”尝试已从个别企业行为扩展为行业性探索。

美团龙猫团队在官方微信公众号上坦言,国产算力卡单卡性能虽仍落后于全球顶尖水平,但计算正确性与精度已可满足大模型训练需求,局部指标甚至略优。

每经记者注意到,今年6月初,深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为有关团队,依托昇腾910C国产AI算力集群完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。项目累计完成1500多步迭代,全程未出现中断,模型算力利用率突破30%,关键训练算子效率提升14%。深圳市官方通报称,“此次实践印证了国产AI芯片可支撑世界级超大参数模型训练工作”。

科大讯飞则是另一条路径上的代表。6月9日,讯飞发布星火医疗大模型V3.5,实现了基于全国产算力的医疗多模态、长上下文能力突破。刘庆峰在司庆上表示,即便面临国产算力生态的客观限制,讯飞始终坚持“全国产大模型训练之路”。随着国产算力持续突破,模型迭代将提速,训练与推理成本也将进一步下降。

对此,天使投资人、资深人工智能专家郭涛向每经记者表示,从政策层面,国家鼓励自主创新,支持国产算力发展,企业响应政策可获得产业协同等潜在支持;从技术自主可控看,使用国产算力可减少对国外算力生态的依赖,降低技术封锁风险,保障模型研发和运行安全;从成本角度,随着国产算力规模化应用,其采购与运维成本的性价比优势逐步显现;从产业生态考虑,有助于推动国内算力芯片、框架等上下游环节迭代,形成良性产业循环。

不过,郭涛也表示,在此之前,国内大厂和大模型企业未能实现万亿参数模型全栈国产化训练的原因在于:一方面,技术路线差异,部分团队延续使用国外成熟算力及相关技术体系,在国产算力适配的底层研发上投入有限;另一方面,资源与难度制约,训练万亿参数模型需大规模国产算力集群支撑,且需攻克硬件故障、通信延迟等特有难题,部分团队受限于算力资源或技术储备难以推进;此外,对国产算力的实用性验证存在过程,早期对其性能稳定性的顾虑可能影响投入决心。

郭涛认为,LongCat-2.0的发布验证了国产算力支撑大规模模型的可行性,将激励其他团队加大国产算力研发投入,加速行业技术路径多元化。同时,推动国产算力与大模型产业深度融合,助力构建自主可控的技术体系,为行业长期发展提供更多可能性。

当“全国产”技术路线从被质疑到被验证,中国AI产业的算力叙事是否真的到了转折点?答案或许就在未来更多企业用国产算力跑出的模型成绩单中。

封面图片来源:每经媒资库

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

读者热线:4008890008

特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

欢迎关注每日经济新闻APP

每经经济新闻官方APP

1

0