首发快讯

小米开源首个原生端到端语音大模型

每日经济新闻 2025-09-19 09:27:18

每经AI快讯，据Xiaomi MiMo微信公众号消息，9月19日，小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio，它基于创新预训练架构和上亿小时训练数据，首次在语音领域实现基于ICL的少样本泛化，并在预训练观察到明显的“涌现”行为。据介绍，在通用语音理解及对话等多项标准评测基准中，MiMo-Audio大幅超越了同参数量的开源模型，取得7B最佳性能；在音频理解基准MMAU的标准测试集上，MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash；在面向音频复杂推理的基准Big Bench Audio S2T任务中，MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

读者热线：4008890008

特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

模型开源小米大模型

上一篇文章

9月19日A股三大指数开盘涨跌不一，上证指数开盘下跌0.03%，创业板指上涨0.08%

返回每经网首页

下一篇文章

云南临沧市耿马县发生3.6级地震震源深度10千米