要闻

全球最大开源视频生成模型国内首发阶跃星辰上架阿里云魔搭社区

每日经济新闻 2025-02-21 12:57:41

每经杭州2月21日电（记者叶晓丹）在2月21日开幕的全球开发者大会（GDC）上，阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型，包括全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。截至目前，魔搭社区已上架超过4万个开源模型，涵盖LLM、对话、语音、文生图、图生视频等多个领域，是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型，是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转视频预训练模型，能够生成高达204帧的视频，在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

另一款上架模型Step-Audio，是业界首个产品级开源语音模型，参数规模多达1300多亿。根据Llama Question等5大主流公开测试，Step-Audio模型性能均位列第一，并在HSK-6（汉语水平考试六级）的测评中表现尤佳。

封面图片来源：视觉中国-VCG211379091969

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

读者热线：4008890008

特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

上一篇文章

联通、电信罕见涨停，沪指半日收涨0.77%

返回每经网首页

下一篇文章

行业ETF风向标丨6只科创芯片ETF半日涨幅超6.5%，40多亿资金“憾失”大涨行情