每日经济新闻 2026-03-04 10:59:29
3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
读者热线:4008890008
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
欢迎关注每日经济新闻APP