每日经济新闻
头条

每经网首页 > 头条 > 正文

效果比Sora惊艳,著名AI平台大动作!文本生成超25秒视频,带背景音乐、转场等效果

每日经济新闻 2024-02-29 10:59:10

每经编辑 毕陆名

2月29日,著名AI平台Lightricks在官网宣布,推出生成式AI电影制作平台—LTX Studio。据悉,用户只需要输入文本就能生成超25秒的微电影视频,同时可对镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。

图片来源:Lightricks官网截图

Sora生成的视频由神经网络完成,也就是说生成的内容完全由AI决定,你除了提供文本无法进行任何内容控制。

而LTX Studio提供的可视化专业视频控制台,可以帮助用户进一步优化视频的细节达到商业级视频,并且附带语音解读而Sora目前无法提供。

目前,LTX Studio支持免费申请试用,3月27日将开启第一批测试。

图片来源:LTX Studio效果展示截图

Lightricks展示了多个由LTX Studio生成的视频,在文本语义还原、视频动作一致性、灯光、视频调色、背景语音解读等方面非常优秀。

一个孩子在森林里发现了一颗超级闪亮、又大又红的神奇草莓。吃完后,她开始变成一个红色的宇航员,飞了起来,在小镇上空快乐地飞翔。

图片来源:LTX Studio效果展示截图

同时Lightricks也展示了该视频的制作幕后花絮,从其展示的内容来看,可以对灯光、转场进行精准控制。

一只名叫鲍勃的动画企鹅无意中在一部自然纪录片中看到了自己,并对生活产生了疑问。鲍勃决定寻找自我,离开家人,环游世界,寻找奇迹。

图片来源:LTX Studio效果展示截图

一个8岁的小女孩穿越时空回到恐龙时代,发现了一个未知的先进文明。她必须修好她的时光机,并在为时已晚之前将这个文明的秘密带回到现代。

图片来源:LTX Studio效果展示截图

1927年的巡回嘉年华会上俯拍走钢丝的表演者,他在钢丝上保持平衡,下面的人群紧张地注视着他,柔和的漫射光,聚光灯打在表演者身上,戏剧性的阴影,温暖的棕褐色调,充满悬念的娱乐,复古的夜间马戏团美学。

图片来源:LTX Studio效果展示截图

近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。

美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。由于Sora能够模拟对世界状态产生简单影响的行为,有分析人士认为,这将文生视频能力推向了全新的高度。

在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。

在OpenAI官方的技术报告中,对Sora的定位为“作为世界模拟器的视频生成模型”。“之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。”华金证券计算机首席分析师方闻千说。

360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是“真实”的。

业内人士表示,虽然OpenAI表示当前Sora仍有弱点,例如难以准确模拟复杂场景中的物理现象,可能无法理解具体的因果关系,但从当前展示的效果来看,Sora显著领先于其他文生视频模型,推动AI视频生成“进入了一个全新的时代”。

据经济参考报29日报道,业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。

每日经济新闻综合Lightricks官网、经济参考报

封面图片来源:视频截图

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

读者热线:4008890008

特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

2月29日,著名AI平台Lightricks在官网宣布,推出生成式AI电影制作平台—LTX Studio。据悉,用户只需要输入文本就能生成超25秒的微电影视频,同时可对镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。 图片来源:Lightricks官网截图 Sora生成的视频由神经网络完成,也就是说生成的内容完全由AI决定,你除了提供文本无法进行任何内容控制。 而LTX Studio提供的可视化专业视频控制台,可以帮助用户进一步优化视频的细节达到商业级视频,并且附带语音解读而Sora目前无法提供。 目前,LTX Studio支持免费申请试用,3月27日将开启第一批测试。 图片来源:LTX Studio效果展示截图 Lightricks展示了多个由LTX Studio生成的视频,在文本语义还原、视频动作一致性、灯光、视频调色、背景语音解读等方面非常优秀。 一个孩子在森林里发现了一颗超级闪亮、又大又红的神奇草莓。吃完后,她开始变成一个红色的宇航员,飞了起来,在小镇上空快乐地飞翔。 图片来源:LTX Studio效果展示截图 同时Lightricks也展示了该视频的制作幕后花絮,从其展示的内容来看,可以对灯光、转场进行精准控制。 一只名叫鲍勃的动画企鹅无意中在一部自然纪录片中看到了自己,并对生活产生了疑问。鲍勃决定寻找自我,离开家人,环游世界,寻找奇迹。 图片来源:LTX Studio效果展示截图 一个8岁的小女孩穿越时空回到恐龙时代,发现了一个未知的先进文明。她必须修好她的时光机,并在为时已晚之前将这个文明的秘密带回到现代。 图片来源:LTX Studio效果展示截图 1927年的巡回嘉年华会上俯拍走钢丝的表演者,他在钢丝上保持平衡,下面的人群紧张地注视着他,柔和的漫射光,聚光灯打在表演者身上,戏剧性的阴影,温暖的棕褐色调,充满悬念的娱乐,复古的夜间马戏团美学。 图片来源:LTX Studio效果展示截图 近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。 美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。由于Sora能够模拟对世界状态产生简单影响的行为,有分析人士认为,这将文生视频能力推向了全新的高度。 在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。 在OpenAI官方的技术报告中,对Sora的定位为“作为世界模拟器的视频生成模型”。“之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。”华金证券计算机首席分析师方闻千说。 360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是“真实”的。 业内人士表示,虽然OpenAI表示当前Sora仍有弱点,例如难以准确模拟复杂场景中的物理现象,可能无法理解具体的因果关系,但从当前展示的效果来看,Sora显著领先于其他文生视频模型,推动AI视频生成“进入了一个全新的时代”。 据经济参考报29日报道,业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。 每日经济新闻综合Lightricks官网、经济参考报
视频 Sora 音乐

欢迎关注每日经济新闻APP

每经经济新闻官方APP

0

0