当前位置: 当前位置:首页 > 热点 > 新大模子可依据文本天生高清视频 正文

新大模子可依据文本天生高清视频

2024-10-18 01:36:25 来源:五月披裘网 作者:休闲 点击:405次

4月27日,依据在中关村落论坛未来家养智能先锋论坛上,文本清华大学散漫北京生数科技有限公司(如下简称“生数科技”)正式宣告中国首个原创全自研视频大模子——Vidu。天生论坛现场,高清清华大学传授、视频生数科技首席迷信家朱军向预会者展现了Vidu天生的依据视频,包罗行驶在笔直道路上的文本汽车、戴珍珠耳饰的天生猫、弹吉他的高清熊猫等。与此前冷艳业界的视频Sora相同,Vidu可能依据文本形貌间接天生高品质视频。依据

“永劫长、文本高不同性、天生高动态性”是高清Vidu的清晰特色。朱军呈现,视频研发团队的中间技术在于接管U-ViT架构。它由Diffusion与Transformer两个模子融会而来,可反对于一键生愿望达16秒的高清视频内容。

除了在时长方面劣势突出,Vidu在视频成果方面也实现清晰降职。朱军介绍,Vidu能模拟着实物理天下,天生的视频不光场景细节重大,而且适宜物理纪律,比喻公平的光影成果、详尽的人物脸色等。Vidu还具备充实的构想力,能天生着实天下不存在的伪造画面,发现出具备深度以及重大性的超事实主义内容。此外,Vidu可懂良多镜头语言,天生的视频再也不规模于重大的推、拉、移等牢靠镜头,而是环抱对于立主体实现远景、中景、远景、特写等区别镜头的切换,甚至能间接生愿望镜头、追焦、转场等成果,给视频注入充实的镜头表白。Vidu还独具文化特色,能很好清晰中国元素,天生熊猫、龙等中国元素的视频。

值患上一提的是,论坛上展现的视频都是重新至尾陆续天生,不清晰的插帧征兆。朱军说,与Sora相同,Vidu在文本到视频的转换历程中间接且陆续,而且在底层算法上,是由繁多模子残缺端到端天生,不波及插帧以及其余多步骤解决。

作者:焦点
------分隔线----------------------------
头条新闻
图片新闻
新闻排行榜