新大模型可根据文本生成高清视频
4月27日,模型在中关村论坛未来人工智能先锋论坛上,可根清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。据文论坛现场,本生清华大学教授、成高生数科技首席科学家朱军向与会者展示了Vidu生成的清视视频,包括行驶在崎岖道路上的模型汽车、戴珍珠耳环的可根猫、弹吉他的据文熊猫等。与此前震撼业界的本生Sora一样,Vidu能够根据文本描述直接生成高质量视频。成高 “长时长、清视高一致性、模型高动态性”是可根Vidu的显著特征。朱军表示,据文研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。 除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。 值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。
- 最近发表
- 随机阅读
-
- 陕西咸阳2022年消费者权益保护成效:优化消费环境 共促消费公平
- 別害羞!女性必知保養私密處9方法 需使用私密處保養產品嗎?
- (有片)一袋麵粉1000美元 加沙民眾:人們因飢餓死去 苦難無法形容
- 俄羅斯總統選舉進入最後一個投票日
- 福建厦门:开展实地抽查 消除电梯安全隐患
- 县领导督导检查防溺水工作 宿松新闻网
- 我国科学家发现新型费米子 突破传统分类—新闻—科学网
- 马斯克:SpaceX基本不用AI,没看到有什么用
- 朝阳区公布义务教育入学政策!支持符合条件家庭长幼随学
- 行走风雨中 乐在心田间
- 来安优化农机服务零距离助农发展_
- 鴻海處分對紫光集團轉投資 出清持股
- 关于循环农业的农作物秸秆资源化利用模式探讨(二)
- 水箱容积标称2吨实则减半 福清消委会质疑行业规则
- 菱溪社区开展无偿献血志愿服务活动_
- (有片)一袋麵粉1000美元 加沙民眾:人們因飢餓死去 苦難無法形容
- 迷迭香提取物对鲊广椒肉丸储藏过程中品质变化的影响(一)
- 阿拉比亞電視台:哈馬斯已接受美國「修改版」的加沙地帶停火協議
- 为减家庭负担 模范少年放弃学业
- 居民家中屡返水 影响生活起纠纷
- 搜索
-
- 友情链接
-