新大模型可根据文本生成高清视频
4月27日,模型在中关村论坛未来人工智能先锋论坛上,可根清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。据文论坛现场,本生清华大学教授、成高生数科技首席科学家朱军向与会者展示了Vidu生成的清视视频,包括行驶在崎岖道路上的模型汽车、戴珍珠耳环的可根猫、弹吉他的据文熊猫等。与此前震撼业界的本生Sora一样,Vidu能够根据文本描述直接生成高质量视频。成高 “长时长、清视高一致性、模型高动态性”是可根Vidu的显著特征。朱军表示,据文研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。 除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。 值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。
- 最近发表
-
- 陕西筑牢儿童用品质量安全防线
- 古巴首都五星級飯店發生爆炸至少22死、70傷,事發原因據傳為瓦斯外洩
- 日式拉麵以前叫「支那そば」,現在大眾使用的「ラーメン」在台灣叫「拉麵」其實只是音譯
- 《無限投資學》:該買車還是租車?買屋還是租屋?零利率信用卡有那麼好嗎?
- 省工商联将充分调动整合资源 为灾后恢复重建作贡献
- 比起將話語權交給律師的安柏赫德,親上火線的強尼戴普如何逆轉輿論風向?
- 《我的心稍微大於一整座宇宙【佩索亞|詩選】》:我是如何以這三者之名創作的?
- 歐盟「戒斷」俄羅斯能源有腹案,加速天然氣脫俄成最大挑戰,怎麼做到?
- 京城德比有温度更有热度
- 《生態系競爭策略》:銀行是蘋果部署的一個巧妙策略,但真正的領導需要自願的追隨者
- 随机阅读
-
- 间隔流动分析法测定水中总磷(二)
- 哪些大學科系最沒用?允許一群人鑽研「無用之學」,是文明追求的最高境界
- 愈到近代愈把自己畫得東倒西歪——該如何欣賞「自畫像」的美?
- 苗栗三腳督?時力宋國鼎宣布參選縣長;國民黨鍾東錦發文「這一戰,我當仁不讓」
- 天全县开展“请进来”摄影图片交流
- 《閒人出租》:這是個「病人希望我過去探病」的委託,地點在精神病院的隔離病房
- 立院初審開放「同婚家庭於婚後共同收養子女」,法務部表尊重、全案送黨團協商
- 昨電力備轉率僅剩2%、今再亮黃燈,經濟部長:台電大修機組,5月回歸穩定供電
- 泉州德化古法柴烧太平宫窑获颁世界纪录证书
- 香港是大還是小城市?
- 《無,生命的最佳狀態》:調整內在心境的方法有兩個,「提升情緒粒度」與「內感受訓練」
- 開箱古董盒裝軟體:1992年要在電腦安裝「國音輸入法」有多困難?
- 失重状态飘飘忽忽 航天员在太空都怎么运动?
- 《新手種花100問》:電燈可以取代陽光照射植物嗎?葉子上長了凸起的東西是什麼?
- 薪水停滯造成的經濟落後(上):當台灣薪資成長落後於韓國,經濟成長也開始放緩
- 【專訪】馬祖藝術島總策劃吳漢中:嚴謹的工法+嚴格的紀律,才有創意發揮的可能
- 深圳开展校外配餐企业食品安全检测技能竞赛
- 「聞過則怒」的國防部長只會誤國害軍,澆熄公眾參與國防事務的熱情
- 《新手種花100問》:電燈可以取代陽光照射植物嗎?葉子上長了凸起的東西是什麼?
- 傳統小吃老店會消失嗎?台灣跟日本一樣逐步面臨「接班人危機」
- 搜索
-
- 友情链接
-