新大模型可根据文本生成高清视频
4月27日,模型在中关村论坛未来人工智能先锋论坛上,可根清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。据文论坛现场,本生清华大学教授、成高生数科技首席科学家朱军向与会者展示了Vidu生成的清视视频,包括行驶在崎岖道路上的模型汽车、戴珍珠耳环的可根猫、弹吉他的据文熊猫等。与此前震撼业界的本生Sora一样,Vidu能够根据文本描述直接生成高质量视频。成高 “长时长、清视高一致性、模型高动态性”是可根Vidu的显著特征。朱军表示,据文研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。 除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。 值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。
- 最近发表
-
- 韩方初步确认17名中国公民在华城火灾中遇难
- 黑人陳建州提告大牙求償千萬加公開道歉,法界分析:已部分違憲且判賠金額不可能這麼高
- 拜登次子逃稅擁槍與檢方達成認罪協議,川普抨擊司法部:開一張交通罰單,免除數百年的刑期
- 統一獅擊敗富邦悍將奪隊史第16座季冠軍,總教練林岳平坦言「心中石頭終於放下」
- 濃濃煙味!日本航班兩度遭雷擊 緊急降落關西機場
- 《一直以為爸媽不會老》:為什麼老人家常常聊天聊到一半就開始翻舊帳?
- 【未來大人物進行式】黃雅聖:我們走在一條培養大人物的路上,繼續用教育雕琢更多台灣璞玉們
- 【接地氣的現代詩】唐捐〈狼〉:用幽默詼諧的書寫技巧,揭露#MeToo加害者慣用的SOP
- 《关于优化老旧小区改造后住房公积金贷款期限核定标准的通知》
- 加害者可以「告發」自己嗎?朱學恒案接下來檢調該如何偵辦?
- 随机阅读
-
- 福建福州举行2020年市场监管开放日活动
- 《頸椎全書》:當你低頭達60度,頸椎的壓力相當於一個小四學生坐在肩膀上
- 民調:新加坡同婚支持度上升,32%民眾挺同婚合法,57%支持同性伴侶領養權
- 日本常見姓氏(上):佐藤原來是「左衛門的藤原」,那高橋是「在高處架起的橋」嗎?
- 北京朝阳:持续创新优化营商环境
- 受日本時間銀行啟發,這家瑞士新創讓你沒錢也能「用時間換取服務」
- 若技藝教育能更早開始,是否會少些誤入歧途的年輕學子?
- 歐美大廠「移出中國」成潮流,東南亞這5國最受歡迎|天下雜誌
- 美國法官裁定特朗普「封口費」案庭審日期定於4月15日
- 性侵殺人適用國民法官首案:兇嫌刺殺酒店女公關7刀致死,審理將不開放旁聽
- 轉移焦點、博取同情、汙名化MeToo⋯⋯黃子佼如何藉由自爆,企圖扭轉輿論風向?
- 《民族重建》導讀:民族是在何時出現?族群清洗為何發生?國家之間的宿怨又要如何化解?
- “夏季大三角”上线了!
- 每到收假就想提離職,且慢!你的「緊急預備金」準備好了嗎?
- 牙醫心裡話:看似簡單到不行的局部矯正,其實才是真正的大魔王
- 外媒分析瓦格納兵變揭露中俄關係風險,拜登:「賤民」普亭正在輸掉烏克蘭戰爭
- 5月汽车新势力销量出炉
- 克林姆最後一幅肖像畫〈持扇的女子〉33億新台幣成交,寫下歐洲藝術拍賣新紀錄
- 侯友宜宣稱遵循憲法卻不承認一中,患了蔡英文同樣的「空心論述病」
- 《宗教超圖解》:世界各大宗教信徒最多的國家分別是?
- 搜索
-
- 友情链接
-