新大模型可根据文本生成高清视频
4月27日,模型在中关村论坛未来人工智能先锋论坛上,可根清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。据文论坛现场,本生清华大学教授、成高生数科技首席科学家朱军向与会者展示了Vidu生成的清视视频,包括行驶在崎岖道路上的模型汽车、戴珍珠耳环的可根猫、弹吉他的据文熊猫等。与此前震撼业界的本生Sora一样,Vidu能够根据文本描述直接生成高质量视频。成高 “长时长、清视高一致性、模型高动态性”是可根Vidu的显著特征。朱军表示,据文研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。 除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。 值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。
- 最近发表
-
- 央行:2025年创新宏观审慎政策工具、完善房地产金融管理|快讯
- 俄羅斯規避西方制裁,透過中亞、高加索鄰邦輸入美歐晶片軍民貨品
- 《越自然越抗癌 清除癌細胞》:印度古儒吉淨化呼吸,四十天後必有奇蹟
- 印尼沐浴文化 :一早起床洗澡是約定俗成,「露露浴」甚至成為國際美容SPA療程之一
- 浙江永康:提高案件查办效率 规范电商企业网络经营行为
- 《留白工作法》:大腦灰質愛「白色空間」,科學證實「策略性停頓」有利於表現
- 四月最新調查-台灣臉部保養品市場趨勢與商機分析
- 巨大隕石可能是地球大陸的成因?古澳洲岩石同位素揭秘
- 哈尔滨严查使用变质过期原料生产加工食品违法行为
- 《人選之人─造浪者》:以政治幕僚工作為背景,鋪陳三段女性的創傷與復原經驗
- 随机阅读
-
- “新征程·新跨越”主题书画作品展开展
- 黃西《沒關係啦自卑》:逃避不僅有用,簡直太爽了!
- 當警察把浩克打成浩呆,判斷警方是否執法過當的關鍵是?
- 特教老師犧牲備課時間、家人甚至健康……請支持心評專職化,對大家都好
- 生态循环 绘就农业新蓝图(三)
- 泰山投資街口取得4成股權,胡亦嘉:無端被捲入,不會讓出經營權
- 《旅人.時光閱讀》:描寫台灣鄉土之情的書有很多,最賺人熱淚者要算是鍾肇政的《魯冰花》
- 《嗅覺之謎》:歐洲人的濃厚體味,來自於清潔劑效能不佳?
- 百只基金清盘 头部公司为何也加入了淘汰赛?
- 【專訪】《今天不寫小說》作者藤井樹、橘子:自我揭露像裸奔,字裡行間的目光無從閃避
- 我是波蘭人?東歐人?還是世界人?波蘭歷史留給新世代的身分認同課題
- 【美劇】Netflix《怒嗆人生》:冤冤相報的「憤怒」,在發現「你和我是如此相像」後而救贖
- 北京石景山:全力织密疫情防控安全网
- 【小說】《在廢墟中乞求》選摘:13年前的札幌妓女凶殺案,兇手就是持鈍器不斷猛砸被害人的臉
- 落跑市長、黨內分裂、論述貧乏,侯友宜的「侯侯做代誌」還能撐多久?
- 促成鳥類成功自恐龍演化的關鍵推手,「鳥羽」躍升為仿生力學研究要角
- 我国载人月球探测工程登月阶段任务稳步推进_
- 《悲傷的大腦》:人為逝者哀悼時除了悲傷,為什麼經常也會感到憤怒?
- 土耳其物價飆漲、實際通膨率達105%,無論誰當選總統都如同手握「有毒聖杯」
- 《越自然越抗癌 清除癌細胞》:印度古儒吉淨化呼吸,四十天後必有奇蹟
- 搜索
-
- 友情链接
-