谷歌新技術可用AI模型為無聲視頻配音
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。 當前DeepMind 這款AI模型依然存在局限性,術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲聲音,暫時不能直接根據視頻畫面添加具體音效。配音 據悉,谷歌該模型首先會將用戶輸入的新技型為視頻進行拆解,此後結合用戶的術可視頻用戶文字提示,利用擴散模型反覆運算,無聲最終以生成與視頻畫面協調的配音背景聲音,例如輸入一條「在黑暗中行走」的谷歌無聲視頻,再添加「電影、新技型為恐怖片、術可視頻音樂、無聲緊張、配音混凝土上的腳步聲」等文字提示,相關模型就能生成恐怖風格的背景音效。 DeepMind同時表示,該「video-to-audio」模型可以為任何視頻生成無限數量的音軌,還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」,從而令生成的聲音更貼近某些特定場景。 (來源:第一財經)
- 最近发表
- 随机阅读
-
- 春耕时节,这批“农博士”“农硕士”奔波在田间地头
- 能不能用AI代写论文、代写作业?
- 全国首个金鲳鱼全产业链标准体系在湛江初步建设完成
- 新能源车市场“黄牛”出没背后
- 人大监督再突破:“一府两院” 同时应询
- 广电总局:坚决抵制含有不良情节动画片
- “图书馆打卡达人”走红:在丰盈的精神世界遇见不一样的自己
- 北京石景山:专项检查水产品
- 核威慑背后的无形较量
- 陳果《好的愛情》:「大學」就是「窮理正心,修己治人」的學問
- 京沪部分银行火速下调 首套房贷利率降至3.4%
- 数字人才紧缺 技术赋能开启就业新空间
- 水中挥发酚成分分析标准物质:助力环境水质精准检测
- 陕西咸阳:首批100家“护骑”联盟商户为外卖骑手提供生活服务
- 北京石景山:重点检查散装月饼销售专柜
- 苦中作樂!孟加拉「飢餓遊戲」 破關抱糧食回家
- 国漫与国货双向奔赴:蒙牛携手哪吒打造“中国故事”叙事新样本
- 数字人才紧缺 技术赋能开启就业新空间
- 计量有温度 企业加速度——广西梧州市计量测试所温情服务企业侧记
- 十四届全国政协人口资源环境委员会副主任李微微被查
- 搜索
-
- 友情链接
-