谷歌新技術可用AI模型為無聲視頻配音
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。 當前DeepMind 這款AI模型依然存在局限性,術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲聲音,暫時不能直接根據視頻畫面添加具體音效。配音 據悉,谷歌該模型首先會將用戶輸入的新技型為視頻進行拆解,此後結合用戶的術可視頻用戶文字提示,利用擴散模型反覆運算,無聲最終以生成與視頻畫面協調的配音背景聲音,例如輸入一條「在黑暗中行走」的谷歌無聲視頻,再添加「電影、新技型為恐怖片、術可視頻音樂、無聲緊張、配音混凝土上的腳步聲」等文字提示,相關模型就能生成恐怖風格的背景音效。 DeepMind同時表示,該「video-to-audio」模型可以為任何視頻生成無限數量的音軌,還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」,從而令生成的聲音更貼近某些特定場景。 (來源:第一財經)
- 最近发表
- 随机阅读
-
- 陕西汉中:“五个必须”保障食品安全
- 上海市市场监管局继续公布一批价格违法典型案例
- 五矿稀土:一季度净利同比增长65.59%
- 同业存单指基成“市场宠儿”新基发行冰火两重天
- 寒假儿童关爱服务活动走进全椒城南小学_
- *ST罗顿:上交所拟终止公司股票上市
- 欧元兑美元跌破1.05关口为2017年3月以来首次
- 中央财政安排农业生产救灾资金16亿元
- 氯化钠溶液标准物质的重要性与实践探索
- 福田汽车:拟转让国创中心12.02%股权
- 郑渝高铁新建线路全部试运行
- 中国太保:一季度净利润同比下降36.4%
- 新型光敏剂:提升激光对肿瘤杀伤效率
- 金冠电气:控股股东拟增持1400万元
- 山西长治市卫健委副主任申宛成主动投案接受审查调查
- 中交地产:控股股东拟减持不超2%股份
- 【新国标GB/T 18883
- 英媒:英国将在欧洲进行冷战之后最大规模军事部署
- Meta考虑通过Zuck Bucks进入金融领域
- 上海发布:5月1日至6月30日全市常态化核酸采样点实行免费检测
- 搜索
-
- 友情链接
-