当前位置：首页 > 热点

谷歌新技術可用AI模型為無聲視頻配音

谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。

當前DeepMind 這款AI模型依然存在局限性，術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲聲音，暫時不能直接根據視頻畫面添加具體音效。配音

據悉，谷歌該模型首先會將用戶輸入的新技型為視頻進行拆解，此後結合用戶的術可視頻用戶文字提示，利用擴散模型反覆運算，無聲最終以生成與視頻畫面協調的配音背景聲音，例如輸入一條「在黑暗中行走」的谷歌無聲視頻，再添加「電影、新技型為恐怖片、術可視頻音樂、無聲緊張、配音混凝土上的腳步聲」等文字提示，相關模型就能生成恐怖風格的背景音效。

DeepMind同時表示，該「video-to-audio」模型可以為任何視頻生成無限數量的音軌，還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」，從而令生成的聲音更貼近某些特定場景。

（來源：第一財經）

責任編輯：文劼

上一篇

北京八达岭长城上新“外骨骼机器人”，辅助游客爬长城
下一篇

将科技融入生活美的酷省电Ultra柜机首发

谷歌新技術可用AI模型為無聲視頻配音

相关推荐

福建福州：市场监管守一线筑牢疫情防护网

第57屆廣播金鐘獎公布入圍名單：國立教育廣播電台成提名階段大贏家，特別獎項再度從缺

【關鍵眼中盯】吃播也能變公關危機，為什麼蔣萬安被包裝得越來越像連勝文？

《高勝算決策2》：想像失敗讓你更有可能真正經歷成功，這就是負面思考的力量

揭秘骗局还是贩卖焦虑：辛吉飞和他的“科技食品”视频风波

反制中國「反介入戰略」，美國正在關島部署「最厲害的矛、最堅實的盾」

谷歌新技術可用AI模型為無聲視頻配音

相关推荐

福建福州：市场监管守一线 筑牢疫情防护网

第57屆廣播金鐘獎公布入圍名單：國立教育廣播電台成提名階段大贏家，特別獎項再度從缺

【關鍵眼中盯】吃播也能變公關危機，為什麼蔣萬安被包裝得越來越像連勝文？

《高勝算決策2》：想像失敗讓你更有可能真正經歷成功，這就是負面思考的力量

揭秘骗局还是贩卖焦虑：辛吉飞和他的“科技食品”视频风波

反制中國「反介入戰略」，美國正在關島部署「最厲害的矛、最堅實的盾」

福建福州：市场监管守一线筑牢疫情防护网