6月18日消息,今日凌晨,谷歌DeepMind發布了一個名為V2A(Video-to-Audio)的系統,能根據畫面內容或者手動輸入的提示詞直接為視頻配音。它還可以為任何視頻輸入生成無限數量的音軌。
谷歌DeepMindV2A系統最大的特點就是無需人工輸入提示詞也可以為視頻配音。DeepMind在博客中稱V2A能依靠自己的視覺能力理解視頻中的像素。也就是說,V2A能看懂畫面,知道畫面里正在發生什么
6月18日消息,今日凌晨,谷歌DeepMind發布了一個名為V2A(Video-to-Audio)的系統,能根據畫面內容或者手動輸入的提示詞直接為視頻配音。它還可以為任何視頻輸入生成無限數量的音軌。
谷歌DeepMindV2A系統最大的特點就是無需人工輸入提示詞也可以為視頻配音。DeepMind在博客中稱V2A能依靠自己的視覺能力理解視頻中的像素。也就是說,V2A能看懂畫面,知道畫面里正在發生什么