(相關(guān)資料圖)
6月19日消息,近日,Meta發(fā)布了Voicebox AI模型,它在音頻模擬方面有著顯著優(yōu)勢(shì)。
據(jù)悉,Voicebox只需要一段2秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語(yǔ)音輸出。
同時(shí),它還可以基于語(yǔ)音片段的前后內(nèi)容,自動(dòng)補(bǔ)齊中間缺失的內(nèi)容。
根據(jù)Meta的介紹,Voicebox能夠?yàn)锳I助手,或是未來(lái)元宇宙的NPC提供自然且真實(shí)的語(yǔ)音效果,大大提升用戶使用時(shí)的沉浸感。
關(guān)鍵詞:
最新資訊