cyqdesign |
2023-06-26 19:44 |
迄今最復(fù)雜人工智能語(yǔ)音模型創(chuàng)建
據(jù)英國(guó)《每日郵報(bào)》23日?qǐng)?bào)道,臉書(shū)母公司元宇宙平臺(tái)公司(Meta)稱,其已研制出“迄今功能最強(qiáng)大的語(yǔ)音生成式人工智能Voicebox”,它能夠模仿任何人的聲音,包括逝者。不過(guò),由于擔(dān)心這項(xiàng)先進(jìn)技術(shù)會(huì)被濫用,Meta宣布不會(huì)公開(kāi)其人工智能模型。 %D0Ws9:| Z'bMIdV Meta公司深度學(xué)習(xí)人工智能研究人員在介紹Voicebox時(shí)指出,Voicebox使用了“流匹配”方法,其表現(xiàn)優(yōu)于當(dāng)前最先進(jìn)生成式語(yǔ)音系統(tǒng)使用的擴(kuò)散模型。結(jié)果顯示,Voicebox生成的人工音頻更容易理解,單詞錯(cuò)誤率為1.9%,低于競(jìng)爭(zhēng)對(duì)手的5.9%。此外,Voicebox生成的音頻與真人的相似性更高,同時(shí)速度快了近20倍。 8_$2aqr -^Va]Lk
| |