You are here
Home > 即時新聞 > 最人性化AI語音助手?百度DeepVoice最終版 可以模擬出2500種口音

最人性化AI語音助手?百度DeepVoice最終版 可以模擬出2500種口音

內地最大的網絡搜尋公司百度推出DeepVoice最終版本,表示系統可以學習2500種聲音,而每種聲音只需30分鐘時間。

DeepVoice初版於今年年初推出,是利用深度學習人工智能技術來將文字合成至人類語音的系統,首個版本就能夠合成短暫的句子,粗略聽上去幾乎與真實人類說話無區別,不過每學習一種聲音,就需要數小時的數據。而DeepVoice就減至只需半小時的數據,並可學習數百種口音,今次最終版更增至2500種口音。

不過,百度在今次最終版展示的合成聲音就與初版不同,聽起來很像合成聲音,比初版像真度低了很多。百度辨稱這不是系統目標,若果目的是生產一兩種聲音,系統早已合成非常自然。百度正試圖製作一個可以掌握分辨多種口音或人物微細差別的系統,雖然目前的限制是2,500種,但團隊表示未來版本將可以掌握10,000種或更多。語和日語為Google助手生成語音。

 

來源:The Verge

Angela
(已離職)
Top