宋歌平在會議上展示如何讓講英文的微軟研究暨策略長Craig Mundie利用TTS以他的聲音講中文。 |
微軟亞洲研究院負責語音的宋歌平在上周舉行的Techfest 2012研究會議上展示了如何以使用者的語音講述各種語言。 該專案是屬於微軟文字轉語音(text-to-speech,TTS)系統服務的一環,稱為多語言TTS,可分析使用者講單一語言的音色及語調,然後讓機器學習他的語調,並講出中文、西班牙文、法文等26種語言。這代表使用者只要以自己的語言輸入,就可以選擇轉成任一種語言說出,而且維持自己的口音。 微軟研究院策略暨通訊總經理Kevin Schofield說明,當使用手機或導航系統尋找一家法國餐廳、西班牙街道名稱或稱呼一個非英文名字的友人時,都會感到尷尬,雖然以TTS系統可用人類的語音與正確的腔調讀出,但在多語世界中的表現尚不佳。 宋歌平則交叉訓練了TTS系統,讓它能夠僅從單一語言的口音中攫取各種講述其他語言的要件,使其在不同語言也能達到正確的咬字;宋歌平在會議上展示如何讓講英文的微軟研究暨策略長Craig Mundie利用TTS以他的聲音講中文。表示未來不僅是軟體向人類學習語言的腔調,反之人類也可向軟體學習以自己口音說出的各種語言。 宋歌平表示,該技術有多種應用,例如對於一個在國外旅行但只會講單一語言的旅人而言,軟體先進行語音辨識,然後翻譯,最後把文字轉成語音,並以使用者的口音說出各種語言。 |
歡迎光臨 伊莉討論區 (http://a401.file-static.com/) | Powered by Discuz! |