- 最後登錄
- 2024-9-18
- 在線時間
- 417 小時
- 註冊時間
- 2007-3-10
- 閱讀權限
- 30
- 精華
- 0
- UID
- 915595
- 帖子
- 817
- 積分
- 1113 點
- 潛水值
- 38017 米
| 回覆中加入附件並不會使你增加積分,請使用主題方式發佈附件。 宋歌平在會議上展示如何讓講英文的微軟研究暨策略長Craig Mundie利用TTS以他的聲音講中文。
| | 微軟亞洲研究院負責語音的宋歌平在上周舉行的研究會議上了如何以使用者的語音講述各種語言。
該專案是屬於微軟文字轉語音(text-to-speech,TTS)系統服務的一環,稱為多語言TTS,可分析使用者講單一語言的音色及語調,然後讓機器學習他的語調,並講出中文、西班牙文、法文等26種語言。這代表使用者只要以自己的語言輸入,就可以選擇轉成任一種語言說出,而且維持自己的口音。
微軟研究院策略暨通訊總經理Kevin Schofield說明,當使用手機或導航系統尋找一家法國餐廳、西班牙街道名稱或稱呼一個非英文名字的友人時,都會感到尷尬,雖然以TTS系統可用人類的語音與正確的腔調讀出,但在多語世界中的表現尚不佳。
宋歌平則交叉訓練了TTS系統,讓它能夠僅從單一語言的口音中攫取各種講述其他語言的要件,使其在不同語言也能達到正確的咬字;宋歌平在會議上展示如何讓講英文的微軟研究暨策略長Craig Mundie利用TTS以他的聲音講中文。表示未來不僅是軟體向人類學習語言的腔調,反之人類也可向軟體學習以自己口音說出的各種語言。
宋歌平表示,該技術有多種應用,例如對於一個在國外旅行但只會講單一語言的旅人而言,軟體先進行語音辨識,然後翻譯,最後把文字轉成語音,並以使用者的口音說出各種語言。 | ... |
|