蘋果日報/2016.07.16
今年6月的一個午後,45歲美國漸凍人症患者潔西‧列文(Jessie Levine)在新罕布夏州的家中,聽到她發病前錄的電話留言。「我聽起來好年輕!講話好快!」潔西不無感嘆地說。她罹患的肌萎縮性脊髓側索硬化症(ALS)已經侵害她的神經,使她現在講話很慢,含糊不清,以後可能甚至失去說話的能力
但是潔西很快就要有新聲音了。在麻州新創公司VocaliD幫助下,潔西只需要講一點話當樣本,像是張嘴說「啊」,VocaliD就能比對她與「捐聲者」的聲音庫比對,綜合調整,訂製出潔西獨一無二的合成電腦語音。
VocaliD收集1.5萬名自願者的聲音庫,他們花費6小時錄音,大聲念出3500個字。不過潔西用的可能不會是別人的聲音,而是她兩個姐妹提供的聲音。潔西說:「我從來沒有想過有朝一日要用她們的聲音說話。不過我們本來都有點口齒不清,聲音比較悶。」一旦製作完成,潔西可以在電腦或平板電腦上打字,變成她的新聲音讀出來。
VocaliD的創辦人是43歲語言病理學家、電腦科學家派特爾(Rupal Patel),在美國西北大學擔任教授。她有一次遇到說話有困難的一名小女孩與一名成年男子,兩人都用電腦合成語音說話,但由於軟體相同,小女孩的說話聲與男子一模一樣。這使她感到非常震撼。「一個小女孩的義肢會跟一個成年男子的義肢一模一樣嗎?不會嘛。那為什麼輔助電腦語音卻是人人相同?」於是決心開發這種「訂製」語音。
派特爾的研究發現,就算是難以用說話來溝通的人,還是具有一部分控制聲音的能力,像是音高以及聲音大小。這些聲音特徵成為所謂的「說話的旋律」,派特爾分析這些特徵,把捐贈者的聲音與這些特徵整合調整,從而創造出個人特有的電腦合成語音。就算完全不能說話的人,只要還能發一點聲音,也能創造出自己的電腦合成語音。
電腦合成語音由來已久。著名科學家霍金就用英特爾贊助的電腦語音系統「說」出他知名的聲音。但派特爾的VocaliD可以創造出更貼近個人真實聲音特色的語音。派特爾說:「擁有自己的聲音來做溝通,是一份很大的權利。我覺得許多人都忽視這件事了。」派特爾的VocaliD獲得美國國家科學基金會以及美國國立衛生研究院36.5萬美元(約1168萬台幣)的獎助,還在募資網站Indiegogo籌到12.8萬美元資金(約410萬台幣),目前服務對象僅限英語用戶。訂製自己的電腦語音費用為1250美元(約4萬台幣),每年的維護費用是240美元(約7700台幣)。
新聞出處:http://www.appledaily.com.tw/realtimenews/article/new/20160716/909195/ |