發(fā)表評論分享按鈕

Siri開發(fā)商推出普通話應(yīng)用 聲調(diào)成最大挑戰(zhàn)

2012/03/23

  北京時間3月21日消息,據(jù)國外媒體報道,國外媒體日前發(fā)表分析文章稱,語音識別軟件開發(fā)商N(yùn)uance通信公司除開發(fā)了蘋果語音助手Siri外,還推出了一款智能手機(jī)語音應(yīng)用Dragon,這項(xiàng)應(yīng)用支持多種語言,但在漢語普通話的應(yīng)用上,聲調(diào)成了這項(xiàng)應(yīng)用面臨的最大挑戰(zhàn)。

 
圖:智能手機(jī)語音應(yīng)用Dragon

  以下是文章全文:

  在期待著蘋果今年推出中文版Siri的同時,我決定試用一下Nuance開發(fā)的另一款智能手機(jī)語音應(yīng)用Dragon,這項(xiàng)語音應(yīng)用支持多種語音,包括漢語普通話。

  盡管與其他多數(shù)語音識別軟件一樣,中文版Dragon無法達(dá)到百分之百的準(zhǔn)確,但是總的來說表現(xiàn)還是相當(dāng)驚人的。首先,漢語的聲調(diào)對語音識別來說極具挑戰(zhàn)性,漢語普通話僅有400個單章節(jié)發(fā)音,是按照聲調(diào)來區(qū)分不同單詞的。這會意味著什么呢?

  以媽媽的“媽”為例,“媽”字讀一聲“mā”,讀四聲就是“罵”(mà),讀三聲則為“馬”(mǎ),而所有這些字的發(fā)音都像“ma”,只是聲調(diào)不同,所表示的意思也是大相徑庭。開發(fā)一款能夠識別“媽媽罵馬”(māmā mà mǎ)的句子的軟件是件非常困難的事。

  盡管漢語普通話是中國的國語,但是漢語有七大方言和無數(shù)的地方口音。Nuance負(fù)責(zé)Dragon應(yīng)用開發(fā)的副總裁吉姆•吳(Jim Wu)表示:“在中國大陸,每個人都有不同的口音,我們所面臨的挑戰(zhàn)之一就是確保該語音識別系統(tǒng)能夠識別那些說普通話且口音較輕的用戶的語音。”

  Nuance總部位于美國馬薩諸塞州伯靈頓,公司2011財年實(shí)現(xiàn)營收14億美元。Nuance在推出英文版Dragon 應(yīng)用后不久,便于2011年3月推出了兩款免費(fèi)的漢語普通話版Dragon應(yīng)用,6月份又推出了廣東話和臺灣話版的Dragon應(yīng)用。Dragon Dictation應(yīng)用可以轉(zhuǎn)錄文本、電子郵件、Facebook和Twitter信息。Dragon Search應(yīng)用則可以用于互聯(lián)網(wǎng)搜索。與Siri不同,Dragon無法與用戶實(shí)現(xiàn)互動。

  使用Dragon應(yīng)用時,用戶需要點(diǎn)擊一個虛擬“按鈕”來開始和停止錄音。Nuance首席營銷官彼得•馬奧尼(Peter Mahoney)表示,所有處理都是在服務(wù)器上進(jìn)行的,用戶的語音信息是在被傳輸?shù)椒⻊?wù)器上后,由服務(wù)器來收聽、錄制,然后將文本信息傳回到設(shè)備上的。

  對于像“最近的星巴克咖啡廳在哪里”和“我要去市場”這樣的一些基本語句,Dragon識別起來沒有什么問題。但對于許多用戶來說,真正的樂趣是測試設(shè)備的識別極限,看看這項(xiàng)技術(shù)能夠在多大程度上匹配人類的語言和思想。因此,我用漢語繞口令來挑戰(zhàn)Dragon應(yīng)用的極限:媽媽騎馬,馬慢,媽媽罵馬。這句話的發(fā)音就是“Māmā qí mǎ, mǎ màn, māmā mà mǎ”。Dragon能夠捕捉到大部分正確的發(fā)音,但是并不能給出正確的單詞。Dragon給出的結(jié)果是:媽媽起碼,媽媽媽媽嗎?嗎?,這里面的一個問題就是這些單詞的發(fā)音都是“ma”。

  馬奧尼表示,盡管Dragon還不能完全準(zhǔn)確地識別語音,但是這項(xiàng)應(yīng)用具備自主學(xué)習(xí)和改進(jìn)的功能。由于所有語音處理都是在服務(wù)器上進(jìn)行的,因此Dragon收集用戶語音數(shù)據(jù)來學(xué)習(xí)語言的結(jié)構(gòu)和詞語的組合。Dragon還習(xí)慣每個用戶的地方口音,因此使用越多,Dragon識別語音就越準(zhǔn)確。馬奧尼還表示:“這些錄音將保存下來,我們可以使用自動化工具對結(jié)果進(jìn)行分析。有時候,你需要用錄音讓人們進(jìn)行對比,看看怎樣才能做得更好。”

騰訊科技



相關(guān)閱讀:
Nuance Research:消費(fèi)者喜愛的移動應(yīng)用功能有哪些? 2012-03-22
科大訊飛聯(lián)姻中國聯(lián)通 布局人機(jī)交互等待收獲 2012-03-19
工信部:移動互聯(lián)網(wǎng)應(yīng)用增速中國居全球第一 2012-03-19
Siri續(xù)寫蘋果傳奇 中國Siri在哪里? 2012-03-16
科大訊飛與中國聯(lián)通簽署戰(zhàn)略合作協(xié)議的公告 2012-03-16

熱點(diǎn)專題:  語音合成TTS 語音識別ASR    移動互聯(lián)網(wǎng)
分類信息:  移動互聯(lián)網(wǎng)_與_語音應(yīng)用  移動互聯(lián)網(wǎng)_與_移動  移動互聯(lián)網(wǎng)_與_移動

资源县| 灵山县| 广南县| 城市| 桂阳县| 玉龙| 渝北区| 汤阴县| 耒阳市| 泸溪县| 石城县| 周至县| 福鼎市| 景谷| 景东| 苍山县| 黔西| 宁强县| 普安县| 浑源县| 东乌| 淮南市| 惠州市| 读书| 同江市| 伊春市| 合川市| 台江县| 鹿邑县| 鸡泽县| 土默特右旗| 克什克腾旗| 三都| 禄劝| 泰和县| 昌平区| 东乌珠穆沁旗| 宜兰市| 石景山区| 鲁山县| 奉新县|