首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音識別(ASR)  語(yǔ)音識別產(chǎn)品

發(fā)表評論分享按鈕

語(yǔ)音識別聲控導航和后臺服務(wù)聲控導航之爭

2012/06/08

  多年前,在科幻作家和未來(lái)學(xué)家想象的文章中以及科幻大師的電影中,人們可以用聲音來(lái)控制生活中的設備。多年后的今天,這種理念正在試圖改變我們的生活。

  2012年春,蘋(píng)果Siri的流行帶火了語(yǔ)音控制的概念。而在車(chē)載導航領(lǐng)域,2011年6月,好幫手電子旗下翼卡車(chē)聯(lián)網(wǎng)公司在鄭州首次發(fā)布了語(yǔ)音控制類(lèi)的車(chē)聯(lián)網(wǎng)產(chǎn)品:領(lǐng)航服務(wù),首次將語(yǔ)音控制的概念在車(chē)聯(lián)網(wǎng)領(lǐng)域內實(shí)現。在短短的半年之后的2012年廣州AAITF展上,聲控導航的概念和產(chǎn)品遍地開(kāi)花。從“聲控導航升級風(fēng)暴”的翼卡車(chē)聯(lián)網(wǎng),“智駕云”的天緣電子,“聲控更安全”的卡仕達,以APP應用為主打的凱立德等車(chē)載導航行內的新貴和大佬們都開(kāi)啟導航的“聲控”之路。

  乍看之下,聲控技術(shù)來(lái)勢洶洶,大有欲“革”前些年熱火的專(zhuān)車(chē)專(zhuān)用手寫(xiě)導航“命”的勢頭,目前,行業(yè)內的聲控導航出現了純語(yǔ)音識別的智能聲控和以后臺服務(wù)為支撐的聲控導航兩種實(shí)現方式。前者在行業(yè)內還鮮有落地產(chǎn)品,而后者以卡仕達領(lǐng)航系列、翼卡車(chē)聯(lián)網(wǎng)公司聲控導航•智能升級系統為代表的聲控導航已經(jīng)落地商用。不過(guò)就目前兩種技術(shù)的成熟度而言,在車(chē)載終端上,誰(shuí)也不具有壓倒性的優(yōu)勢,但毫無(wú)疑問(wèn)的是,智能聲控和后臺服務(wù)聲控之間的暗戰已經(jīng)拉開(kāi)帷幕。

  誰(shuí)主沉浮?智能聲控與后臺服務(wù)聲控之爭

  現今市面上搶占“聲控”概念的導航大略能分兩類(lèi):一是無(wú)需后臺支持的智能聲控,一是由服務(wù)后臺支持的聲控導航。

  智能聲控通常以應用軟件形式出現,它專(zhuān)注增強導航功能,能識別用戶(hù)的日常用語(yǔ),很酷很炫,但精準度及客戶(hù)體驗成為大規模應用的考驗。智能聲控在取得突飛猛進(jìn)的發(fā)展時(shí),也還有不少瓶頸需要突破。第一,軟件兼容性,智能聲控軟件使用范圍狹窄。智能聲控軟件一般只能兼容一種或是幾種終端系統,也就是說(shuō)用戶(hù)只能選擇特定的手機系統或是車(chē)載導航系統,才能運用聲控導航軟件,能享受聲控導航帶來(lái)方便的客戶(hù)范圍受到很大的限制。第二,智能聲控軟件沒(méi)有屬于自己的后臺,能實(shí)現的功能單一,提供的服務(wù)有限。現在的車(chē)主對車(chē)聯(lián)網(wǎng)服務(wù)需求越來(lái)越多,安全、方便、娛樂(lè )等都成為選擇的標準,顯而易見(jiàn),單一的功能不能滿(mǎn)足客戶(hù)對車(chē)聯(lián)網(wǎng)服務(wù)的期望。第三,在進(jìn)行聲控時(shí),為了減少周?chē)肼晫浖挠绊懀脩?hù)要把手機拿到嘴邊讓軟件接收聲音,并且需要使用標準的普通話(huà),軟件才能進(jìn)行準確的語(yǔ)音識別。也就是說(shuō)在導航過(guò)程中不能徹底解放雙手,甚至可能會(huì )出現不能識別用戶(hù)方言的情況,語(yǔ)義識別就更談不上了。智能聲控的進(jìn)一步推廣和普及,都要先解決包括但不限于以上瓶頸。不過(guò)我們有信心期待,假以時(shí)日,三五年后,智能聲控能更上新臺階,步入尋常百姓家。

  另一種擁有服務(wù)后臺支撐的聲控導航,是以“產(chǎn)品+服務(wù)”的產(chǎn)品模式出現,產(chǎn)品和服務(wù)提供商建立起自己的服務(wù)后臺,除了能夠實(shí)現聲控導航功能,同時(shí)能為用戶(hù)提供機票酒店預訂、餐飲租車(chē)預訂、全國道路救援等服務(wù)。服務(wù)后臺的客服人員能靈活識別用戶(hù)的語(yǔ)言。不過(guò)此種模式的主要瓶頸在于人工服務(wù)需要新增使用成本,同時(shí),各品牌產(chǎn)品之間的后臺兼容及服務(wù)的標準化有很多功課尚待彌補,目前尚未有車(chē)聯(lián)網(wǎng)行業(yè)的服務(wù)化標準出現。雖然目前有第三方積極運作兼容各家產(chǎn)品平臺的應用,但距離實(shí)際的大規模應用上,還有一定距離。

  目前,以智能聲控為代表的是華陽(yáng)和凱立德,華陽(yáng)的智能聲控導航已在其官方微博發(fā)布體驗式視頻,凱立德聲控APP已經(jīng)在A(yíng)AITF上亮相,相信不久之后都將面向消費者,接受消費者的全面考驗。以后臺服務(wù)為主的聲控導航以好幫手電子旗下卡仕達、車(chē)友互聯(lián)、智成DOD以及翼卡車(chē)聯(lián)網(wǎng)公司等的導航為主。好幫手電子旗下卡仕達導航以及翼卡車(chē)聯(lián)網(wǎng)公司針對手寫(xiě)導航升級為聲控導航的“聲控導航•智能升級系統”已經(jīng)大規模面市。智能聲控還是后臺服務(wù)聲控誰(shuí)主沉浮?需要交給消費者來(lái)檢驗,我們拭目以待。

  曲線(xiàn)前進(jìn)?語(yǔ)音控制會(huì )是車(chē)聯(lián)網(wǎng)發(fā)展趨勢

  在今年3月底科大訊飛舉行的語(yǔ)音開(kāi)發(fā)者大會(huì )上,研發(fā)出世界上第一個(gè)“非特定人連續語(yǔ)音識別系統”的李開(kāi)復強調:“假如能做到一定程度的語(yǔ)意的理解,需要投入多少,怎么樣讓開(kāi)發(fā)者很好的介入,這是一個(gè)問(wèn)號。” “人們一旦開(kāi)始使用語(yǔ)音跟機器交流了,就會(huì )把它當做一個(gè)人,這個(gè)帶來(lái)的超級高的期望值會(huì )給語(yǔ)音帶來(lái)很大的挑戰。”

  從李開(kāi)復的發(fā)言中,我們不難發(fā)現語(yǔ)音識別相對容易,語(yǔ)義理解相對困難,同時(shí)語(yǔ)音的交流會(huì )帶來(lái)用戶(hù)期望值的提高。故在謹慎進(jìn)入語(yǔ)音控制的同時(shí),也凸顯出語(yǔ)音控制將是發(fā)展趨勢。無(wú)論是智能聲控,還是后臺服務(wù)的聲控,語(yǔ)音控制將讓人真正擺脫雙手與機器交流,讓未來(lái)人機交互進(jìn)入一個(gè)新紀元,不僅在導航領(lǐng)域,在未來(lái)車(chē)聯(lián)網(wǎng)的競爭中,語(yǔ)音等人機交互方式的競爭也將是至關(guān)重要的一環(huán)。

  從語(yǔ)音技術(shù)在業(yè)界以外范圍的應用看,iPhone4S推出后,最大的變化是語(yǔ)音技術(shù),語(yǔ)音技術(shù)好幾年前就在手機上有應用,之前制約語(yǔ)音技術(shù)發(fā)展的瓶頸之一就是命令過(guò)少,且識別率較低,而隨著(zhù)云技術(shù)的開(kāi)發(fā)成熟,具有云技術(shù)的聲控技術(shù)將大大提高終端設備的識別能力。科大訊飛總經(jīng)理方奇認為,在眾多的功能實(shí)際應用中,語(yǔ)音互動(dòng)是車(chē)聯(lián)網(wǎng)發(fā)展的一個(gè)關(guān)鍵點(diǎn),從安全角度和便利性考慮,語(yǔ)音識別應用都是未來(lái)車(chē)聯(lián)網(wǎng)發(fā)展的主流方向。他認為,語(yǔ)音互動(dòng)實(shí)際上解放了人的雙手,讓行車(chē)變得更加安全。筆者體驗過(guò)一段時(shí)間科大飛訊語(yǔ)音輸入法,在識別率方面,這個(gè)輸入法整體表現基本滿(mǎn)意,當然,那是在體驗用該輸入法發(fā)短信,如果將此技術(shù)適用到車(chē)載主機上,用于識別功能操控,其識別效率和正確率應該會(huì )有大幅提高。

  在國外,福特SYNC的車(chē)載主機就是通過(guò)語(yǔ)音技術(shù)突破車(chē)載智能平臺的難題,而在國內市場(chǎng),很多企業(yè)也意識到了這個(gè)問(wèn)題,多家企業(yè)都在語(yǔ)音控制上“悶頭大發(fā)財”,更將語(yǔ)音控制技術(shù)用自己的理解向前推動(dòng),如華陽(yáng)在推出了語(yǔ)音控制基礎上,進(jìn)一步增加了手勢控制功能主機,天緣、凱越等廠(chǎng)家推出的聲控主機已經(jīng)可以辨識具體功能項目中的功能細目,如進(jìn)入iPod界面后,可以用語(yǔ)音選擇曲目,在導航界面下實(shí)現本地化語(yǔ)音導航,據傳,好幫手電子以及旗下翼卡車(chē)聯(lián)網(wǎng)公司也已經(jīng)投入語(yǔ)音控制研發(fā)多年,2011年發(fā)布概念性產(chǎn)品,可能因為尚未大面積推廣的原因,目前對外界保持低調和神秘。

  可以預想一下,聲控技術(shù)應用于車(chē)載主機后,人機對話(huà)將會(huì )變得更輕松,很可能會(huì )變得像開(kāi)啟按鈕一樣司空見(jiàn)慣。雖然語(yǔ)音控制在軟硬件之上還離大規模應用有比較長(cháng)的距離,在短期內,后臺服務(wù)將作為主導,但曲線(xiàn)前進(jìn),并最終成為車(chē)聯(lián)網(wǎng)發(fā)展趨勢的大局已經(jīng)明朗化。

  總結陳詞

  iPhone 4S中的Siri語(yǔ)音控制系統自發(fā)布以后就掀起了語(yǔ)音系統開(kāi)發(fā)的熱潮,語(yǔ)音技術(shù)是未來(lái)的發(fā)展的趨勢,但是目前而言還是困難重重,尤其是面對博大精深的中文,語(yǔ)義理解更是困難。語(yǔ)音識別技術(shù)成熟運用在車(chē)聯(lián)網(wǎng)中還有很長(cháng)的路要走,故在短期內,以自主后臺,自建呼叫中心實(shí)現聲控導航的車(chē)聯(lián)網(wǎng)企業(yè)將搶占先機,率先占有市場(chǎng)。

  目前,以后臺服務(wù)為支撐的車(chē)聯(lián)網(wǎng)服務(wù)的客戶(hù)體驗、靈活度、服務(wù)延展性等方面略占優(yōu)勢,將成為短期(未來(lái)1到3年)的主流和熱點(diǎn),尤其是即滿(mǎn)足消費者使用需求,又結合當下經(jīng)濟、綠色、環(huán)保熱點(diǎn),能實(shí)現將使用過(guò)的手寫(xiě)導航直接通過(guò)較為簡(jiǎn)單的方式升級為聲控導航的產(chǎn)品。但也期待,假以時(shí)日,伴隨科技的發(fā)展,智能聲控能帶來(lái)更好的應用和體驗。

音響改裝技術(shù)



相關(guān)閱讀:
讓你的設備更加智能,語(yǔ)音技術(shù)如何提升用戶(hù)體驗? 2012-05-25
語(yǔ)音時(shí)代的到來(lái)與群體式憂(yōu)慮 2012-04-06
專(zhuān)訪(fǎng)科大訊飛吳曉如:語(yǔ)音云服務(wù) 深入千家萬(wàn)戶(hù) 2012-03-27
語(yǔ)音操控體驗攪熱移動(dòng)互聯(lián)網(wǎng) 2012-01-30
捷通華聲董事長(cháng)張連毅:HCI前景不可限量 2011-12-26

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識別ASR  

青海省| 宣威市| 中卫市| 蚌埠市| 鸡西市| 呼伦贝尔市| 岱山县| 自贡市| 霞浦县| 井研县| 丹东市| 宝应县| 灌云县| 建昌县| 诸暨市| 武陟县| 抚远县| 旅游| 城市| 曲水县| 和平县| 汪清县| 建平县| 商水县| 南安市| 新绛县| 喜德县| 黄石市| 拜泉县| 涿州市| 肃北| 临澧县| 台北县| 宁阳县| 龙胜| 建德市| 万盛区| 麟游县| 大城县| 洞头县| 大田县|