靈云開(kāi)放平臺(tái)憑借捷通華聲十幾年的功底,語(yǔ)音合成、語(yǔ)音識(shí)別技術(shù)無(wú)論在“云”還是“端”,用戶均可以輕松調(diào)用。靈云語(yǔ)音合成播放輕松自然,尤其值得指出的是,靈云可讓合作伙伴選擇適合于自身應(yīng)用的多種聲音,并提供中文普通話、粵語(yǔ)(廣東話)、維吾爾語(yǔ)、英語(yǔ)、德語(yǔ)、法語(yǔ)、俄羅斯、西班牙、日語(yǔ)、韓語(yǔ)等在內(nèi)十幾種語(yǔ)言的語(yǔ)音合成能力;而語(yǔ)音識(shí)別因其對(duì)硬件資源的特殊要求,實(shí)現(xiàn)“端”識(shí)別對(duì)技術(shù)提出更高的要求,靈云離線式語(yǔ)音“端”識(shí)別以識(shí)別率高、定制簡(jiǎn)單等特點(diǎn),與靈云語(yǔ)音合成一起為用戶提供幾乎完美的智能語(yǔ)音“云+端”服務(wù)。
張連毅講到:“靈云率先推出‘云 + 端’服務(wù)模式,是捷通華聲的一種理念,一切為用戶著想,即‘舍棄’云端服務(wù)可以獲取所謂寶貴數(shù)據(jù)資源與用戶資源等利益,滿足用戶甚至在沒(méi)有網(wǎng)絡(luò)的環(huán)境下,仍然能夠方便使用智能語(yǔ)音技術(shù)能力,也讓數(shù)以億計(jì)的大眾不必為‘高昂’的流量費(fèi)買單,輕松享受智能語(yǔ)音等HCI技術(shù)能力的服務(wù)。”
一項(xiàng)好的智能人機(jī)交互技術(shù)簡(jiǎn)單來(lái)說(shuō),就是讓機(jī)器更好地“讀懂”用戶的意圖。隨著語(yǔ)音識(shí)別率地提升,在確保識(shí)別率的前提下,對(duì)于噪音的處理就顯得尤為重要。在噪音環(huán)境中,有一項(xiàng)技術(shù)不可或缺,它就是語(yǔ)義理解。張連毅稱:“靈云語(yǔ)義理解可對(duì)輸入語(yǔ)音的語(yǔ)義進(jìn)行分析,保證識(shí)別率的同時(shí),也確保語(yǔ)音合成播報(bào)使用者需要獲得的準(zhǔn)確信息。”
據(jù)了解,靈云“云 + 端”自推出以來(lái),迅速為產(chǎn)業(yè)所接納,不僅提供智能語(yǔ)音技術(shù)于導(dǎo)航領(lǐng)域,百度語(yǔ)音助手、搜狗語(yǔ)音助手、聚熵360、南京米果、蟲(chóng)洞語(yǔ)音助手等系列語(yǔ)音助手軟件;天行輸入法、百度輸入法、觸寶輸入法,也包括“漢字英雄”、漢字書(shū)寫大賽更是將智能語(yǔ)音、智能圖像“云 + 端”及其合作模式,超乎想象地完美應(yīng)用。
隨著智能語(yǔ)音技術(shù)引發(fā)關(guān)注,智能語(yǔ)音“互聯(lián)網(wǎng)入口說(shuō)、關(guān)卡壁壘說(shuō)、大數(shù)據(jù)說(shuō)、資本說(shuō)”等各種說(shuō)法風(fēng)靡IT產(chǎn)業(yè),甚至最近又出現(xiàn)了“血統(tǒng)說(shuō)、家族說(shuō)”。面對(duì)眾多學(xué)說(shuō),張連毅則一笑了之,只淡然說(shuō)了一句:“說(shuō)一千,道一萬(wàn),語(yǔ)音識(shí)別、語(yǔ)音合成其實(shí)就是‘工具’,一個(gè)人與機(jī)器交流的工具。”即無(wú)論什么時(shí)候,智能語(yǔ)音交互最主要的核心功能還是一個(gè)聲音錄入與輸出的工具。張連毅介紹說(shuō),智能語(yǔ)音技術(shù)差不多每十年就“熱鬧”一場(chǎng),他相信:當(dāng)智能語(yǔ)音更加實(shí)用,也充分滿足了大眾的好奇之后,很快會(huì)象過(guò)去一樣回歸到自然與純樸——在這個(gè)領(lǐng)域中,有心的,會(huì)安心提高語(yǔ)音識(shí)別準(zhǔn)確率、語(yǔ)音合成自然度,關(guān)注用戶使用與體驗(yàn);炒作的,一定耐不住這種技術(shù)螺旋式進(jìn)步的“寂寞”,受不了“只有更好、沒(méi)有最好”的刺激,也會(huì)悄然退場(chǎng)。
合作共贏,促進(jìn)中國(guó)語(yǔ)音產(chǎn)業(yè)發(fā)展
談到將要舉辦的“2013中國(guó)語(yǔ)音產(chǎn)業(yè)年會(huì)”,張連毅并不隱瞞對(duì)語(yǔ)音產(chǎn)業(yè)聯(lián)盟過(guò)去的失望,及對(duì)未來(lái)已擁有的很高期望。去年,在工信部支持下成立的中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟,卻只有一家專業(yè)語(yǔ)音企業(yè),包括捷通華聲、中科信利、得意音通等專業(yè)語(yǔ)音公司,及百度、騰訊等從事語(yǔ)音技術(shù)應(yīng)用的大型互聯(lián)網(wǎng)公司,甚至清華大學(xué)實(shí)力強(qiáng)悍的語(yǔ)音研究機(jī)構(gòu)均被“莫名其妙的擋在外面”。張連毅說(shuō),這次年會(huì),很高興看到工信部相關(guān)領(lǐng)導(dǎo)與相關(guān)部門的高度重視,并深入到國(guó)內(nèi)所有語(yǔ)音企業(yè)、研究機(jī)構(gòu)中調(diào)研,充分聽(tīng)取各方意見(jiàn),促成了一個(gè)真正集“產(chǎn)、學(xué)、研”一體化,幾乎容納所有語(yǔ)音技術(shù)領(lǐng)域相關(guān)企業(yè)與研究單位參加的語(yǔ)音產(chǎn)業(yè)聯(lián)盟的誕生。
張連毅認(rèn)為,語(yǔ)音等HCI技術(shù)產(chǎn)業(yè)擁有巨大的發(fā)展空間,要跳出“狹小”的空間,要擁有與發(fā)展大產(chǎn)業(yè)相匹配的博大心胸,更不要“搞山頭”,“拉派系”,市場(chǎng)競(jìng)爭(zhēng)不同于學(xué)術(shù)討論,服務(wù)市場(chǎng)與廣大用戶才是實(shí)力的最好體現(xiàn)。自“863”計(jì)劃開(kāi)始,國(guó)家已在語(yǔ)音技術(shù)領(lǐng)域投入了巨額的科研基金,也可謂碩果累累,如今幾乎所有的語(yǔ)音企業(yè)也都多少享受到這些成果,此乃國(guó)家遠(yuǎn)見(jiàn)之舉,產(chǎn)業(yè)發(fā)展之幸!而得到國(guó)家直接支持最多的企業(yè)或者機(jī)構(gòu),也應(yīng)想到,伴隨智能語(yǔ)音產(chǎn)業(yè)的發(fā)展,支持社會(huì)產(chǎn)業(yè)發(fā)展,回饋社會(huì),回饋大眾是義不容辭的責(zé)任與義務(wù)。
談到捷通華聲未來(lái)發(fā)展,張連毅表示:“捷通華聲將致力發(fā)展靈云開(kāi)放平臺(tái),靈云不會(huì)發(fā)展單一技術(shù)能力,將在發(fā)揮語(yǔ)音識(shí)別、語(yǔ)音合成等多項(xiàng)HCI技術(shù)優(yōu)勢(shì)的基礎(chǔ)上,不斷與學(xué)術(shù)界、產(chǎn)業(yè)界合作,推出更多的HCI技術(shù)能力,讓人機(jī)交互像人與人溝通一樣的簡(jiǎn)單自然,促進(jìn)合作共贏成為HCI產(chǎn)業(yè)融入中國(guó)IT產(chǎn)業(yè)的主旋律。”
今年,捷通華聲靈云已設(shè)立1000萬(wàn)發(fā)展基金,半年來(lái)資金的使用,包括對(duì)國(guó)內(nèi)各種HCI技術(shù)各種學(xué)術(shù)會(huì)議的支持已取得非常好的效果。如果哪家科研院所、或者企業(yè)有新的HCI技術(shù),靈云都可以為其提供平臺(tái)支持、資金與市場(chǎng)支持,靈云的目標(biāo)是融合所有成熟的HCI技術(shù),并向社會(huì)全面開(kāi)放,堅(jiān)定支持中國(guó)實(shí)現(xiàn)從“中國(guó)制造”向“中國(guó)創(chuàng)造”的歷史性轉(zhuǎn)變。張連毅最后強(qiáng)調(diào)說(shuō):“相信未來(lái)發(fā)展,智能語(yǔ)音等HCI技術(shù)依然會(huì)呈現(xiàn)螺旋式進(jìn)步趨勢(shì),無(wú)論智能語(yǔ)音、還是智能圖像,抑或生物識(shí)別。沒(méi)有最好,只有更好;只有合作,才會(huì)更好!”
關(guān)于張連毅:北京捷通華聲語(yǔ)音技術(shù)有限公司董事長(zhǎng),清華企業(yè)家協(xié)會(huì)(TEEC)成員。1989年獲得清華大學(xué)環(huán)境工程系學(xué)士學(xué)位。1990年,與清華大學(xué)吳佑壽院士、丁曉清教授合作,推進(jìn)“863”計(jì)劃成果漢字印刷體識(shí)別系統(tǒng)(OCR)的商品化進(jìn)程,1992年,受當(dāng)時(shí)國(guó)家科委、清華大學(xué)委托,創(chuàng)辦清華文通公司,專注發(fā)展OCR等圖像識(shí)別技術(shù)應(yīng)用。1992年底至1998年6月赴美學(xué)習(xí)、工作。1998年8月歸國(guó),與清華大學(xué)電子系陳明博士創(chuàng)建北京捷通軟件技術(shù)有限公司,全方位發(fā)展HCI技術(shù)應(yīng)用。2000年與中國(guó)科學(xué)院聲學(xué)所呂士楠、北京大學(xué)顧小鳳兩位教授共同創(chuàng)建北京捷通華聲語(yǔ)音技術(shù)有限公司。
聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書(shū)面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。