近幾年來,移動互聯(lián)網(wǎng)蓬勃發(fā)展,基于互聯(lián)網(wǎng)海量數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)有力推進(jìn),智能家電、汽車電子、可穿戴設(shè)備等領(lǐng)域加速應(yīng)用,汽車、醫(yī)療、智能家居、教育等行業(yè)應(yīng)用不斷拓展,智能語音作為新的信息入口,開始引領(lǐng)產(chǎn)業(yè)重大變革。
這一兩年來,我國智能語音市場也是風(fēng)起云涌:2012年8月中國移動以13.6億元戰(zhàn)略投資科大訊飛,科大訊飛受二級市場機(jī)構(gòu)投資者追捧市值超過200億元;云知聲創(chuàng)立僅一年就先后獲得兩輪投資,其中一次融資金額高達(dá)1億元;2013年5月,捷通華聲宣布來自百度、清華大學(xué)戰(zhàn)略投資;2013年8月,百度正式宣布向開發(fā)者開放語音生態(tài)系統(tǒng),包括底層的語音識別技術(shù)應(yīng)用程序開發(fā)接口(API)、百度語音助手軟件開發(fā)工具包(SDK);同樣在這個月騰訊在微信5.0中增加語音輸入功能,一出來便風(fēng)靡大眾,微信APP已經(jīng)成為消費(fèi)者每天必刷的強(qiáng)大APP之一;直到最近,2014年4月12日,云知聲組織創(chuàng)業(yè)公司牽頭成立“全智能交互聯(lián)盟”;2014年4月29日,科大訊飛的訊飛輸入法繼支持粵語、四川話、河南話等方言之后宣布支持東北話語音輸入;5月20日晚,錘子科技首款智能手機(jī)Smartisan T1發(fā)布,借科大訊飛智能語音技術(shù)實(shí)現(xiàn)語音搜索、語音輸入等特色功能……整個產(chǎn)業(yè)一片欣欣向榮。
“智能語音是人機(jī)智能交互的手段之一,而人機(jī)智能交互是目前中國技術(shù)企業(yè)有可能趕超國際的為數(shù)不多的產(chǎn)業(yè)機(jī)遇之一。產(chǎn)業(yè)變革是以技術(shù)為先導(dǎo)的。在PC/互聯(lián)網(wǎng)時代,我國技術(shù)企業(yè)在計(jì)算機(jī)技術(shù)尤其是操作系統(tǒng)等方面,因?yàn)槠鸩酵恚s超微軟、谷歌等國際技術(shù)公司比較難,但在智能交互這個技術(shù)領(lǐng)域,相對而言,目前中西方起步差不多,如果我們能把握好現(xiàn)在的機(jī)會,好好練內(nèi)功,發(fā)展我們自己的包括智能語音在內(nèi)的交互技術(shù),也許在這方面我們可以真正和國際公司一較高下,真正從中國制造走向中國創(chuàng)造。”北京捷通華聲語音技術(shù)有點(diǎn)公司(簡稱捷通華聲)董事長張連毅這樣告訴記者。
與張連毅持相同觀點(diǎn)的還有科大訊飛信息科技股份有限公司(簡稱科大訊飛)副總裁江濤和北京云知聲信息技術(shù)有限公司(簡稱云知聲)CEO黃偉。在他們看來,智能語音是難得的一次產(chǎn)業(yè)良機(jī),錯過語音,中國技術(shù)企業(yè)很難再有機(jī)會趕超國際了。
磨一根針 破一片天
“做語音是需要慢慢熬的。”這句話記者不止聽一個被采訪人說過。
1989年從清華大學(xué)畢業(yè)任職紫光推進(jìn)OCR(圖像掃描識別),中間赴美,2000年與中國科學(xué)院聲學(xué)所研究員呂士楠共同創(chuàng)辦捷通華聲的張連毅稱自己是語音乃至整個智能交互行業(yè)的老兵。在他看來,從“入口說”、“門檻說”到“血統(tǒng)說”再到“技術(shù)說”,這兩年來的語音熱其實(shí)更多是一種炒作,而這種炒作對行業(yè)本身未必有多大好處。“我只認(rèn)可"技術(shù)說"。因?yàn)檎Z音只是交互的方式之一,智能語音就是一門技術(shù),它與應(yīng)用結(jié)合,這項(xiàng)技術(shù)就能創(chuàng)造出巨大價值。而這門技術(shù)的特點(diǎn)是厚積薄發(fā),需要慢慢積累,所以這就決定智能語音產(chǎn)業(yè)是要用一根針刺破天的專業(yè)領(lǐng)域,而不是用一個鐵錘砸出一片聲勢的產(chǎn)業(yè),必須專注、專業(yè),精耕細(xì)作,深耕久釀。”
而所謂的積累,在云知聲CEO黃偉看來,就是算法、數(shù)據(jù)和團(tuán)隊(duì)經(jīng)驗(yàn)的積累。他告訴記者,作為創(chuàng)業(yè)型公司,“云知聲的優(yōu)勢不在于數(shù)據(jù)積累,而在于算法。從云知聲成立第一天起,我們就用了比對手少一個數(shù)量級的數(shù)據(jù)來訓(xùn)練算法模型,最終達(dá)到甚至超越對手產(chǎn)品性能,這個過程我們也積累了豐富而寶貴的團(tuán)隊(duì)經(jīng)驗(yàn)。而現(xiàn)在開放的語音云平臺已經(jīng)讓我們有了很多用戶數(shù)據(jù),我們的數(shù)據(jù)短板已經(jīng)得到了彌補(bǔ)。”