首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

英國科學(xué)家成功開發(fā)識別多種語言唇讀技術(shù)
對耳聾患者、執(zhí)法機(jī)構(gòu)以及嘈雜環(huán)境中的工作者具有實際應(yīng)用意義

2009/09/07


  計算機(jī)能夠進(jìn)行唇讀這并不新鮮,但是在英國,它們首次被“教會”識別不同的語言。

  英國科學(xué)家日前研制出可以分辨不同語言的唇讀計算機(jī)。其實研究人員一直在開發(fā)可以讀唇語的計算機(jī),但是它們被“教會”識別各種語言還是第一次。科學(xué)家指出,這項發(fā)明對耳聾患者、執(zhí)法機(jī)構(gòu)以及嘈雜環(huán)境中的工作者具有實際應(yīng)用意義。

  這項研究由英國東安格利亞大學(xué)計算機(jī)科學(xué)學(xué)院的Stephen Cox和Jake Newman指導(dǎo)完成。該技術(shù)是通過對23位掌握兩種或三種語言的人的唇部動作進(jìn)行統(tǒng)計建模而開發(fā)的。該系統(tǒng)能夠識別單個講話者所說的語言,而且具有很高的準(zhǔn)確性。這些語言包括英語、法語、德語、阿拉伯語、漢語普通話及粵語、意大利語、波蘭語和俄語。

  Cox表示:“這是自動唇讀技術(shù)的一次令人激動的進(jìn)步,它第一次科學(xué)地證實了我們已有的直觀推斷,即當(dāng)人們講不同的語言時,他們會以不同的順序出現(xiàn)不同的唇形。”Cox介紹說,“例如,我們發(fā)現(xiàn)講法語的人較常出現(xiàn)圓唇形,而講阿拉伯語的人具有很明顯的舌部動作。”

  Cox補(bǔ)充說:“多年來,科學(xué)家一直在進(jìn)行語音和語言處理法則的基礎(chǔ)研究,比如噪音中的語音識別、公式化語言建模、由語音合成所做的語言處理以及語音處理應(yīng)用的開發(fā)。”

  據(jù)研究人員介紹,自動唇讀技術(shù)中蘊(yùn)含著許多科學(xué)挑戰(zhàn)。目前的項目已經(jīng)解決了其中的幾個主要科學(xué)問題,包括面部動作與感知語音之間是什么關(guān)系;講話者的語言以及談話內(nèi)容如何影響這種關(guān)系;語言、講話者的姿勢以及談話內(nèi)容對識別準(zhǔn)確度有什么影響等。

  這項研究屬于一個更寬泛的自動唇讀項目中的一部分。該項目將建立在先進(jìn)的計算機(jī)視頻和語音識別技術(shù)之上,對視頻中的自動唇讀進(jìn)行研究和評估,從而開發(fā)能夠?qū)碜砸曨l中的目標(biāo)進(jìn)行自動、語言獨(dú)立唇讀的工具和技術(shù)。該項目還尋求量化人類以及自動機(jī)器的能力。研究人員下一步將使這個系統(tǒng)更加適合個人生理學(xué),以及人們說話的方式。

《科學(xué)時報》



相關(guān)鏈接:
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
Convergys定制式語音鑒權(quán)方案獲市場領(lǐng)袖獎 2009-09-02
傳蘋果正研發(fā)iPhone語音識別技術(shù) 可撰寫郵件 2009-08-31
開源的語音識別軟件Simon 0.2發(fā)布 2009-08-28
訊飛語音助力太平人壽客服中心 2009-08-28

靖宇县| 陇南市| 清丰县| 鸡东县| 会宁县| 南平市| 中宁县| 天等县| 庆云县| 津市市| 襄汾县| 丹江口市| 大田县| 绥阳县| 永康市| 黄大仙区| 宁南县| 县级市| 张家港市| 茶陵县| 会泽县| 洞头县| 淮北市| 吉木乃县| 普安县| 瑞丽市| 马公市| 泰兴市| 新蔡县| 凤台县| 雅江县| 治多县| 嵊泗县| 同德县| 东乡县| 松阳县| 黔西县| 辽中县| 苏州市| 克山县| 屏山县|