首頁>>廠商>>語音識別與合成>> 捷通華聲

捷通華聲語音合成(jTTS)技術介紹及解決方案

2002/09/01

一、 捷通華聲TTS(jTTS)介紹

1. 捷通華聲TTS技術文語轉換的基本原理

捷通TTS技術文語轉換的基本結構:

  語言學處理在文語轉換系統(tǒng)中起著重要的作用,他主要是模擬人對自然語言的理解過程--文本規(guī)整、詞的切分、語法分析和語義分析,使計算機對輸入的文本能完全理解,并給出后兩部分所需要的各種發(fā)音提示。

  韻律處理的目的是為合成語音規(guī)劃出音段特征,如音高、音長和音強等,使合成語音能正確表達語意,聽起來更加自然悅耳。

  聲學處理的主要功能是根據前兩部分處理結果的要求輸出語音,即合成語音。

2. 捷通華聲TTS的特點

  捷通華聲公司在2001年7月完成了最新版本的捷通華聲TTS核心。新版本基于大規(guī)模真實錄音的語音庫,音庫提供的樣本多,選音范圍大,可選擇到更匹配的發(fā)音,另外,在選音和拼接時將超越了音節(jié)的層次,能夠進行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通華聲新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫中的所有字符的發(fā)音,新的捷通華聲TTS技術的合成的語音幾乎達到自然說話的效果。

3. 捷通華聲TTS的進一步發(fā)展方向

  捷通華聲TTS將在下面幾個方向發(fā)展:

二、 捷通華聲TTS技術(jTTS)在CTI領域中的應用

  捷通華聲TTS技術在CTI行業(yè)中的應用提供三種解決方案:本地接口調用方案、語音服務器方案、離線合成方案。

1. 捷通華聲TTS本地接口調用方案(jTTS SDK)

方案概論:

  本地接口調用方案提供捷通華聲TTS開發(fā)工具包(jTTS-SDK)可使用戶在其開發(fā)的系統(tǒng)中加入語音合成的功能。jTTS-SDK是基于Win32(32位Windows環(huán)境,包括Windows95/98/2000/NT)平臺下的開發(fā)工具包,因此這種方案要求使用方的聲訊服務系統(tǒng)所運行的是32 位Windows環(huán)境的服務器,并且需要對使用方系統(tǒng)進行部分程序的改造。該方案適用于要求使用方具有二次開發(fā)能力的集成和應用商。


本地接口調用方案架構圖

2. 捷通華聲TTS語音服務器方案 (jTTS Service )

方案概論:

  語音服務器方案直接提供裝載有捷通華聲TTS語音服務系統(tǒng)的高性能的服務器,它與現(xiàn)有的聲訊服務相平行,接受其指令和文字數據流,合成產生語音數據流返給原系統(tǒng),適用于電信、大型企業(yè)CTI系統(tǒng)及聲訊臺改造、升級。


語音服務器方案架構圖

技術優(yōu)勢:

1. 降低了客戶端機器的配置需求。
2. 通過TCP/IP協(xié)議實現(xiàn)了跨操作系統(tǒng)的語音合成服務功能,可以滿足非Win32平臺的需求。
3. 對于服務規(guī)模較大的系統(tǒng)可實現(xiàn)語音服務器的分布式工作方式,對客戶端的請求自動調度,平衡負載,以達到更高的性能。

應用領域:

  采用語音服務器方案可在不改變現(xiàn)有服務系統(tǒng)的條件下,平行地建立捷通華聲TTS語音服務器,安全、高效率地將原來的文本服務擴大為文本-語音同時服務,是大型、專業(yè)級的語音服務解決方案,并可跨平臺實現(xiàn)。捷通華聲TTS語音服務器方案可服務于160、168等聲訊臺、UMS統(tǒng)一信息服務系統(tǒng)、呼叫中心、語音郵件商、WAP網站、進行網上播音的.com公司等。

3. 捷通華聲TTS離線合成方案(jTTS Builder)

方案概論:

  捷通華聲TTS離線合成方案提供離線合成工具,這是基于Microsoft Windows 95/98/NT/2000的獨立應用程序,可提供離線的語音合成服務,批量地將文字轉換為語音數據文件,適用于海量信息、相對穩(wěn)定或不要求實時轉化的聲訊服務場合,可以直接替代傳統(tǒng)的錄音方法,對原有系統(tǒng)完全無需改造,節(jié)省人力,提高效率。


離線合成方案系統(tǒng)架構圖

三、 捷通華聲TTS(jTTS)在嵌入式操作系統(tǒng)下的應用

  捷通華聲公司的TTS技術與其他文語轉換系統(tǒng)相比具有獨特的音庫壓縮特點,使捷通華聲TTS技術向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。據市場調研及考證:捷通華聲公司是目前最早掌握該技術,及最先提出在掌上電腦應用該技術的公司。該系統(tǒng)在2001年中關村電腦節(jié)上榮獲十大"IT創(chuàng)新產品"。

  捷通華聲TTS技術,以大規(guī)模真實錄音的語音庫為基礎,增加音庫壓縮算法和音色變換算法形成核心技術。此核心技術與國內其他文語轉換技術相比較,具有如下特點:

· 系統(tǒng)輸出語音清晰度高。
· 系統(tǒng)輸出可懂度高。
· 輸出自然度基本與人正常說話持平。
· 音庫大小可縮擴,小音庫僅為1MB。

  正是因為捷通華聲TTS具有以上的特點,使得捷通華聲公司的TTS技術可以向嵌入式操作系統(tǒng)移植。特別是小音庫的特點,使得在嵌入式操作系統(tǒng)下不會占用太大的資源。

  詳細方案請參照捷通TTS在掌上電腦、信息家電等領域的解決方案

四、 捷通華聲TTS(jTTS)在語音網站中的應用

  公司將捷通華聲TTS技術和流媒體(Streaming Media)技術相結合,開發(fā)設計了專門針對語音網站的全面技術解決方案,并在國內率先推出了首家有聲網站,為網站的"有聲化"開創(chuàng)了先河。語音網站技術的推出,將使網站變得更加有聲有色,吸引更多網絡愛好者,使網絡更加貼近廣大用戶的生活。捷通華聲TTS技術在網站有聲化方面,具有極廣泛的應用前景,特別適合用于為網民提供新聞、財經、生活、文藝、 體育等各類有聲的信息服務。

  詳細方案請參照捷通華聲語音網站解決方案

五、 捷通華聲TTS(jTTS)在桌面產品中的應用

  利用捷通華聲TTS技術可開發(fā)辦公、教學、娛樂等智能多媒體應用軟件,使這些軟件增加了"說"的功能,豐富軟件的內涵。目前公司利用TTS開發(fā)應用軟件產品有:"錄易漢語智能輸入輸出系統(tǒng)"、"捷通聽霸"。在"錄易漢語智能輸入輸出系統(tǒng)"中利用TTS做為智能輸入后的語音校對,是國內第一家將TTS技術與智能輸入技術相結合的廠商。在"捷通聽霸"軟件中利用語音合成技術實現(xiàn)了閱讀電子文檔、鍵盤輸入時的即時語音校對、語音鬧鐘、卡通角色說話的功能。

  應用案例請參考《捷通聽霸TB 3000》產品介紹

六、 成功案例

  捷通華聲TTS技術自推出以來,已成功地在電信、證券等行業(yè)中得到了廣泛的應用,并已進入臺灣市場,其中典型的案例包括:

· 鐵通-中鐵綜合信息服務網(CRIS-China Railway Information System)
· 賽迪呼叫中心
· 博時基金客戶服務中心
· 臺灣中華電信呼叫中心
· 天津移動呼叫中心
· 大連國泰君安證券平臺系統(tǒng)
· 大連大開信證券平臺系統(tǒng)
· 深圳市政府紀委電話咨詢系統(tǒng)
· 福建省179平臺
· 美國奧維平臺系統(tǒng)


石景山区| 罗田县| 澄江县| 那曲县| 东山县| 浪卡子县| 阿巴嘎旗| 方山县| 珲春市| 博兴县| 潜江市| 宣武区| 金山区| 巧家县| 敦化市| 开阳县| 卢龙县| 沙湾县| 榆中县| 梧州市| 米易县| 红安县| 南木林县| 泾源县| 衡山县| 遂昌县| 灵丘县| 灵石县| 巴青县| 扎赉特旗| 西丰县| 平江县| 永修县| 治县。| 田林县| 贺兰县| 会东县| 海口市| 深圳市| 萍乡市| 临安市|