科大訊飛語(yǔ)音技術(shù)產(chǎn)品ViviVoice2.0
2009/12/02
ViviVoice系列簡(jiǎn)介
ViviVoice提供最豐富的音庫,且根據客戶(hù)需求不斷擴展,適應多樣化的語(yǔ)音應用業(yè)務(wù)需要;能夠自動(dòng)準確的進(jìn)行智能化文本分析和預處理;合成的語(yǔ)音清晰、流暢、自然,使用戶(hù)獲得最佳效果體驗;強大的參數設置和調整能力,容易對語(yǔ)音效果進(jìn)行各種靈活的調節。ViviVoice作為個(gè)性化語(yǔ)音服務(wù)的全新動(dòng)力引擎,將為豐富多彩的語(yǔ)音應用增添獨特的魅力。
豐富音色主導個(gè)性化語(yǔ)音服務(wù)潮流
ViviVoice主導個(gè)性化語(yǔ)音服務(wù)新潮流,采用業(yè)界領(lǐng)先的可訓練語(yǔ)音合成技術(shù),能夠快速提供適應語(yǔ)音應用需要的豐富語(yǔ)言和多樣化音色選擇,并秉承科大訊飛語(yǔ)音技術(shù)一貫的最高質(zhì)量效果表現,為用戶(hù)提供個(gè)性化語(yǔ)音服務(wù)體驗。
在ViviVoice 產(chǎn)品中,提供了以下音庫:
由于ViviVoice采用最先進(jìn)的中文文本、韻律分析算法和基于訓練的參數合成方法,合成效果可達真人朗讀的水平,并且構建一個(gè)高質(zhì)量音庫的周期相比以往可大幅度縮短,這就使得科大訊飛能夠更加快速的響應個(gè)性化語(yǔ)音應用的新需求,不斷提供更多更好的音庫。如需獲得ViviVoice當前支持的最新音庫列表,請訪(fǎng)問(wèn)科大訊飛網(wǎng)站。
ViviVoice提供豐富多樣、效果自然的音庫,在實(shí)際應用中,可根據業(yè)務(wù)需要靈活進(jìn)行實(shí)時(shí)音庫切換。
高表現力的合成引擎
ViviVoice語(yǔ)音合成軟件支持疑問(wèn)和感嘆語(yǔ)氣,支持高興和悲傷情感,充分體現產(chǎn)品的個(gè)性化和娛樂(lè )功能的特點(diǎn),給您帶來(lái)不同的聽(tīng)覺(jué)感受。
高準確度的智能文本分析與預處理
ViviVoice語(yǔ)音合成軟件具有高準確度智能文本分析與預處理技術(shù),有效保障最終合成語(yǔ)音準確、清晰、流暢。得益于科大訊飛在語(yǔ)言學(xué)研究和實(shí)踐上的深厚積累,通過(guò)與中國社會(huì )科學(xué)院語(yǔ)言所等相關(guān)權威科研機構的緊密合作,以及基于寬廣的應用實(shí)踐平臺所積累的海量專(zhuān)業(yè)知識庫,經(jīng)過(guò)不斷訓練和優(yōu)化,即使在面對針對語(yǔ)言分析處理的難點(diǎn),如多音字、特殊符號、韻律短語(yǔ)、未登錄詞(如地名、人名)等等,也能保障得到高度準確的自動(dòng)處理結果。
流暢的效果與強大的音效調整能力
采用參數合成的方法,使ViviVoice產(chǎn)品可以非常方便的對各項影響合成效果的參數進(jìn)行控制,能夠更好的消除傳統語(yǔ)音拼接方式的頓挫等不連貫現象,合成語(yǔ)音更加流暢、自然。針對主流應用環(huán)境的普遍需求,科大訊飛廣泛收集實(shí)際應用的語(yǔ)料,
并用特定的模型對數字數值、短語(yǔ)短句等進(jìn)行優(yōu)化,從而使得合成更加清晰、準確、飽滿(mǎn)、節奏感更強。在保證高質(zhì)量語(yǔ)音合成效果的前提,能夠對音量、音高、語(yǔ)速等眾多參數進(jìn)行調節,配合豐富的特色音效,使語(yǔ)音服務(wù)更加生動(dòng)活潑,充滿(mǎn)趣味。
全面完善的功能特性
ViviVoice采用基于TCP/IP的高效網(wǎng)絡(luò )語(yǔ)音合成服務(wù)和集中式的資源管理機制,形成客戶(hù)端-資源管理器-服務(wù)器有機結合的體系架構,構建可靈活伸縮的方案,科大訊飛這一業(yè)界領(lǐng)先的體系架構,其高可用性歷經(jīng)眾多重點(diǎn)行業(yè)大規模關(guān)鍵業(yè)務(wù)的應用檢驗,確保提供值得信賴(lài)的7×24小時(shí)不間斷自動(dòng)化語(yǔ)音服務(wù)。
- 豐富的參數設置與調節功能,適應各種復雜應用環(huán)境
在ViviVoice產(chǎn)品中提供了豐富完善的參數設置與調節功能和工具,幫助用戶(hù)對語(yǔ)音合成效果進(jìn)行靈活高效的控制與管理。提供對全局參數(如音量、語(yǔ)速、音高等)、用戶(hù)詞典、用戶(hù)規則、定制資源包統一進(jìn)行配置和管理的工具;數字、標點(diǎn)符號、英文發(fā)音方式的設定;中英文加詞功能,可以指定每個(gè)字詞的拼音或音標等等;提供統一的簡(jiǎn)單易用圖形化用戶(hù)界面進(jìn)行操作設定,并可通過(guò)API參數進(jìn)行動(dòng)態(tài)設置和調整,還支持以CSSML(中文語(yǔ)音合成標記語(yǔ)言)進(jìn)行標記、描述和控制。
- 靈活高效的開(kāi)發(fā)接口,加速集成與應用發(fā)布進(jìn)程
ViviVoice DK針對不同開(kāi)發(fā)工具,不同集成要求和方案,提供多種形式的開(kāi)發(fā)接口,包括:標準開(kāi)發(fā)接口(動(dòng)態(tài)鏈接庫DLL),Quick TTS接口、COM組件、Microsoft
SAPI開(kāi)發(fā)接口和Java開(kāi)發(fā)接口,新增了預錄音背景音開(kāi)發(fā)接口,開(kāi)發(fā)者可以根據實(shí)際需要靈活選擇。提供了豐富的開(kāi)發(fā)例程和文檔,幫助加速語(yǔ)音應用開(kāi)發(fā)過(guò)程。
科大訊飛在長(cháng)期集成開(kāi)發(fā)和應用實(shí)踐的支持過(guò)程中,總結了客戶(hù)使用語(yǔ)音合成的方式和應用的特點(diǎn),逐步開(kāi)發(fā)了一系列便于用戶(hù)在不同環(huán)境中合理運用語(yǔ)音合成功能的工具。ViviVoice的增強工具集套件包括了各種使用便捷的高效組件,如離線(xiàn)語(yǔ)音應用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉換工具等等。用戶(hù)通過(guò)使用這些工具可以簡(jiǎn)化開(kāi)發(fā)工作、優(yōu)化合成效果、方便系統維護和技術(shù)支持。
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動(dòng)識別UNICODE文本;支持直接輸出多種采樣率的語(yǔ)音數據格式(包括6K/8K/11K/16K)的線(xiàn)性Wav、A/U率Wav和Vox等多種格式的語(yǔ)音數據。
高質(zhì)量的語(yǔ)音合成效果,加上超小的系統尺寸,降低了資源占用,進(jìn)一步降低特殊需求及桌面應用門(mén)檻,更加符合各類(lèi)語(yǔ)音應用業(yè)務(wù)的需要。
科大訊飛的語(yǔ)音合成軟件具有最全面的平臺支持。幾乎所有主流的交互式語(yǔ)音應答(IVR)平臺都支持科大訊飛的語(yǔ)音合成產(chǎn)品。如需了解進(jìn)一步信息,請與IVR提供商或科大訊飛聯(lián)系。ViViVoice支持主流的操作系統。在各種應用環(huán)境下都很容易找到可供客戶(hù)借鑒的成功實(shí)施案例。
細致周到的優(yōu)化方案
提供以定制資源包(加載于合成引擎之上,有效提升既定應用領(lǐng)域語(yǔ)音效果的資源集合)和CSSML和虛擬不定長(cháng)工具為代表的主流應用環(huán)境進(jìn)行效果優(yōu)化的高效解決方案,顯著(zhù)提升實(shí)際應用效果。科大訊飛專(zhuān)業(yè)服務(wù)體系提供高效的定制與優(yōu)化方案,提升客戶(hù)體驗,幫助客戶(hù)獲得語(yǔ)音自助服務(wù)的持續成功。
CSSML(Chinese Speech Synthesis Markup Language,中文語(yǔ)音合成標記語(yǔ)言)是由科大訊飛提出并牽頭制訂的中文語(yǔ)音數據描述規范。該標準得到了國家863專(zhuān)家組、國家信標委和國家技術(shù)監督局的大力關(guān)注與支持,2005年正式通過(guò)國家標準化組織的評審,成為中文語(yǔ)音合成技術(shù)標準與規范的重要內容。CSSML針對中文語(yǔ)音應用設計和擴展,可以對多種特性進(jìn)行靈活標注與控制,并與開(kāi)放式的標準SSML兼容。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng )的預錄音統一管理功能,將預錄音作為語(yǔ)音合成系統的資源,并通過(guò)提示音智能匹配和合成模板等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時(shí)避免頻繁處理提示音播放與語(yǔ)音合成的切換與過(guò)渡問(wèn)題,簡(jiǎn)化應用流程的復雜程度,進(jìn)一步提高服務(wù)效果與質(zhì)量。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng )的背景音功能,通過(guò)系統提供的簡(jiǎn)單易用工具,可以便捷高效的添加背景音樂(lè ),調整背景音樂(lè )和合成語(yǔ)音的音量對比,并可直接試聽(tīng)實(shí)際效果,使語(yǔ)音服務(wù)更加親切自然。
- 特色音效,創(chuàng )造更多娛樂(lè )色彩
ViviVoice采用了科大訊飛業(yè)界首創(chuàng )的特色音效功能,系統在合成語(yǔ)音的同時(shí)可以加入諸如回升、混響、金屬聲等各具特色的發(fā)音效果,非常適合用來(lái)制作一些科幻、娛樂(lè )、搞笑的聲音效果,可以帶給用戶(hù)帶來(lái)全新的體驗。
CTI論壇編輯
相關(guān)閱讀:
句容市|
眉山市|
高要市|
阿巴嘎旗|
邹城市|
内江市|
蛟河市|
漯河市|
灵璧县|
钟山县|
壶关县|
辉南县|
德兴市|
建德市|
绥中县|
介休市|
玉环县|
错那县|
克什克腾旗|
重庆市|
麟游县|
沧源|
西乌珠穆沁旗|
德阳市|
奎屯市|
全南县|
安多县|
东明县|
天津市|
梁山县|
都江堰市|
嘉禾县|
南陵县|
江门市|
唐山市|
安泽县|
武平县|
措勤县|
平果县|
双流县|
泰宁县|