隨著5G、人工智能和物聯(lián)網(wǎng)的發(fā)展,疊加疫情對人類生產(chǎn)生活方式的影響,聲音通信和交互的重要性不斷凸顯。但復(fù)雜噪聲環(huán)境會大大降低聲音通信的質(zhì)量和體驗,同時會導(dǎo)致語音識別的準(zhǔn)確率嚴(yán)重下降。聲音作為人類感知信息、表達信息的重要手段,如何在新形勢下更好的發(fā)揮作用,這是深圳黃鸝智能科技有限公司(簡稱黃鸝智聲)一直在探索的方向。
黃鸝智聲是一家成立于2019年的人工智能技術(shù)企業(yè),依托清華團隊20余年的研究積累,深耕聲音領(lǐng)域,尤其是聲音前端處理技術(shù)和相關(guān)產(chǎn)品的研發(fā)、應(yīng)用和服務(wù),致力于“用聲音智能改善人類生活與工作品質(zhì)”。黃鸝智聲的團隊成員們相信,今天科幻電影中的許多場景在不久的將來都將照進現(xiàn)實,未來的世界甚至?xí)由衿妫曇糇屓f物互聯(lián),我們不僅通過聲音進行人與人之間的溝通,還要讓萬物聽懂我們的聲音,從而更好的為我們服務(wù),并且聲音還會在物與物之間架起交互的橋梁。
說起智能語音,大家想必都不陌生。國外有蘋果Siri,微軟小娜,GoogleAssistant,亞馬遜的Alexa;國內(nèi)有科大訊飛的靈犀助手,百度公司的小度,小米的小愛同學(xué)等等普通消費者熟知的名字……而在呼叫中心行業(yè),智能語音也是異軍突起,語音質(zhì)檢、智能客服等應(yīng)用不斷呈現(xiàn)。然而,環(huán)境噪聲的干擾以及電聲器件的限制,極大地降低了聲音采集的精度和范圍;聲音前端處理技術(shù)的發(fā)展相對滯后,嚴(yán)重制約著智能聲音的應(yīng)用場景和效果:試想如果連最基本的聲音信息都不能聽清、聽懂,談何后面的數(shù)據(jù)傳達和解析呢?
黃鸝智聲的通話降噪技術(shù)方案與其他技術(shù)將聲音前端處理視作孤立的子系統(tǒng)并逐級連接不同,該技術(shù)方案從聽覺的生理和心理基本原理出發(fā),創(chuàng)新性的將麥克風(fēng)陣列、聽覺場景分析、深度學(xué)習(xí)和Gammatone濾波器組等技術(shù)相融合,形成完整并具有針對性的聲音前端智能處理方案,實現(xiàn)噪聲抑制、混響消除、陣列增益、目標(biāo)聲信號分離、跟蹤、增強等功能的統(tǒng)一,在降噪的同時對目標(biāo)聲音進行提取,從而在保證高降噪的同時達到目標(biāo)信號低失真的效果。能夠在各類復(fù)雜的強噪聲環(huán)境中實現(xiàn)清晰的聲音拾取,降噪效果高達40dB以上,且聲音信號的質(zhì)量MOS分在各類噪聲環(huán)境下降噪后仍能達到平均4.0分以上。達到行業(yè)內(nèi)特有的:
(1)高降噪的同時保證聲音信息的低失真,性能行業(yè)首屈一指;
(2)針對難以處理的動態(tài)多種類噪音都有穩(wěn)定的降噪拾取性能,適用于多場景多領(lǐng)域。
(3)軟硬結(jié)合的方案在芯片平臺上即可實現(xiàn),延時低可靠性高。
黃鸝智聲所研發(fā)的產(chǎn)品和方案不僅能夠?qū)⒄Z音清晰拾取,為通話對方帶來靜謐的通話體驗;還適用于各種噪音場景中的智能語音應(yīng)用,有效提升識別準(zhǔn)確率,本次CTI大會也將接入由黃鸝智聲提供的語音識別系統(tǒng),將會場嘈雜的聲音變?yōu)榍逦恼Z音內(nèi)容再轉(zhuǎn)成精準(zhǔn)的文字記錄。
