97成人免费视频,97视频免费公开成人福利,免费视频99,99婷婷,国产伊人久久,亚洲视频欧美,国产精品福利久久

您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

聲網(wǎng)Agora一站式智能語音識別方案:內(nèi)容審核,快速接入

2019-08-26 15:28:12   作者:   來源:CTI論壇   評論:0  點(diǎn)擊:


  視頻直播、語音聊天、音樂社交,這些與“聲音”有關(guān)的社交場景在近兩年來越來越熱,也吸引了很多內(nèi)容創(chuàng)作者和用戶。不過,與之相關(guān)的語音內(nèi)容審核一直是令很多平臺頭痛的問題。這也讓那些“每天聽 4000 條語音”的聲音鑒黃師上了頭條。而現(xiàn)在,市場上已經(jīng)有一些廠商開始提供智能語音鑒黃服務(wù)了,大幅減輕了人工鑒黃的工作量。
  不過,對于社交產(chǎn)品團(tuán)隊來講,現(xiàn)有的語音內(nèi)容審核+實(shí)時音視頻服務(wù),部署、調(diào)試、運(yùn)維的成本高,而且很多方案對有背景音樂、噪聲的音頻識別效果差。為了解決這個問題,我們正式推出聲網(wǎng) Agora 一站式智能語音識別方案。
  現(xiàn)有的方案都是如何實(shí)現(xiàn)的呢?
  一般來講,一個社交產(chǎn)品需要對接三種廠商:CDN廠商,用來推流、拉流,實(shí)現(xiàn)普通的直播;RTC 廠商,用來實(shí)現(xiàn)低延時的實(shí)時互動直播;內(nèi)容審核廠商,通過 AI、人工進(jìn)行審核。接入的架構(gòu)基本如下圖所示,可簡單概括為三步:
  1. 內(nèi)容經(jīng)過轉(zhuǎn)碼或直接推流至 CDN;
  2. 內(nèi)容審核廠商從 CDN 拉流,然后進(jìn)行 AI 、人工內(nèi)容審核;
  3. 完成審核后,傳回給服務(wù)器端。
  圖:傳統(tǒng)的實(shí)時音視頻內(nèi)容審核流程
  這種舊方式帶來的問題顯而易見。首先,開發(fā)者需要對接三個廠商,要進(jìn)行多次部署、調(diào)試,其中有很多調(diào)試的成本與風(fēng)險。而且,當(dāng) CDN 出現(xiàn)故障時,需要較長時間來排查問題。另外,在這個過程中,開發(fā)者還需要支付額外的拉流成本。
  另一方面,目前的方案還需要解決噪聲問題。因?yàn)橐纛l社交有很多種場景,比如語音FM、語音聊天室、音樂社交、娛樂直播,這些場景常常伴有環(huán)境噪聲和背景音樂,會影響現(xiàn)有內(nèi)容審核方案的識別率。
  聲網(wǎng)Agora 一站式智能語音識別方案
  聲網(wǎng)現(xiàn)已提供業(yè)界獨(dú)有的一站式智能語音識別方案。如上圖架構(gòu)所示,開發(fā)者只需要在應(yīng)用中集成聲網(wǎng) Agora SDK,即可讓音頻在 Agora SD-RTN? 網(wǎng)絡(luò)中實(shí)時傳輸?shù)倪^程中完成語音內(nèi)容識別與審核。我們在原有的實(shí)時語音互動直播的基礎(chǔ)上,整合了業(yè)界 Top 3 語音識別服務(wù)。同時,基于聲網(wǎng)的 AI 音頻降噪引擎,來提高音頻質(zhì)量,優(yōu)化語音識別效果。
  語音識別的流程如下圖所示。首先通過聲網(wǎng)獨(dú)家研發(fā)的 AI 音頻降噪引擎消除背景音,優(yōu)化音頻質(zhì)量,讓語音更加清晰。我們在網(wǎng)絡(luò)電臺、語音交友等互聯(lián)網(wǎng)平臺聽到的語音音頻通常有兩類,一類是普通的語音,另一類是非文字的聲音,如嬌喘和ASMR,后者是不存在任何語義的。所以我們會通過不同的模塊來檢測,將語音轉(zhuǎn)化為文字通過內(nèi)容安全引擎進(jìn)一步過濾,結(jié)合“多意義上下文短文本垃圾檢測”、“Deep Learning 垃圾檢測”、“規(guī)則引擎”和“分類器”等模塊,過濾掉音頻中涉政、涉黃(包括嬌喘、ASMR)、暴恐、辱罵等違規(guī)內(nèi)容。人工審核團(tuán)隊可以通過Web端后臺,對機(jī)器審核的結(jié)果進(jìn)行抽查和復(fù)審,不斷優(yōu)化機(jī)器審核的準(zhǔn)確率。這一過程可以大幅降人工審核成本,提升效率。
  目前該解決方案可檢測出廣告、涉黃、涉政、暴恐、謾罵等違規(guī)內(nèi)容,適用于視頻直播、語音聊天室、娛樂直播、語音 FM、音樂社交等實(shí)時音視頻社交互動場景。
  聲網(wǎng)Agora一站式智能語音識別方案優(yōu)勢包括:
  1、調(diào)用 RESTful API,一站式接入
  聲網(wǎng) Agora 目前提供了實(shí)時音頻通話 SDK。在應(yīng)用中集成 Agora SDK 后,開發(fā)者可以通過調(diào)用 RESTful API,即可為自己的應(yīng)用增加語音內(nèi)容審核服務(wù)。相比傳統(tǒng)內(nèi)容審核方案,聲網(wǎng)方案可以節(jié)省開發(fā)時間、服務(wù)器等接入成本。
  2、AI 降噪,識別率更高
  面對語音識別中常見的噪聲、背景音樂等音質(zhì)問題。我們會通過聲網(wǎng) AI 音頻降噪引擎對音頻進(jìn)行優(yōu)化,以提升語音的識別率。與此同時,用戶的語音、音頻體驗(yàn)也會得到提升。在今年的 RTC 2019 實(shí)時互聯(lián)網(wǎng)大會上,我們還將進(jìn)一步分享 AI 音頻降噪背后的技術(shù)實(shí)踐,敬請期待。
  3、語音交互低延時
  聲網(wǎng) SDK 實(shí)現(xiàn)了全球端到端76ms 的實(shí)時音視頻低延時傳輸。聲網(wǎng)Agora SD-RTN? 實(shí)時通信網(wǎng)絡(luò)采用私有 UDP 協(xié)議進(jìn)行傳輸,基于軟件定義優(yōu)化路由選擇最優(yōu)傳輸路徑,自動規(guī)避網(wǎng)絡(luò)擁塞和骨干網(wǎng)絡(luò)故障帶來的影響。在能保證低延時傳輸?shù)耐瑫r,聲網(wǎng)Agora SDK還支持 48kHz 高音質(zhì)語音。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)

凯里市| 河间市| 牙克石市| 蚌埠市| 民县| 噶尔县| 大荔县| 岳阳县| 金塔县| 无棣县| 瓮安县| 海阳市| 明光市| 页游| 三原县| 邵阳县| 肃南| 赤水市| 逊克县| 习水县| 剑川县| 浦东新区| 黑龙江省| 黄龙县| 冀州市| 临颍县| 博罗县| 兰西县| 镇坪县| 沙坪坝区| 德阳市| 兴宁市| 陵水| 财经| 惠州市| 张掖市| 宁波市| 互助| 桑植县| 洪洞县| 桐柏县|