回聲消除技術(shù)
一、 因特網(wǎng)語音通信中回聲的特點(diǎn)
與傳統(tǒng)電話相比,因特網(wǎng)上進(jìn)行語音的實(shí)時(shí)傳輸,有其致命的弱點(diǎn),那就是語音質(zhì)量較差,影響因特網(wǎng)語音質(zhì)量的因素是多方面的,*關(guān)鍵的因素之一是回聲的影響。因此,要提高因特網(wǎng)的語音質(zhì)量,就必須在因特網(wǎng)的語音傳輸過程中進(jìn)行消回聲的處理,也就是說,IP電話網(wǎng)關(guān)作為因特網(wǎng)的語音接入設(shè)備,必須具有回聲的消除功能。由于因特網(wǎng)的語音傳輸是采用分組交換技術(shù)實(shí)現(xiàn)的一種全新的電信業(yè)務(wù),傳送的語音信號要經(jīng)過編碼、壓縮、打包等一系列處理,這不僅造成回聲路徑的延遲較大,而且延遲抖動也較大。因此,在因特網(wǎng)的語音傳輸過程中,回聲問題顯得尤其突出,并具有如下特點(diǎn):
1、 回聲源復(fù)雜
在傳統(tǒng)電話系統(tǒng)中,存在著一種所謂的"電路回?fù)簦?。該回聲產(chǎn)生的主要原因是在系統(tǒng)中存在2-4線的轉(zhuǎn)換。完成2-4轉(zhuǎn)換的混合器因阻抗匹配,造成"泄漏",從而導(dǎo)致了"電路回聲"。從因特網(wǎng)IP電話網(wǎng)關(guān)的連接方式可以看出,IP電話網(wǎng)關(guān)一端連接PSTN,另一端連接因特網(wǎng)。盡管電路回聲產(chǎn)生于PSTN,但同樣會傳至于IP電話網(wǎng)關(guān),是因特網(wǎng)語音傳輸中的回聲源之一,因特網(wǎng)語音傳輸中的第二種回聲源是所謂的"聲學(xué)回聲"。聲學(xué)回聲是指揚(yáng)聲器播放出來的聲音被麥克風(fēng)拾取后發(fā)回遠(yuǎn)端,這就使得遠(yuǎn)端談話者能聽到自己的聲音。聲學(xué)回聲又分為直接回聲和間接回聲。直接回聲是指揚(yáng)聲器播放出來的聲音未經(jīng)任何反射直接進(jìn)入麥克風(fēng)。這種回聲延遲*短,它與遠(yuǎn)端說話者的語音能量,揚(yáng)聲器與話筒之間的距離、角度、揚(yáng)聲器的播放音量以及話筒的拾取靈敏度等因素相關(guān)。間接回聲是指揚(yáng)聲器播放的聲音經(jīng)不同的路徑一次或多次反射后進(jìn)入麥克風(fēng)所產(chǎn)生的回聲集合。因?yàn)橹車矬w的變動,例如人的走動等,都會改變回聲的返回路徑,因?yàn)檫@種回聲的特點(diǎn)是多路徑、時(shí)變的。另外,背景噪聲也是產(chǎn)生回聲的因素之一。
2、 回聲路徑的延遲大
在因特網(wǎng)中的語音傳輸中,延遲來源有三種:壓縮延遲、分組傳輸延遲和處理延遲。語音壓縮延遲是產(chǎn)生回聲的主要延遲,例如在G.723.1標(biāo)準(zhǔn)中,壓縮一幀(30ms)的*大延遲是37.5ms。分組傳輸延遲也是一個(gè)很重要的來源,測試表明,端到端的*大傳輸延遲可達(dá)250ms以上。處理延遲是指語音包的封裝時(shí)延及其緩沖時(shí)延等。
3、 回聲路徑的延遲抖動大
在因特網(wǎng)的語音傳輸過程中,由于回聲路徑、語音壓縮時(shí)延、分組傳輸路由等存在諸多不確定因素,而且波動范圍較大,一般在20~50ms之間。
二、聲學(xué)回聲消除器的結(jié)構(gòu)和相關(guān)算法
隨著消回聲技術(shù)的發(fā)展,當(dāng)前回聲消除研究的重點(diǎn),已由"電路回聲"的消除,轉(zhuǎn)向了"聲學(xué)回聲"。聲學(xué)回聲消除主要有如下三個(gè)方法:
?。?)周圍環(huán)境的處理 分析聲學(xué)回聲的產(chǎn)生的機(jī)理,可以知道:聲學(xué)回聲*簡單的控制方法是改善揚(yáng)聲器的周圍環(huán)境,盡量減少揚(yáng)聲器播放聲音的反射。例如,可以在周圍的墻壁上附加一層吸音材料,或增加一層襯墊以增加散射,理想的周圍環(huán)境是其回響時(shí)間或RT-60(聲音衰減60dB所需要的時(shí)間)在300ms~600ms之間。因?yàn)檫@樣的環(huán)境一方面可以控制反射,又可以不會使講話者感到不適。改善環(huán)境可以有效地抑制間接聲學(xué)回聲,但對直接聲學(xué)回聲卻無能為力。
?。?)回聲抑制器 回聲抑制器是使用較早的一種回聲控制方法。回聲抑制器是一種非線性的回聲消除。它通過簡單的比較器將接收到準(zhǔn)備由揚(yáng)聲器播放的聲音與當(dāng)前話筒拾取的聲音的電平進(jìn)行比較。如果前者高于某個(gè)閾值,那么就允許傳至揚(yáng)聲器,而且話筒被關(guān)閉,以阻止它拾取揚(yáng)聲器播放的聲音而引起遠(yuǎn)端回聲。如果話筒拾取的聲音電平高于某全閾值,揚(yáng)聲器被禁止,以達(dá)到消除回聲的目的。由于回聲抑制是一種非線性的回聲控制方法,會引起揚(yáng)聲器播放的不連續(xù)。影響回聲消除的效果,隨著高性能的回聲消除器的出現(xiàn),回聲抑制器已很少人使用了。
?。?)聲學(xué)回聲消除器 聲學(xué)回聲消除的另一方法是使用聲學(xué)回聲消除器(AEC:Acoustic Echo Chancellor),AEC是對揚(yáng)聲器信號與由它產(chǎn)生的多路徑回聲的相關(guān)性為基礎(chǔ),建立遠(yuǎn)端信號的語音模型,利用它對回聲進(jìn)行估計(jì),并不斷地修改濾波器的系數(shù),使得估計(jì)值更加逼近真實(shí)的回聲。然后,將回聲估計(jì)值從話筒的輸入信號中減去,從而達(dá)到消除回聲的目的,AEC還將話筒的輸入與揚(yáng)聲器過去的值相比較,從而消除延長延遲的多次反射的聲學(xué)回聲。根椐存儲器存放的過去的揚(yáng)聲器的輸出值的多少,AEC可以消除各種延遲的回聲。