一種基于分布式一致性和mvdr波束形成的分布式語音增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及語音信號處理技術(shù)領(lǐng)域,尤其設(shè)及一種基于分布式一致性和MVDR的 分布式語音增強(qiáng)方法。
【背景技術(shù)】
[0002] 語音信號處理是現(xiàn)代通信、多媒體應(yīng)用和人工智能等領(lǐng)域的核屯、技術(shù)之一。在語 音采集過程中,由于環(huán)境噪聲、房間混響等影響,所獲語音音質(zhì)和清晰度會下降。語音增強(qiáng) 作為一種前置處理方案,是一種有效的抑制干擾的方法。
[0003] 在信息時代,信息獲取最重要和最基本的技術(shù)一-傳感器技術(shù),也得到了很大 的發(fā)展。具有感知能力、計算能力和通信能力的無線傳感器網(wǎng)絡(luò)(WSN,WirelessSensor Networks)也隨之提出。無線傳感器網(wǎng)絡(luò)綜合了傳感器技術(shù)、嵌入式計算技術(shù)、分布式信息 處理技術(shù)和通信技術(shù),能夠協(xié)作地實時監(jiān)測、感知和采集網(wǎng)絡(luò)分布區(qū)域內(nèi)的各種環(huán)境或監(jiān) 測對象的信息,并對該些信息進(jìn)行處理,獲得詳盡而準(zhǔn)確的信息,傳送到需要該些信息的用 戶。其中,如果處理對象針對的是聲音信號,那么此無線傳感器網(wǎng)絡(luò)也叫做無線聲傳感器網(wǎng) 絡(luò)(WirelessAcousticSensorNetworks,WASN)。無線聲傳感器網(wǎng)絡(luò)可W應(yīng)用于助聽器, (免提)語音通信系統(tǒng),聲學(xué)檢測,環(huán)境智能等很多領(lǐng)域。
[0004] 在2012年8月27-31日的歐洲信號處理會議巧USIPC0 2012)的"Distributed GSCbeamformingusingtherelativetransferfunction"論文閒中,M.G.Shmulik等 提出了一種基于分布式廣義旁瓣抵消波束形成方法。該方法針對每個節(jié)點都和其它節(jié)點連 接的無線聲傳感器網(wǎng)絡(luò),利用兩次廣義旁瓣抵消算法來實現(xiàn)分布式的語音增強(qiáng)。第一次是 每個節(jié)點單獨把自己所有的麥克風(fēng)收集到的語音信號利用廣義旁邊抵消算法實現(xiàn)一次語 音增強(qiáng),之后把此次語音增強(qiáng)結(jié)果廣播傳輸?shù)狡渌泄?jié)點。第二次是每個節(jié)點利用其它 節(jié)點傳輸過來的語音增強(qiáng)信號,加上節(jié)點本身的增強(qiáng)信號,再次利用廣義旁瓣抵消算法來 增強(qiáng)。最后每個節(jié)點就可W獲得一致的語音增強(qiáng)效果。該方法利用全連網(wǎng)絡(luò)特性,在不存 在融合中屯、的情況下,實現(xiàn)了分布式的語音增強(qiáng),增強(qiáng)效果也比較好,但存在的問題也較為 明顯;要求網(wǎng)絡(luò)中所有節(jié)點可W和其他節(jié)點直接通信,該限制了網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu);需要等 待所有節(jié)點接收到其他節(jié)點傳輸過來的信息,才可W進(jìn)行處理,該影響了算法的實時性,極 大消耗了網(wǎng)絡(luò)的能量。
[0005]在 2013 年IE邸信號處理期刊上的"DistributedLCMVbeamformingina wirelesssensornetworkwithsingle-channelper-nodesignaltransmission"論 文[2]中,A.Bertrand等人提出了 一種基于線性受限最小方差(LinearlyConstrained MinimumVariance,LCMV)的分布式語音增強(qiáng)方法。該方法和技術(shù)一類似,只是把語音增強(qiáng) 的算法替換為LCMV方法,并且傳輸信號的同時,還要傳輸受限矩陣。所W此方法可W在無 融合中屯、的情況下,獲得逼近有融合中屯、的波束形成結(jié)果,但是任然存在技術(shù)一存在的問 題。
[0006]在 2015 年Elsevier信號處理期刊上的"Optimaldistributed minimum-variancebeamformingapproachesforspeechenhancementinwireless acousticsensornetworks"的論文中[3],S.M.Golan提出了一種針對樹形拓?fù)渚W(wǎng)絡(luò)的分 布式語音增強(qiáng)方法。該方法在技術(shù)二的基礎(chǔ)上,把全連網(wǎng)路等效為樹形拓?fù)渚W(wǎng)絡(luò),也就是信 息傳輸時具有方向性,不再是每個節(jié)點向所有節(jié)點傳輸,而是首先把網(wǎng)絡(luò)簡化,去掉能形成 環(huán)的結(jié)構(gòu),進(jìn)而等效為一個類似生成樹的結(jié)構(gòu),再把相連節(jié)點分為父節(jié)點和子節(jié)點,子節(jié)點 能接收父節(jié)點的信息和向父節(jié)點發(fā)送信息,父節(jié)點能接收子節(jié)點的信息和向子節(jié)點發(fā)送信 息。該樣信息傳輸時就能減少重復(fù)傳送和遠(yuǎn)距離傳送,使信息傳輸更高效,該有利于利用 LCMV波束形成算法實現(xiàn)分布式語音增強(qiáng)。此算法改進(jìn)了技術(shù)一和二存在的網(wǎng)絡(luò)拓?fù)湎拗迫?點,節(jié)點傳輸相比網(wǎng)絡(luò)直傳快很多,不過存在的缺點就是樹形拓?fù)渖杀容^麻煩,必須事先 知道網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)行預(yù)處理。
【發(fā)明內(nèi)容】
[0007] 根據(jù)現(xiàn)有技術(shù)存在的問題,本發(fā)明公開了一種基于分布式一致性和MVDR的分布 式語音增強(qiáng)方法,包括W下步驟:
[0008]S1;利用改進(jìn)的隨機(jī)聲傳感器網(wǎng)絡(luò)生成算法生成傳感器網(wǎng)絡(luò)節(jié)點的坐標(biāo),計算節(jié) 點的連接矩陣、節(jié)點的度和節(jié)點臨近節(jié)點集合;
[000引 S2;利用S1中生成的傳感器網(wǎng)絡(luò)接收含噪語音信號,對每個節(jié)點接收的含噪語音 信號進(jìn)行MVDR預(yù)處理獲得語音預(yù)處理矩陣f(0)和噪聲預(yù)處理矩陣方(0);
[0010]S3;利用S1得出的節(jié)點的連接矩陣、節(jié)點的度和節(jié)點臨近節(jié)點集合和S2得出語音 預(yù)處理矩陣F(0)和噪聲預(yù)處理矩陣成(0)進(jìn)行分布式一致性迭代,使每個節(jié)點獲得一致的 MVDR語音增強(qiáng)時域的語音信號Zi(t)。
[0011] S1中具體采用如下方式;
[001引S11;在一個bXb平面上設(shè)計一個坐標(biāo)軸;
[0013]S12;產(chǎn)生節(jié)點坐標(biāo):對于確定的網(wǎng)絡(luò)節(jié)點數(shù)N,在平面坐標(biāo)上隨機(jī)產(chǎn)生10*N個坐 標(biāo),利用K均值聚類算法對該些坐標(biāo)進(jìn)行聚類,產(chǎn)生N個聚類中屯、,記下此時N個聚類中屯、 的坐標(biāo)(X。y;),其中i= 1,2,…,N,即為節(jié)點坐標(biāo);
[0014]S13;檢測所有節(jié)點是否存在邊,進(jìn)而得到節(jié)點連接矩陣A= [aj,1《i,j《N, 采用如下公式(1)確定網(wǎng)絡(luò)節(jié)點gi與gj是否存在一條直接相連的邊,若概率大于0. 5,則 節(jié)點Vf與V濟(jì)在邊,并使au= 1,否則不存化使au= 0 ;
[00巧]
(1)
[0016] 其中;k為常數(shù),e為網(wǎng)絡(luò)平均節(jié)點度參數(shù),l(i,j)表示節(jié)點&與gj.之間的幾何距 離,L為網(wǎng)絡(luò)拓?fù)鋱D中所有節(jié)點幾何距離的最大值,a和P為調(diào)節(jié)網(wǎng)絡(luò)特性的參數(shù),范圍為 (〇,1],a決定長邊和短邊的比例,0決定網(wǎng)絡(luò)的度數(shù);
[0017] S14 ;求出所有節(jié)點的度,其中節(jié)點Vi的度dh(gi)為;
[0018]
(2)
[0019] S15 ;求出所有節(jié)點的臨近節(jié)點集合,其中節(jié)點gi的臨近節(jié)點集合Ci為:
[0020] (gjGG|au= 1}。 (3)
[0021] S2中具體采用如下方式;
[0022] S21.對每個節(jié)點接收的含噪語音信號進(jìn)行短時傅里葉變換,得到含噪語音短時傅 里葉系數(shù)Yi;
[0023]S22.計算每個節(jié)點的聲傳輸函數(shù)Hi;
[0024] 令聲源與第i個節(jié)點的距離為中,則衰減系數(shù)為1/di,延時Ti為Qi/c化,其 中C為聲速,故聲傳輸函數(shù)為
[00巧]
(8)
[0026]S23.估計每個節(jié)點接收信號的噪聲功率譜《;
[0027] 對于噪聲譜估計單元,利用直接譜估計算法,并對多帖噪聲譜估計平均,本發(fā)明采 用前T。帖(T。= 5),則第i個節(jié)點接收信號的噪聲功率譜f估計為
[0028]
(9)
[0029]S24.利用每個節(jié)點的聲傳輸函數(shù)&分別對每個節(jié)點的含噪語音短時傅里 葉系數(shù)Yi和噪聲噪聲功率譜f進(jìn)行MVDR預(yù)處理,對每個節(jié)點的含噪語音短時傅里葉 系數(shù)Yi進(jìn)行MVDR預(yù)處理的得到語音預(yù)處理結(jié)果^^(0)=^乂.2^.,對每個節(jié)點的噪聲 噪聲功率譜《進(jìn)行MVDR預(yù)處理噪聲預(yù)處理結(jié)果而(0)=巧作72巧,故語音預(yù)處理矩陣 F(0) =巧(0)戈(0),...,F(xiàn)w(0)f,噪聲預(yù)處理矩陣旁(0) =扔(0),馬(0),...,馬(0)]r,其中上 標(biāo)表示取共輛操作,(?)T表示轉(zhuǎn)置操作。
[0030] S3中具體采用如下方式;
[003。 S31 ;利用S1中得出的節(jié)點的連接矩陣、節(jié)點的度和節(jié)點臨近節(jié)點集合計算平均 Metropolis權(quán)算法的權(quán)矩陣W;設(shè)權(quán)矩陣為W= [Wy],l《i,j《N,利用S1得出的節(jié)點連 接矩陣,節(jié)點的度和臨近節(jié)點集合,則基于平均Metropolis權(quán)算法的權(quán)矩陣為
[0032]
(10)
[003引其中;0是一個很小的正數(shù),為權(quán)衡因子;
[0034] S32;利用權(quán)矩陣W和S2中得出語音預(yù)處理矩陣f(0)和噪聲預(yù)處理矩陣方(0)進(jìn) 行分布式一致性迭代,直到收斂,得到收斂后的每個節(jié)點的MVDR波束形成語音增強(qiáng)結(jié)果 z,(/);
[00巧]S33 ;迭代完畢后,對每個節(jié)點的MVDR波束形成語音增強(qiáng)結(jié)果之,(〇進(jìn)行短時傅里 葉反變換,就可W得到增強(qiáng)后的時域的語音信號Zi(t)。
[0036] S32中具體采用如下方式;令迭代次數(shù)為t,第i個節(jié)點的第t次迭代的結(jié)果為 如)和馬(0,構(gòu)成矩陣為抑)=巧(0,E的,…,皆的]和辦(0 =[馬(0,馬(0,...,歷w(0],整 個分布式算法的迭代過程如下:
[0037] S32 (1);初始化迭代次數(shù)t= 0 ;
[003引 S32 (2):在每個節(jié)點,利用權(quán)矩陣W和語音預(yù)處理矩陣F(0)和噪聲預(yù)處理矩陣 成(0),迭代計算f的,和第i個節(jié)點的第t次迭代的MVDR波束形成語音增強(qiáng)結(jié)果 卽);
[0042] 832(3);如果迭代次數(shù)t超過預(yù)先設(shè)置的迭代次數(shù)闊值,則是(/)收斂,此時的 式(/)即為最后的MVDR波束形成語音增強(qiáng)結(jié)果;否則使t一t+1,返回到步驟S32 (2)。
[0043] 步驟S32(2)中迭代時,利用的是網(wǎng)絡(luò)節(jié)點通信進(jìn)行信息共享迭代,節(jié)點通信過程 如下