午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種檢測語音端點的方法和裝置制造方法

文檔序號:2825474閱讀:200來源:國知局
一種檢測語音端點的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種檢測語音端點的方法和裝置,其中方法包括:確定并記錄待檢測信號各幀的能量;基于所述各幀的能量進行最小能量追蹤;利用掩蔽噪聲能量對待檢測信號和追蹤到的最小能量進行噪聲掩蔽;利用噪聲掩蔽后得到的待檢測信號和最小能量確定各幀的信噪比;依據(jù)各幀的信噪比以及預(yù)設(shè)的門限值進行語音判決,從而確定語音端點。本發(fā)明通過噪聲掩蔽的方式避免了局部最小能量趨近于零而導(dǎo)致的出現(xiàn)奇異值的情況,降低了虛警率;同時縮小了子帶信噪比的動態(tài)范圍,提高了檢測結(jié)果的魯棒性。
【專利說明】一種檢測語音端點的方法和裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及計算機應(yīng)用中的語音【技術(shù)領(lǐng)域】,特別涉及一種檢測語音端點的方法和
>J-U ρ?α裝直。
【【背景技術(shù)】】
[0002]在語音系統(tǒng)中語音信號往往伴隨著背景噪聲一起輸入,如何在輸入信號中準確地判斷語音信號的起始和結(jié)束位置變成了抑制、去除語音噪聲的關(guān)鍵所在,語音端點檢測技術(shù)便是這樣一種技術(shù),只有準確地判定語音信號的端點才能正確地進行語音處理。
[0003]目前采用的是基于最小能量追蹤的語音端點檢測方法,即保留語音信號的部分歷史信息,采用局部最小子帶能量追蹤技術(shù)找到子帶能量的局部最小值,將這個局部最小能量值作為背景噪聲的參考值。在語音判決時,如果當前幀的子帶能量與該參考值的比值(即信噪比)高于預(yù)設(shè)的門限值,則判定當前幀為語音幀,否則判定當前幀為噪聲幀。這種語音端點檢測方法具有較低的漏報率,只要待檢測信號中含有語音段就能夠?qū)⒄Z音段檢測出來。
[0004]然而,上述語音端點檢測方法也存在一定的缺陷,即虛警率較高。由于局部能量最低點的動態(tài)范圍較大,在某些區(qū)域,局部最小能量可能趨近于零,導(dǎo)致對于待檢測信號的子帶信噪比容易出現(xiàn)極大值,使得檢測 結(jié)果不夠魯棒導(dǎo)致虛警的產(chǎn)生。

【發(fā)明內(nèi)容】

[0005]本發(fā)明提供了一種檢測語音端點的方法和裝置,以便于提高檢測結(jié)果的魯棒性,降低虛警率。
[0006]具體技術(shù)方案如下:
[0007]一種檢測語音端點的方法,該方法包括:
[0008]S1、確定并記錄待檢測信號各幀的能量;
[0009]S2、基于所述各幀的能量進行最小能量追蹤;
[0010]S3、利用掩蔽噪聲能量對待檢測信號和追蹤到的最小能量進行噪聲掩蔽;
[0011]S4、利用噪聲掩蔽后得到的待檢測信號和最小能量確定各幀的信噪比;
[0012]S5、依據(jù)各幀的信噪比以及預(yù)設(shè)的門限值進行語音判決,從而確定語音端點。
[0013]根據(jù)本發(fā)明一優(yōu)選實施例,所述步驟S2中還包括:基于所述各幀的能量進行最大能量追蹤;
[0014]所述掩蔽噪聲能量由追蹤得到的最大能量確定。
[0015]根據(jù)本發(fā)明一優(yōu)選實施例,掩蔽噪聲能量Enm由以下公式確定:
【權(quán)利要求】
1.一種檢測語音端點的方法,其特征在于,該方法包括: 51、確定并記錄待檢測信號各幀的能量; 52、基于所述各幀的能量進行最小能量追蹤; 53、利用掩蔽噪聲能量對待檢測信號和追蹤到的最小能量進行噪聲掩蔽; 54、利用噪聲掩蔽后得到的待檢測信號和最小能量確定各幀的信噪比; 55、依據(jù)各幀的信噪比以及預(yù)設(shè)的門限值進行語音判決,從而確定語音端點。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S2中還包括:基于所述各幀的能量進行最大能量追蹤; 所述掩蔽噪聲能量由追蹤得到的最大能量確定。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,掩蔽噪聲能量Enm由以下公式確定:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述最小能量追蹤和最大能量追蹤均為局部追蹤,具體為:針對每一幀分別從其臨近Q幀的能量中確定出每一幀對應(yīng)的最小能量和最大能量,Q為預(yù)設(shè)的正整數(shù); 在所述步驟S3中,對每一幀以及每一幀對應(yīng)的最小能量采用依據(jù)該幀對應(yīng)的最大能量確定出的掩蔽噪聲能量進行噪聲掩蔽; 在所述步驟S4中,每一幀的信噪比為:該幀進行噪聲掩蔽后的能量與該幀對應(yīng)的最小能量進行噪聲掩蔽后的能量的比值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟SI之前還包括: so、對所述待檢測信號進行預(yù)處理,所述預(yù)處理包括分幀、預(yù)加重、加窗和快速傅里葉變換。
6.根據(jù)權(quán)利要求1至5任一權(quán)項所述的方法,其特征在于,所述步驟SI具體包括:對所述待檢測信號進行子帶分解,確定并記錄各幀的子帶能量; 所述步驟S2和所述步驟S3針對各幀中的每一個子帶分別進行處理; 所述步驟S4具體包括: 541、針對每一幀分別確定各子帶的信噪比,具體采用如下公式確定當前幀中第i個子帶的信噪比SNRi:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)各幀的信噪比以及預(yù)設(shè)的門限值進行語音判決為: 如果當前幀的信噪比大于或等于所述門限值,則判定當前幀為語音幀,否則判定當前幀為非語音幀。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述門限值是利用所述待檢測信號前L幀的信噪比乘以預(yù)設(shè)的參數(shù)值確定的,所述L為預(yù)設(shè)的正整數(shù)。
9.一種檢測語音端點的裝置,其特征在于,該裝置包括: 能量確定單元,用于確定并記錄待檢測信號各幀的能量; 能量追蹤單元,用于基于所述各幀的能量進行最小能量追蹤; 噪聲掩蔽單元,用于利用掩蔽噪聲能量對待檢測信號和追蹤到的最小能量進行噪聲掩蔽; 信噪比確定單元,用于利用噪聲掩蔽后得到的待檢測信號和最小能量確定各幀的信噪比; 語音判決單元,用于依據(jù)各幀的信噪比以及預(yù)設(shè)的門限值進行語音判決,從而確定語音端點。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述能量追蹤單元,還用于基于所述各幀的能量進行最大能量追蹤; 所述噪聲掩蔽單元采用的掩蔽噪聲能量由追蹤得到的最大能量確定。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,掩蔽噪聲能量Enm由以下公式確定:
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述最小能量追蹤和最大能量追蹤均為局部追蹤,具體為:所述能量追蹤單元針對每一幀分別從其臨近Q幀的能量中確定出每一幀對應(yīng)的最小能量和最大能量,Q為預(yù)設(shè)的正整數(shù); 所述噪聲掩蔽單元對每一幀以及每一幀對應(yīng)的最小能量采用依據(jù)該幀對應(yīng)的最大能量確定出的掩蔽噪聲能量進行噪聲掩蔽; 所述信噪比確定單元確定每一幀的信噪比為:該幀進行噪聲掩蔽后的能量與該幀對應(yīng)的最小能量進行噪聲掩蔽后的能量的比值。
13.根據(jù)權(quán)利要求9所述的裝置,其特征在于,該裝置還包括:預(yù)處理單元,用于對所述待檢測信號進行預(yù)處理后提供給所述能量確定單元,所述預(yù)處理包括分幀、預(yù)加重、加窗和快速傅里葉變換。
14.根據(jù)權(quán)利要求9至13任一權(quán)項所述的裝置,其特征在于,所述能量確定單元具體對所述待檢測信號進行子帶分解,確定并記錄各幀的子帶能量; 所述能量追蹤單元和所述噪聲掩蔽單元針對各幀中的每一個子帶分別進行處理; 所述信噪比確定單元具體執(zhí)行: 針對每一幀分別確定各子帶的信噪比,具體采用如下公式確定當前幀中第i個子帶的信噪比SNRi:
15.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述語音判斷單元在進行語音判決時,如果當前幀的信噪比大于或等于所述門限值,則判定當前幀為語音幀,否則判定當前幀為非語音幀。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述門限值是利用所述待檢測信號前L幀的信噪比乘以 預(yù)設(shè)的參數(shù)值確定的,所述L為預(yù)設(shè)的正整數(shù)。
【文檔編號】G10L15/04GK103730110SQ201210382284
【公開日】2014年4月16日 申請日期:2012年10月10日 優(yōu)先權(quán)日:2012年10月10日
【發(fā)明者】宋輝, 關(guān)勇, 賈磊 申請人:北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1