午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

場景音頻信號的編碼方法和裝置與流程

文檔序號:39723957發(fā)布日期:2024-10-22 13:19閱讀:2來源:國知局
場景音頻信號的編碼方法和裝置與流程

本技術(shù)涉及音頻編解碼技術(shù),尤其涉及一種場景音頻信號的編碼方法和裝置。


背景技術(shù):

1、三維音頻技術(shù)是通過計算機(jī)、信號處理等方式對真實世界中聲音事件和三維聲場信息進(jìn)行獲取、處理,傳輸和渲染回放的音頻技術(shù)。三維音頻使聲音具有強(qiáng)烈的空間感、包圍感及沉浸感,給人以“聲臨其境”的非凡聽覺體驗。其中,高階立體混響(higher?orderambisonics,hoa)技術(shù)具有在錄制、編碼與回放階段與揚(yáng)聲器布局無關(guān)的性質(zhì)以及hoa格式數(shù)據(jù)的可旋轉(zhuǎn)回放特性,在進(jìn)行三維音頻回放時具有更高的靈活性,因而也得到了更為廣泛的關(guān)注和研究。

2、為了實現(xiàn)更好的音頻聽覺效果,hoa技術(shù)需要大量的數(shù)據(jù)記錄更詳細(xì)的聲音場景的信息。雖然這種基于場景的三維音頻信號采樣和存儲更加利于音頻信號空間信息的保存和傳輸,但對于n階hoa信號來說,其對應(yīng)的通道數(shù)為(n+1)2,隨著hoa階數(shù)的增加,將會產(chǎn)生更多的數(shù)據(jù),大量的數(shù)據(jù)可能造成傳輸和存儲的困難,因此需要對hoa信號進(jìn)行編解碼。

3、相關(guān)技術(shù)可以通過對部分通道進(jìn)行編解碼以節(jié)省碼流,提高編解碼效率,但是沒有考慮到暫態(tài)信號的處理,導(dǎo)致重建音頻信號的質(zhì)量下降,影響用戶的聽覺體驗。


技術(shù)實現(xiàn)思路

1、本技術(shù)提供一種場景音頻信號的編碼方法和裝置,以實現(xiàn)對場景音頻信號中的暫態(tài)信號的處理,從而提升重建音頻信號的質(zhì)量和用戶的聽覺體驗。

2、第一方面,本技術(shù)提供一種場景音頻信號的編碼方法,包括:獲取待編碼的場景音頻信號,所述場景音頻信號包括c個通道的音頻信號,c為正整數(shù);對所述c個通道中需要進(jìn)行暫態(tài)檢測的m個通道進(jìn)行暫態(tài)檢測以得到所述m個通道的暫態(tài)標(biāo)識,所述暫態(tài)標(biāo)識用于表示對應(yīng)通道是否存在暫態(tài)信號,1≤m≤c;對所述m個通道的暫態(tài)標(biāo)識和所述場景音頻信號進(jìn)行編碼以得到碼流。

3、本技術(shù)實施例,編碼端對選中的m個通道進(jìn)行暫態(tài)檢測,并將暫態(tài)檢測的結(jié)果(暫態(tài)檢測標(biāo)識)寫入碼流,以便于解碼端進(jìn)行暫態(tài)恢復(fù),可以實現(xiàn)對場景音頻信號中的暫態(tài)信號的處理,從而提升重建音頻信號的質(zhì)量和用戶的聽覺體驗。

4、場景音頻信號是一種攜帶聲場中聲源的空間位置信息的信息載體,描述了空間中聽音者的聲場,場景音頻信號可以包括c個通道的音頻信號,c為正整數(shù)。

5、可選的,場景音頻信號可以是hoa信號,該hoa信號可以是指n階hoa信號,包括(n+1)2個通道的音頻信號。此時,c=(n+1)2。

6、暫態(tài)亦稱作瞬態(tài),場景音頻信號的多個通道中,可能有某一個或某多個通道的音頻信號的能量會發(fā)生瞬時突變,例如,在某一瞬間能量突然變大,那么存在該突變的通道可以認(rèn)為是具備暫態(tài)(亦或瞬態(tài))的通道。而確定通道是否存在暫態(tài)信號的過程可以稱之為暫態(tài)檢測。

7、要進(jìn)行暫態(tài)檢測的m個通道是指場景音頻信號的c個通道中,需要對其進(jìn)行暫態(tài)檢測的m個通道。m是大于或等于1且小于或等于c的正整數(shù),即,m最小可以為1,表示場景音頻信號的c個通道中只有一個通道需要進(jìn)行暫態(tài)檢測;m最大可以為c,表示場景音頻信號的c個通道中的所有通道都需要進(jìn)行暫態(tài)檢測;m取1到c之間的任意一個數(shù)時,表示場景音頻信號的c個通道中的部分通道需要進(jìn)行暫態(tài)檢測。

8、可選的,編碼端可以通過預(yù)先設(shè)定的方式確定要進(jìn)行暫態(tài)檢測的m個通道。

9、例如,預(yù)先生成暫態(tài)檢測表,其中,c個通道中需要暫態(tài)檢測的通道在對應(yīng)表格內(nèi)填1,不需要暫態(tài)檢測的通道在對應(yīng)表格內(nèi)填0。編碼端通過查詢暫態(tài)檢測表,即可獲取到上述m個通道。

10、例如,根據(jù)hoa通道方向性,基于水平面生成暫態(tài)檢測表,那么w、y、x、v、u、q、p通道填1,其他通道填0。

11、例如,可以根據(jù)用戶配置指定m個通道;或者,還可以規(guī)定第k階包含的通道數(shù)為m個通道,其中k小于n。

12、當(dāng)確定了要進(jìn)行暫態(tài)檢測的m個通道后,編碼端可以對前述m個通道逐一進(jìn)行暫態(tài)檢測,以得到該m個通道各自的暫態(tài)檢測結(jié)果,進(jìn)而基于暫態(tài)檢測結(jié)果給對應(yīng)通道賦予暫態(tài)標(biāo)識。

13、可選的,暫態(tài)標(biāo)識可以通過1bit的語法元素來表示,例如,1表示存在暫態(tài)信號,0表示不存在暫態(tài)信號。如果通道的暫態(tài)檢測結(jié)果是該通道存在暫態(tài)信號,則將該通道的暫態(tài)標(biāo)識置1;如果通道的暫態(tài)檢測結(jié)果是該通道不存在暫態(tài)信號,則將該通道的暫態(tài)標(biāo)識置0。

14、可選的,若m=1,則編碼端可以對場景音頻信號中的c個通道的其中之一進(jìn)行暫態(tài)檢測。該其中之一可以選擇固定的通道,例如,要進(jìn)行暫態(tài)檢測的1個通道是w通道(即上述(n+1)2個通道中的1號通道(亦稱作第一個通道)),編碼端可以分別計算w通道的能量包絡(luò),將包絡(luò)峰值與包絡(luò)谷值的比值與第一閾值比較,若大于第一閾值,則確定w通道存在暫態(tài)信號,否則確定w通道不存在暫態(tài)信號。

15、上述第一閾值可以是預(yù)先設(shè)定的,例如0.1,本技術(shù)實施例對第一閾值的取值不做具體限定。

16、上述高頻信號和低頻信號可以通過與預(yù)設(shè)的第二閾值比較加以區(qū)分,例如,w通道中大于t?khz(第二閾值)的頻段的信號確定為高頻信號,w通道中小于或等于t?khz的頻段的信號確定為低頻信號。信號的能量可以采用幅度的平方的方法計算得到。第二閾值例如可以是4khz,本技術(shù)實施例對此不做具體限定。

17、編碼端得到w通道的暫態(tài)檢測結(jié)果后,進(jìn)而得到w通道的暫態(tài)標(biāo)識。可選的,可以將w通道的暫態(tài)標(biāo)識作為場景音頻信號中當(dāng)前幀的c個通道的暫態(tài)標(biāo)識,即,w通道存在暫態(tài)信號,則c個通道全都存在暫態(tài)信號;w通道不存在暫態(tài)信號,則c個通道全都不存在暫態(tài)信號。

18、可選的,若m=c,則編碼端可以對場景音頻信號中的c個通道全都進(jìn)行暫態(tài)檢測,以得到每個通道的暫態(tài)標(biāo)識。其中任意一個通道的暫態(tài)檢測方法可以參照上文對w通道的暫態(tài)檢測方法,此處不再贅述。

19、可選的,若1<m<c,則編碼端可以對場景音頻信號中的c個通道的部分通道進(jìn)行暫態(tài)檢測,以得到部分通道的暫態(tài)標(biāo)識。未作暫態(tài)檢測的通道則認(rèn)為不存在暫態(tài)信號。其中任意一個通道的暫態(tài)檢測方法可以參照上文對w通道的暫態(tài)檢測方法,此處不再贅述。

20、本技術(shù)實施例中,編碼端對場景音頻信號采用至少兩種編碼方法進(jìn)行編碼,該至少兩種編碼方法包括直接編碼處理。直接編碼處理可以是對信號本身進(jìn)行編碼的一種編碼方式。

21、可選的,場景音頻信號中的c個通道可以分成至少兩種通道,其中,第一通道采用直接編碼處理,第二通道采用其他編碼。

22、其他編碼可以包括空間編碼處理和解相關(guān)處理。其中,空間編碼處理可以參照圖2a所示實施例,根據(jù)待編碼的場景音頻信號提取空間編碼處理信息(亦稱作目標(biāo)虛擬揚(yáng)聲器屬性信息),將該空間編碼處理信息編入碼流。解相關(guān)處理可以采用時域解相關(guān)處理或頻域解相關(guān)處理,采用全通濾波器實現(xiàn)對解相關(guān)處理信號時延和相位的調(diào)整。

23、編碼端可以采用上述方法對場景音頻信號進(jìn)行編碼,包括:對第一通道采用直接編碼處理,對第二通道采用空間編碼處理;或者,對第一通道采用直接編碼處理,對第三通道采用解相關(guān)處理;或者,對第一通道采用直接編碼處理,對第二通道采用空間編碼處理,對第三通道采用解相關(guān)處理。

24、此外,編碼端還將m個通道的暫態(tài)標(biāo)識寫入碼流,以供解碼端做暫態(tài)恢復(fù)使用。

25、第二方面,本技術(shù)提供一種場景音頻信號的編碼裝置,包括:獲取模塊,用于獲取待編碼的場景音頻信號,所述場景音頻信號包括c個通道的音頻信號,c為正整數(shù);暫態(tài)檢測模塊,用于對所述c個通道中需要進(jìn)行暫態(tài)檢測的m個通道進(jìn)行暫態(tài)檢測以得到所述m個通道的暫態(tài)標(biāo)識,所述暫態(tài)標(biāo)識用于表示對應(yīng)通道是否存在暫態(tài)信號,1≤m≤c;編碼模塊,用于對所述m個通道的暫態(tài)標(biāo)識和所述場景音頻信號進(jìn)行編碼以得到碼流。

26、在一種可能的實現(xiàn)方式中,當(dāng)m=1時,所述m個通道是所述c個通道中的w通道;或者,當(dāng)1<m<c時,所述m個通道是預(yù)先設(shè)置的。

27、在一種可能的實現(xiàn)方式中,所述暫態(tài)檢測模塊,具體用于獲取目標(biāo)通道的高頻信號和低頻信號的能量差,所述高頻信號是所述目標(biāo)通道的音頻信號中頻率大于第一閾值的信號,所述低頻信號是所述目標(biāo)通道的音頻信號中頻率小于或等于所述第一閾值的信號,所述目標(biāo)通道是所述m個通道中的任一通道;當(dāng)所述能量差大于第二閾值時,對所述目標(biāo)通道賦予第一暫態(tài)標(biāo)識,所述第一暫態(tài)標(biāo)識用于表示所述目標(biāo)通道存在暫態(tài)信號;或者,當(dāng)所述能量差小于或等于所述第二閾值時,對所述目標(biāo)通道賦予第二暫態(tài)標(biāo)識,所述第二暫態(tài)標(biāo)識用于表示所述目標(biāo)通道不存在暫態(tài)信號。

28、在一種可能的實現(xiàn)方式中,所述場景音頻信號采用至少兩種編碼方法編碼,所述至少兩種編碼方法包括直接編碼處理,且還包括空間編碼處理和/或解相關(guān)處理。

29、在一種可能的實現(xiàn)方式中,所述編碼模塊,具體用于對第一通道進(jìn)行所述直接編碼處理,對第二通道進(jìn)行所述空間編碼處理;或者,對第一通道進(jìn)行所述直接編碼處理,對第三通道進(jìn)行所述解相關(guān)處理;或者,對第一通道進(jìn)行所述直接編碼處理,對第二通道進(jìn)行所述空間編碼處理,對第三通道進(jìn)行所述解相關(guān)處理;其中,所述第一通道、所述第二通道或者所述第三通道分別是所述c個通道中的一類通道。

30、第三方面,本技術(shù)提供一種碼流生成方法,根據(jù)如上述第一方面中任一項所述的方法生成碼流。

31、第四方面,本技術(shù)提供一種電子設(shè)備,包括:一個或多個處理器;存儲器,用于存儲一個或多個程序;當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如上述第一方面中任一項所述的方法。

32、第五方面,本技術(shù)提供一種芯片,包括一個或多個接口電路和一個或多個處理器;所述接口電路用于從電子設(shè)備的存儲器接收信號,并向所述處理器發(fā)送所述信號,所述信號包括存儲器中存儲的計算機(jī)指令;當(dāng)所述處理器執(zhí)行所述計算機(jī)指令時,使得所述電子設(shè)備執(zhí)行上述第一方面中任一項所述的方法。

33、第六方面,本技術(shù)提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,當(dāng)所述計算機(jī)程序運(yùn)行在計算機(jī)或處理器上時,使得所述計算機(jī)或所述處理器執(zhí)行如上述第一方面中任一項所述的方法。

34、第七方面,本技術(shù)提供一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括計算機(jī)程序代碼,當(dāng)所述計算機(jī)程序代碼在計算機(jī)上運(yùn)行時,使得計算機(jī)執(zhí)行上述第一方面中任一項所述的方法。

35、第八方面,本技術(shù)提供一種存儲碼流的裝置,所述裝置包括:接收器和至少一個存儲介質(zhì),所述接收器用于接收碼流;所述至少一個存儲介質(zhì)用于存儲所述碼流;所述碼流是根據(jù)如上述第一方面中任一項所述的方法生成的。

36、第九方面,本技術(shù)提供一種傳輸碼流的裝置,所述裝置包括:發(fā)送器和至少一個存儲介質(zhì),所述至少一個存儲介質(zhì)用于存儲碼流,所述碼流是根據(jù)如上述第一方面中任一項所述的方法生成的;所述發(fā)送器用于從所述存儲介質(zhì)中獲取所述碼流并將所述碼流通過傳輸介質(zhì)發(fā)送給端側(cè)設(shè)備。

37、第十方面,本技術(shù)提供一種分發(fā)碼流的系統(tǒng),所述系統(tǒng)包括:至少一個存儲介質(zhì),用于存儲至少一個碼流,所述至少一個碼流是根據(jù)如上述第一方面中任一項所述的方法生成的,流媒體設(shè)備,用于從所述至少一個存儲介質(zhì)中獲取所述碼流,并將所述碼流發(fā)送給端側(cè)設(shè)備,其中,所述流媒體設(shè)備包括內(nèi)容服務(wù)器或內(nèi)容分發(fā)服務(wù)器。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1