使用經(jīng)優(yōu)化球面量化字典對球面坐標進行編碼和解碼的制作方法

文檔序號：39516710發(fā)布日期：2024-09-27 16:50閱讀：72來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及應(yīng)用于聲音數(shù)據(jù)的編碼/解碼的球面向量量化，以便對通常由球面坐標(例如，在預(yù)定距離處的方位角和仰角)表示的源到達方向(縮寫為“doa”)進行編碼。

背景技術(shù)：

1、目前在移動電話中使用的編碼器/解碼器(下文稱為“編解碼器”)是單聲道的(要呈現(xiàn)在單個揚聲器上的單個信號聲道)。3gpp?evs(“增強型語音服務(wù)”)編解碼器使得能夠提供“超hd”音質(zhì)(也稱為“高清加”或hd+語音)，其中，為以32khz或48khz采樣的信號提供超寬帶(swb)音頻帶或者為以48khz采樣的信號提供全帶(fb)音頻帶；音頻帶寬在swb模式(9.6kbit/s至128kbit/s)下為14.4khz至16khz并且在fb模式(16.4kbit/s至128kbit/s)下為20khz。

2、由運營商提供的會話服務(wù)中下一質(zhì)量演變應(yīng)該由沉浸式服務(wù)組成，該沉浸式服務(wù)使用如配備有多個麥克風(fēng)的智能手機、或者遠程呈現(xiàn)或360°視頻空間化音頻會議或視頻會議設(shè)備、或者甚至具有比簡單的2d立體聲呈現(xiàn)更加沉浸式的空間化3d聲音呈現(xiàn)的“實時”音頻內(nèi)容共享設(shè)備等終端。隨著用音頻頭戴式耳機在移動電話上進行收聽的運用日益廣泛以及先進的音頻設(shè)備(如3d麥克風(fēng)、具有聲學(xué)天線的語音助手、虛擬現(xiàn)實或增強現(xiàn)實頭戴式耳機等附件)的出現(xiàn)，捕獲并呈現(xiàn)空間化聲音場景以提供沉浸式通信體驗如今已經(jīng)足夠普遍。

3、為此，未來的3gpp標準“ivas”(“沉浸式語音和音頻服務(wù)”)計劃通過接受至少以下所列的空間化聲音格式(及其組合)作為編解碼器輸入格式來將evs編解碼器擴展為沉浸式音頻：

4、-立體聲或5.1多聲道格式(基于聲道)，其中，每個聲道饋入一個揚聲器(例如立體聲中的l和r或5.1中的l、r、ls、rs和c)；

5、-對象格式(基于對象)，其中，聲音對象被描述為與描述該對象的屬性(空間位置，源空間寬度等)的元數(shù)據(jù)相關(guān)聯(lián)的音頻信號(通常是單聲道的)，

6、-高保真立體聲格式(基于場景)，該格式描述了給定點的聲場，該聲場通常由球形麥克風(fēng)捕獲或在球諧函數(shù)域中合成。

7、還可能考慮其他輸入格式，如稱為masa(元數(shù)據(jù)輔助空間音頻)的格式，其對應(yīng)于配備有多個麥克風(fēng)的移動電話上的聲音拾取的參數(shù)表示。下文將對這種格式進行更詳細的研究。

8、要由編碼器/解碼器處理的信號采用連續(xù)的聲音樣本塊的形式，以下稱為“幀”或“子幀”。

9、此外，在下文中，數(shù)學(xué)符號遵循以下慣例：

10、-標量：s或n(小寫字母用于變量或大寫字母用于常量)

11、-向量：(小寫粗斜體)

12、-矩陣：(大寫粗斜體)

13、在下文中，我們將半徑為r的n+1維球體定義為

14、

15、其中，||.||表示歐幾里德范數(shù)。當半徑r未指定時，將假設(shè)r＝1(單位球體)。這里的重點是維度為3的情況，其中，n＝2。

16、這里將回顧3維球面坐標的定義。對于3維點(x，y，z)，通常至少有兩種經(jīng)典的表示為(r，φ，θ)的球面坐標的慣例：

17、-地理慣例：x＝r?cosφcosθ，y＝r?cosφsinθ，z＝r?sinφ，其中，r≥0，-π/2≤φ≤π/2，并且-π≤θ≤π

18、-物理慣例：x＝r?sinφcosθ，y＝r?sinφsinθ，z＝r?cosφ，其中，r≥0，0≤φ≤π，并且-π≤θ≤π

19、在不失一般性的情況下，這些角度φ，θ在此以弧度來定義。

20、在這兩個定義中，半徑r和方位角(或經(jīng)度)θ是相同的，但是角度φ根據(jù)它是相對于水平面0xy(區(qū)間[-π/2，π/2]上的仰角或緯度)定義還是基于軸線0z(區(qū)間[0，π]上的余緯度或極角)定義而不同。方位角θ可以在區(qū)間[-π，π]上定義，并且以等效的方式，它可以通過模數(shù)2π的簡單運算在[0，2π]上定義。在下文中，相同的角坐標將優(yōu)選地以度表示，但是可以使用其他單位。應(yīng)當注意，文獻中的符號可以不同(例如，用代替φ)和/或互換(例如，θ表示余緯度并且表示經(jīng)度)。

21、在下文中，所采用的慣例將優(yōu)選地是使用仰角和方位角對的慣例，但是本發(fā)明適用于球面坐標的所有變型定義。

22、本發(fā)明所關(guān)注的是應(yīng)用于對音頻源3d方向編碼的球面向量量化的示例性實施例。本發(fā)明還可以應(yīng)用于其他音頻格式和需要對3維球面數(shù)據(jù)進行編碼的其他信號(例如，圖像或360視頻)。

23、下文將回顧dirac(定向音頻編碼)的原理。在一些變型中，可以將本發(fā)明應(yīng)用于其他編碼方案，特別是用于基于變換的音頻編碼。

24、dirac編碼例如在以下文章中描述：v.pulkki,spatial?sound?reproductionwith?directional?audio?coding[利用定向音頻編碼的空間聲音再現(xiàn)],journal?of?theaudio?engineering?society[音頻工程學(xué)會雜志],第55卷,第6期,第503-516頁,2007。在該文獻中，通過定向分析來執(zhí)行映射，以便找到每個子帶的方向(doa)。該doa由“擴散”參數(shù)補充，從而給出聲音場景的參數(shù)描述。

25、多聲道輸入信號以傳輸聲道(典型地通過減少多個拾音聲道而獲得的單聲道或立體聲信號)和空間元數(shù)據(jù)(每個子帶的doa和“擴散”)的形式進行編碼。

26、圖1描述了dirac編碼的一種示例性實施方式。在該示例中，編碼減少聲道的數(shù)量(下混-框100)，其中，編碼(框110)例如僅在一個聲道上利用單聲道編解碼器(例如，在給定比特率(24.4kbit/s)下的3gpp?evs)來執(zhí)行。輸入信號也被分解(框120)成頻率子帶，例如，通過濾波器組或通過短時傅里葉變換。這里將假設(shè)劃分成bark頻帶，例如，從現(xiàn)有技術(shù)中已知的分布在bark標度上的頻率中的24個子帶。在每一幀和每個子帶中，dirac編碼通常估計兩個參數(shù)(框130)——為了簡化符號，沒有幀索引或子帶被用于各種參數(shù)：根據(jù)仰角(φ)和方位角(θ)的主要源的方向(doa)，以及由pulkki在上述文章中描述的“擴散”ψ。通常通過具有時間平均值的活動強度向量來估計doa；在一些變型中，將可以實施用于估計φ，θ，ψ的其他方法。

27、在每一幀和每個子帶中，在每對(φ，θ)預(yù)定數(shù)量的比特(例如，7比特)上對doa進行編碼(框140)?！皵U散”ψ是介于0到1之間的參數(shù)，并且在這里(框150)通過(例如，對6個比特)進行標量量化來進行編碼。因此，在所給出的示例中，空間元數(shù)據(jù)編碼預(yù)算是每幀24×(7+6)＝312比特，也就是說15.6kbit/s，全局預(yù)算為24.4+15.6＝40kbit/s。對下混信號編碼比特流和經(jīng)編碼空間參數(shù)進行復(fù)用(框160)，以便形成每一幀的比特流。

28、圖2展示了dirac解碼器的一個示例性實施例。在多路分解比特流(框200)之后，對“下混”信號進行解碼(框210)。對空間參數(shù)進行解碼(框250和框270)。然后，經(jīng)解碼信號被分解成時間/頻率(與框120相同的框220)，以便將其空間化為框(框260)中的點源(平面波)，該框如下生成空間化1階高保真立體聲信號：

29、

30、基于經(jīng)解碼信號，執(zhí)行去相關(guān)(框230)，以便具有“擴散”版本(對應(yīng)于最大源寬度)；這種去相關(guān)還實現(xiàn)了聲道數(shù)量的增加，以便在框230的輸出處獲得具有4個聲道(w，y，z，x)的1階高保真立體聲信號。經(jīng)去相關(guān)的信號被分解成時間/頻率(框240)。在應(yīng)用從經(jīng)解碼的“擴散”(框271和272)獲得的比例因子(框273和274)之后，由框240和260產(chǎn)生的信號按子帶組合(框275)；這種自適應(yīng)混合使得能夠在每個子帶中“調(diào)節(jié)”聲源寬度和聲場的擴散特性?；旌闲盘柾ㄟ^濾波器組或逆短時變換而轉(zhuǎn)換到時域(框280)。

31、因此，dirac格式的源方向以3d球面數(shù)據(jù)的形式表示，例如，以根據(jù)地理慣例的球面坐標(方位角、仰角)的形式表示。在這種情況下，需要有效地表示這種doa信息，這能夠被公式化為3維球體上的向量量化問題。

32、沉浸式音頻的參數(shù)格式的另一示例是在文獻“3gpp?tdoc?s4-180087:on?ivasaudio?formats?for?mobile?capture?devices[關(guān)于用于移動捕獲設(shè)備的ivas音頻格式].來源:諾基亞公司”中描述的masa格式。圖3概述了這一原理。假設(shè)移動電話配備有多個麥克風(fēng)(例如，4個麥克風(fēng))，這些麥克風(fēng)放置在預(yù)定位置處(例如，兩個麥克風(fēng)放置在電話底部，一個麥克風(fēng)放置在電話頂部，最后一個麥克風(fēng)放置在電話后殼上)。在框300中，這些麥克風(fēng)被視為組合在一起，其提供的信號(聲道)數(shù)量與麥克風(fēng)的數(shù)量一樣多——可能還具有比如麥克風(fēng)的放置或特性等附加信息。

33、框310使用類似的dirac方法對來自框300的信號進行參數(shù)分析，從而提供傳輸聲道和元數(shù)據(jù)。這種masa分析通常是專有的，并由電話制造商選擇。傳輸聲道的數(shù)量通常限于1(單聲道)或2(立體聲)，并且可以簡單地通過在單聲道情況下選擇主麥克風(fēng)或在立體聲情況下選擇兩個相對麥克風(fēng)(例如，一個在電話的底部，另一個在電話的頂部)來定義。masa元數(shù)據(jù)格式的一個示例例如在文獻“3gpp?tdoc?s4-191167(2019年10月),ivas?masa?creference?software[ivas?masa?c參考軟件],來源:諾基亞公司”中進行描述。在此特別注意的是被稱為“方向索引”的參數(shù)，該參數(shù)以16比特編碼并且在該文獻中描述如下：“時頻區(qū)間內(nèi)聲音的到達方向；球面表示，精確度約為1度；值區(qū)間：“涵蓋所有方向，精確度約為1°”。

34、因此，這涉及根據(jù)3d球面網(wǎng)格的源方向(doa)，其(角)分辨率接近1度。通過doa估計為每個幀和頻率子帶提供該doa信息(框311)。因此，框312(在框310內(nèi))對每doa以16比特編碼的doa信息進行編碼。

35、框320表示ivas編解碼器，其尚未作為3gpp標準提供且仍在開發(fā)中。然而，在3gpp中已經(jīng)提出將定義傳輸聲道和元數(shù)據(jù)(包括每幀和子帶的doa)的masa參數(shù)格式作為ivas編解碼器的輸入格式。然后，(未來)ivas編碼器應(yīng)該實施解碼doa信息的步驟(框321)，以便能夠充分利用該doa信息并以較低速率對其進行壓縮。關(guān)于以給定速率將輸入masa格式壓縮成ivas比特流的實施方式細節(jié)以及相關(guān)聯(lián)的解碼超出了本發(fā)明的范圍，但是例如可以注意到，masa格式是基于dirac編碼的擴展原理，傳輸聲道可以單獨地(通過單聲道核心編解碼器)或一起(通過立體聲核心編解碼器)編碼，并且元數(shù)據(jù)可以以低于masa輸入格式的速率進行編碼。

36、一般來說，球體的任何離散化都可以用作球面向量量化字典。然而，在沒有任何特定結(jié)構(gòu)的情況下，尤其當doa信息的編碼速率過高時(例如，每3d向量16比特指示一個doa)，在該字典中搜索最近鄰和編引可能證明實施成本高昂。

37、3d球面網(wǎng)格的一個示例在附錄和附于以下文獻的源代碼中給出：“3gpp?tdoc?s4-191167(2019年10月),description?of?the?ivas?masac?reference?software[ivasmasac參考軟件的描述],來源:諾基亞公司”。

38、wmasa格式建議的給定幀和給定子帶中音頻源的空間方向由兩個角度表示：方位角和仰角。下文中使用的符號φ代表仰角并且θ代表方位角，而在文獻3gpp?tdoc?s4-191167中使用相反的慣例。

39、該文獻給出了球面網(wǎng)格的定義，如下：

40、網(wǎng)格由ntot＝216-208＝65328個點組成，離散化半徑為1的3d球體的表面；每個點由16比特上的單個索引表示。該網(wǎng)格由三個存儲元素定義：

41、·數(shù)量為nφ＝122的離散值，用于對正仰角(即，|φ|)進行編碼

42、·仰角標量量化字典(針對與|φ|相對應(yīng)的北半球)：

43、·點數(shù)(字典的大小)nθ(i)，i＝0,…,121，用于在索引i的給定離散仰角處對方位角進行編碼

44、網(wǎng)格的精確定義詳述如下：

45、·3d網(wǎng)格上的每個點由一個經(jīng)編碼仰角值(被分解成一個經(jīng)編碼絕對值(其中，i＝0，...，nφ-1)和一個符號(+1或-1))和一個經(jīng)編碼方位角值(j＝0，..，nθ(i)-1，其取決于仰角索引i)給出。經(jīng)編碼仰角值在i＝0時為并且在i＝1，...，nφ-1時為

46、·因此，數(shù)量nφ＝122對應(yīng)于具有正值(包括零值)的(經(jīng)編碼)仰角的數(shù)量；因此，仰角標量量化字典包括考慮了符號的2nφ-1＝243個編碼值，并且這些值可以從北極到南極排序為：

47、對應(yīng)于北極

48、

49、...

50、對應(yīng)于赤道上方的第一層

51、對應(yīng)于赤道

52、對應(yīng)于赤道下方的第一層

53、...

54、

55、對應(yīng)于南極

56、·仰角φ通過區(qū)間[-88.65，88.65]度上的均勻標量量化進行編碼，另外還有用于兩個極點(±90度)的碼字。值0度(對應(yīng)于赤道)包含在字典中。量化步長被設(shè)置為

57、

58、從而給出δφ≈0.7388度。因此，這給出在i＝0，...，nφ-2時為并且在i＝nφ-1時為

59、·方位角θ的均勻標量量化字典的大小nθ(i)取決于經(jīng)編碼仰角i；方位角步長被設(shè)置成使得連續(xù)碼字之間的距離是相同的。方位字典的大小相對于赤道對稱(具有負仰角的層與具有正仰角的層的點數(shù)相同)。

60、經(jīng)編碼方位角值的數(shù)量nθ(i)由下式給出：

61、nθ(0)＝422

62、其中，

63、nθ(nφ-1)＝1

64、其中

65、r(1)≈0·999916868023083

66、r(i)＝cos(iδφ)，i＝2，…，nφ-2

67、在實踐中，這給出：

68、nθ(i＝0，...，121)＝【

69、422421421421421421420420419419418417416416415414413411

70、4104094084064054034014003983963943923903883863843823793773743723693673643613583553523493463433403373333303273233203163133093053012982942902862822782742692652612572522482442392352302252212162112072021971921881831781731681631581531481431371321271221171111061019690858074696458534742373126201591]

71、可以驗證網(wǎng)格中的總點數(shù)為：

72、

73、·每個經(jīng)編碼仰角定義了使用方位角字典的球面區(qū)域(由仰角值界定的球面區(qū)域)。方位角字典的偏移在i為偶數(shù)值時設(shè)置為0，并在i為奇數(shù)值時設(shè)置為換言之，經(jīng)編碼方位角值(以度為單位)在j＝0，...，nθ(i)-1時為：

74、

75、以上引用的文獻給出了一種用于對給定點(φ，θ)進行編碼的方法。

76、給定要編碼的點(φ，θ)，網(wǎng)格上的量化(搜索最近鄰)是根據(jù)以下步驟執(zhí)行的：

77、·確定仰角φ的符號sgnφ和絕對值|φ|；特別地，如果φ≥0，則sgnφ＝1，否則為-1。通過選擇兩個最近鄰，通過均勻標量量化對絕對值|φ|進行編碼。利用“2個幸存物”進行的這種編碼可以例如通過窮舉搜索在(正)仰角字典中初步搜索最近鄰來執(zhí)行。

78、

79、i1表示最近鄰的索引。然后，根據(jù)i1的值來確定第二最近值的索引i2：

80、○如果i1＝0，則i2＝1

81、○如果i1＝nφ-1，則i2＝nφ-2

82、○如果0＜i1＜nφ-1，則

83、因此，這給出了兩個候選其中，是經(jīng)編碼絕對仰角，k＝1或2，以表示仰角φ。就絕對值而言，這兩個候選簡單地是和

84、·根據(jù)分別對應(yīng)于k＝1或2的字典通過均勻標量量化(具有仰角相關(guān)偏移)對方位角θ進行編碼。該索引jk如下獲得：

85、

86、其中，是取整到較低整數(shù)，如果ik是偶數(shù)，則δ＝0，如果ik是奇數(shù)，則為180/nθ(ik)，并且是模運算，因此，如果i＝0,…,nθ(ik)-1且則索引jk因此滿足：0≤jk≤nθ(ik)-1。

87、·通過根據(jù)k＝1或2最小化(φ，θ)與之間的球面距離來選擇最佳候選，該球面距離可以不考慮符號sgnφ(因為的符號與φ的符號相同)而寫為：

88、

89、在這個距離的意義上，最接近的對被選擇為要編引的量化值。這個選定點被表示為其中：

90、并且且

91、選定點的量化索引(在16比特上)(這里表示為index)是通過從赤道開始枚舉網(wǎng)格上的點(所有仰角點)、然后考慮赤道上方的第一層(所有仰角點)、再考慮赤道下方的第一層(所有仰角點)等來獲得的。

92、這給出了區(qū)間0，...，ntot-1內(nèi)形式為index的索引，其中：

93、

94、每次確定索引index時，即時地計算累積基數(shù)值cumn：

95、cumn(0)＝nθ(0)

96、cumn(1)＝cumn(0)+nθ(1)＝nθ(0)+nθ(1)

97、cumn(2)＝cumn(1)+nθ(1)＝nθ(0)+2nθ(1)

98、cumn(3)＝cumn(2)+nθ(2)＝nθ(0)+2nθ(1)+nθ(2)

99、cumn(4)＝cumn(3)＝nθ(2)＝nθ(0)+2nθ(1)+2nθ(2)

100、....

101、cumn(2i-1)＝cumn(2i-2)+nθ(i)

102、cum(2i)＝cumn(2i-1)+nθ(i)

103、圖4的流程圖中解釋了上述文獻中的解碼方法。

104、解碼包括從索引index(框400)開始檢索仰角信息idφ，sgnφ和方位角信息idθ(框413)，由此然后使得能夠重建該點

105、解碼的原理是將值index與連續(xù)累積基數(shù)值cumn(或基數(shù)和)進行連續(xù)比較，考慮到對于具有相同絕對值的仰角(在北半球和南半球中)而言基數(shù)nθ(i)是相同的，這些連續(xù)累積基數(shù)值是在i＝0，...，nφ-1時即時遞歸地計算的。仰角的符號sgnφ通過利用寫入球面層的如下預(yù)定義順序來解碼：赤道，具有正仰角(+)的第一層，具有負仰角(-)的第一層，……，直到北極(+)和南極(-)……

106、對idφ、sgnφ、cumn(0)的值進行初始化(框401)。

107、如果index≥cumn(0)(框402)，則對索引的赤道之外(i＞0)的“仰角層”進行信息解碼。從i＝1開始直到i＝nφ-1(框403、404、411)，以循環(huán)方式進行對“仰角層”的搜索。在迭代i中，遞歸地計算累積基數(shù)(框405、408)，并將其與索引進行比較(框406、409)，以便對索引進行解碼(框407、410)。

108、如果index＜cumn(0)(框402)，則對對應(yīng)于赤道的層進行信息索引的解碼(框412)。

109、應(yīng)當注意的是，在附于文獻3gpp?tdoc?s4-191167的源代碼的實施方式中，實施用于驗證是否i＝nφ-1的測試以便顯式地解碼idφ＝nφ-1，sgnφ＝-1、idθ＝0。不采用這部分是因為在包含北極和南極的網(wǎng)格中符號sgnφ＝1也應(yīng)是可能的，并且這部分通常是不必要的，因為定義cumn(nφ-1)應(yīng)該允許解碼與極點相關(guān)聯(lián)的點?？梢院雎詫O點的特定管理；重要的是通過將索引與隨時間計算的累積基數(shù)(或基數(shù)之和)進行比較來進行迭代解碼的原理。

110、一旦索引idφ，sgnφ和idθ已經(jīng)被解碼，在413中對球面坐標的重建就可采用以上定義的網(wǎng)格的定義，其中：

111、在i＝0，...，nφ-2時，并且在i＝nφ-1時，

112、

113、如在以上引用的文獻3gpp?tdoc?s4-191167中所實施的這種方法需要初步存儲用于(正)仰角的標量量化的nφ＝122個浮動值為每個(正)仰角層給出nθ(i)個值的nφ個整數(shù)值、以及給出nφ的一個整數(shù)值。網(wǎng)格并非使用16比特上所有可能的索引值，因為208個索引(從65328到65535)未使用。

114、這種方法的主要缺點是其復(fù)雜度非常高，假設(shè)有24個子帶(因此每幀有24個doa)且時間分辨率為5ms(因此每5ms一幀)，則其編碼復(fù)雜度約為123wmops(每秒加權(quán)百萬次操作數(shù))，并且其解碼復(fù)雜度約為12wmops。這種成本較高，特別是由于仰角的標量量化是通過在已存儲的字典中進行搜索來實施的，并且尤其是由于累積基數(shù)cumn(i)是即時計算的。

115、因此，需要改進現(xiàn)有技術(shù)中用于3d維球面數(shù)據(jù)量化的方法，特別是為了高效地對doa數(shù)據(jù)進行編碼，盡可能地降低復(fù)雜度，并且同時避免在給定總點數(shù)(或相當于給定的比特預(yù)算)的情況下出現(xiàn)未使用的索引。

116、本發(fā)明旨在改進現(xiàn)有技術(shù)。

技術(shù)實現(xiàn)思路

1、為此，本發(fā)明針對一種用于對聲源的空間方向進行編碼的方法，該方向由包括仰角坐標和方位角坐標的球面坐標來定義，其中，球面量化字典通過仰角編碼和方位角編碼在3d球體上定義，并且其中：

2、-該仰角編碼使用標量量化，在多個仰角級別上給出至少一個經(jīng)編碼仰角索引，

3、-該方位角編碼使用標量量化，根據(jù)取決于經(jīng)編碼仰角索引的每級別點數(shù)，

4、-該每級別點數(shù)是基于兩個連續(xù)累積基數(shù)值確定的，

5、-經(jīng)編碼仰角索引的累積基數(shù)值表示與總點數(shù)成比例的點數(shù)并且根據(jù)球面區(qū)域的面積，該球面區(qū)域包括由該經(jīng)編碼仰角索引的正仰角級別的上水平面與該球體的下水平面界定的至少一個區(qū)域。

6、因此，用于定義球面量化字典、特別是用于確定方位角坐標的量化級別數(shù)量的累積基數(shù)值是基于對球面區(qū)域面積的直接估計，因此避免了對現(xiàn)有技術(shù)中提出的方法中使用的基數(shù)之和的即時和遞歸計算，這種計算非常耗費資源。

7、這里提出的方法大大降低了資源消耗，并且例如，編碼消耗的資源約為2wmops，且解碼消耗的資源約為1wmops。

8、定義這種量化字典還可以利用字典中所有可能的點(或碼字)，以便使量化更高效并且避免網(wǎng)格中出現(xiàn)未使用的索引(或碼字)。特別地，應(yīng)用本發(fā)明以實施一種用于在16比特上對doa信息進行編碼和解碼以定義ivas編碼的輸入處的masa格式的更高效的方法。

9、在一個實施例中，仰角編碼包括對應(yīng)于赤道和3d球體的極點的級別，從而可以將球體的所有特定點(赤道和極點)包括在量化字典中。

10、在一個實施例中，該方位角編碼的點數(shù)是針對與該赤道相對應(yīng)的仰角級別而預(yù)先確定的，并且該總點數(shù)是通過根據(jù)以下表達式從目標點數(shù)中減去與該赤道和該球體的北極和南極中的每一個相對應(yīng)的預(yù)定點數(shù)來獲得的：n′tot＝ntot-nθ(0)-2nθ(nφ-1),

11、ntot是在給定比特預(yù)算時該球體的目標點數(shù)，

12、nθ(0)是針對與該赤道相對應(yīng)的仰角級別的預(yù)定點數(shù)；以及

13、2nθ(nφ-1)是針對該球體的北極和南極的預(yù)定點數(shù)。

14、因此，該方法適于了解某些特定球面層的點(比如對應(yīng)于赤道的點和對應(yīng)于極點的點)的數(shù)量，這些點可以被定義為固定值。

15、在一個特定實施例中，經(jīng)編碼仰角索引的累積基數(shù)值表示根據(jù)由該經(jīng)編碼仰角索引的正仰角級別的上水平面與該球體的關(guān)于該赤道對稱的相同平面界定的球面區(qū)域的面積(ai)減去與該赤道的仰角級別相對應(yīng)的面積(a0)與該總點數(shù)成比例的點數(shù)，根據(jù)如下比率：

16、

17、nφ-2是沒有該赤道和該球體的北極和南極時的仰角量化級別數(shù)量，并且該球面區(qū)域的面積對應(yīng)于仰角索引nφ-2。

18、在一個變型實施例中，經(jīng)編碼仰角索引的累積基數(shù)值表示根據(jù)由該經(jīng)編碼仰角索引的正仰角級別的上水平面與該赤道的相同平面界定的球面區(qū)域的面積(a'i)減去與該赤道的仰角級別相對應(yīng)的面積的一半與該總點數(shù)成比例的點數(shù)，根據(jù)如下比率：

19、

20、nφ-2是沒有該赤道和該球體的北極和南極時的仰角量化級別數(shù)量，并且該球面區(qū)域的面積對應(yīng)于仰角索引nφ-2。

21、這些球面區(qū)域的面積比率使得能夠容易地且直接地通過簡單的三規(guī)則來估計作為3d球體的完整表面的子集的對應(yīng)球面區(qū)域中的點數(shù)。

22、這些比率使得能夠如下表達累積基數(shù)值：

23、

24、其中

25、i＝1，...，nφ-2，nφ-2是沒有該赤道和該球體的北極和南極時的仰角量化級別數(shù)量，

26、arri()是取決于i取整到最接近的整數(shù)，對應(yīng)于取整到偶整數(shù)，并且δφ是該仰角的給定量化步長。

27、在一個實施例中，該仰角編碼在多個仰角級別(nφ)上給出經(jīng)編碼仰角索引(i)和符號信息。

28、因此，僅考慮一個半球來定義量化字典，仰角的級別數(shù)量與每級別點數(shù)關(guān)于赤道對稱。

29、在一個實施例中，基于通過標量量化在確定的每級別點數(shù)(nθ(i))上編碼的方位角索引和至少基于該經(jīng)編碼仰角索引而獲得的累積基數(shù)值來確定要傳輸?shù)娜至炕饕?index)。

30、可以直接地(通過分析)估計由此定義的基數(shù)值，以便定義要傳輸?shù)娜炙饕?，從而可以降低最大計算?fù)雜度。

31、本發(fā)明還涉及一種用于對聲源的空間方向進行解碼的方法，該方向由包括仰角坐標和方位角坐標的球面坐標來定義，其中，球面量化字典通過仰角編碼和方位角編碼在3d球體上定義，并且其中：

32、-該仰角解碼使用標量量化，在多個仰角級別(nφ)上給出至少一個經(jīng)解碼仰角索引(i)，

33、-該方位角解碼使用標量量化，根據(jù)取決于該經(jīng)解碼仰角索引(i)的每級別點數(shù)(nθ(i))，

34、-該每級別點數(shù)(nθ(i))是基于兩個連續(xù)累積基數(shù)值(cumn(i)，cumn(i-1))確定的，

35、-經(jīng)解碼仰角索引(i)的累積基數(shù)值(cumn(i))表示與總點數(shù)成比例的點數(shù)并且根據(jù)球面區(qū)域的面積，該球面區(qū)域包括由該經(jīng)解碼仰角索引(i)的正仰角級別的上水平面與該球體的下水平面界定的至少一個區(qū)域。

36、解碼方法具有與編碼方法相同的優(yōu)點，并且可以通過使用經(jīng)優(yōu)化球面量化字典來優(yōu)化計算資源。

37、以與編碼相同的方式并且根據(jù)相同的優(yōu)點，在一個實施例中，仰角解碼包括對應(yīng)于赤道(0°)和3d球體的極點(+/-90°)的級別。

38、根據(jù)一個特定實施例，該方位角解碼的點數(shù)(nθ(0))是針對與該赤道相對應(yīng)的仰角級別而預(yù)先確定的，并且該總點數(shù)(n′tot)是通過根據(jù)以下表達式從目標點數(shù)(ntot＝216)中減去與該赤道和該球體的北極和南極中的每一個相對應(yīng)的預(yù)定點數(shù)來獲得的：n′tot＝ntot-nθ(0)-2nθ(nφ-1),

39、ntot是在給定比特預(yù)算時該球體的目標點數(shù)，

40、nθ(0)是針對與該赤道相對應(yīng)的仰角級別的預(yù)定點數(shù)；以及

41、2nθ(nφ-1)是針對該球體的北極和南極的預(yù)定點數(shù)。

42、在一個實施例中，經(jīng)解碼仰角索引(i)的累積基數(shù)值(cumn(i))表示根據(jù)由該經(jīng)解碼仰角索引(i)的正仰角級別的上水平面與該球體的關(guān)于該赤道對稱的相同平面界定的球面區(qū)域的面積(ai)減去與該赤道的仰角級別相對應(yīng)的面積(a0)與該總點數(shù)成比例的點數(shù)，根據(jù)如下比率：

43、

44、nφ-2是沒有該赤道和該球體的北極和南極時的仰角量化級別數(shù)量，并且該球面區(qū)域的面積對應(yīng)于仰角索引nφ-2。

45、在一個可能的示例中，該累積基數(shù)值的表達式如下：

46、

47、其中

48、i＝1，...，nφ-2，nφ-2是沒有該赤道和該球體的北極和南極時的仰角量化級別數(shù)量，

49、arri(0)是取決于i取整到最接近的整數(shù)，對應(yīng)于取整到偶整數(shù)，并且δφ是該仰角的給定量化步長。

50、根據(jù)一個實施例，該仰角解碼在多個仰角級別(nφ)上給出經(jīng)解碼仰角索引(i)和符號信息。

51、在一個實施例中，該解碼包括接收全局量化索引(index)，并基于該索引來確定至少基于該經(jīng)解碼仰角索引而獲得的累積基數(shù)值以及在確定的每級別點數(shù)(nθ(i))上的經(jīng)解碼方位角索引。

52、本發(fā)明針對一種編碼設(shè)備，該編碼設(shè)備包括用于實施如上所述的編碼方法的步驟的處理電路。

53、本發(fā)明還針對一種解碼設(shè)備，該解碼設(shè)備包括用于實施如上所述的解碼方法的步驟的處理電路。

54、本發(fā)明涉及一種計算機程序，該計算機程序包括當由處理器執(zhí)行時用于實施如上所述的編碼方法或解碼方法的指令。

55、最后，本發(fā)明涉及一種存儲介質(zhì)，該存儲介質(zhì)能夠被處理器讀取并且儲存包括用于執(zhí)行上述編碼方法或解碼方法的指令的計算機程序。

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：S·拉戈特,M·亞歐米
技術(shù)所有人：奧蘭治
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

使用經(jīng)優(yōu)化球面量化字典對球面坐標進行編碼和解碼的制作方法