聲音編碼及解碼裝置、聲音編碼及解碼方法

文檔序號：2837352閱讀：551來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：聲音編碼及解碼裝置、聲音編碼及解碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于執(zhí)行分析合成型的聲音編碼及聲音解碼的聲音編碼裝置、聲音解碼裝置、聲音編碼方法、聲音解碼方法、以及計算機可讀取的記錄媒體。

背景技術(shù)：
對于便攜電話等中使用的聲音壓縮技術(shù)，例如用于滿足采樣頻率為8kHz、收發(fā)速度為4kbps這樣的限制條件的技術(shù)開發(fā)不斷進步。該聲音壓縮技術(shù)在分析合成型的聲音壓縮技術(shù)中還分類成低比特率聲音壓縮技術(shù)。
作為典型的分析合成型的低比特率聲音壓縮技術(shù)，例如有ITU-T建議G.729中所公示的8kbps的聲音編碼方法。在該聲音編碼方法中，編碼裝置通過對處理對象的聲音信號主要實施線性預(yù)測分析，來生成預(yù)測系數(shù)和殘差信號。解碼裝置接收與預(yù)測系數(shù)和殘差信號有關(guān)的信息，從該信息對聲音信號進行解碼。
作為聲音的分析合成的方法，除了基于線性預(yù)測分析的方法以外，還公知有基于MLSA(Mel Log Spectrum Approximation)分析的方法。基于MLSA分析的聲音分析合成，例如記載于電子通信學(xué)會論文誌、第J66-A卷、第2號、P.122-129、1983年今井圣(Satoshi IMAI)、住田一男(Kazuo SUMITA)、古市千枝子(Chieko FURUICHI)著作的《音聲合成のためのメル

數(shù)スペクトル近似(MLSA)フィルタ(Mel log Spectrum approximation(MLSA)filterfor speech synthesis)》。
此外，在解碼裝置中，由編碼裝置生成的殘差信號被作為激發(fā)信號對待，該激發(fā)信號用于使用根據(jù)預(yù)測系數(shù)而計算出的濾波器來對聲音信號進行解碼。即，所謂殘差信號和激發(fā)信號的區(qū)別在于是著眼于編碼裝置側(cè)還是著眼于解碼裝置側(cè)，二者僅是為方便起見的單純的名稱的不同，而實質(zhì)上是相同的信號。
另外，分析合成型的聲音壓縮技術(shù)與波形編碼型的聲音壓縮技術(shù)相比，可以降低比特率，但再現(xiàn)的聲音品質(zhì)較低。因此，近年來對于分析合成型的聲音壓縮技術(shù)要求更高品質(zhì)的聲音再現(xiàn)。
例如，在電子通信學(xué)會論文誌、D-II、Vol.J87-D-II、No.8、pp.1565-1571、2004年8月，吉村貴克(Takayoshi YOSHIMURA)、德田惠一(KeiichiTOKUDA)、益子貴史(Takashi MASUKO)小林隆夫(Takao KOBAYASHI)、北村正(Tadashi KITAMURA)所著的《HMMに基づくテキスト音聲合成ヘの混合勵振源モデルとポストフィルタの導(dǎo)入(Incorporation of mixedexcitation model and postfilter into HMM-based text-to-speech synthesis)》中，記載有如下方案通過向基于HMM(Hidden Markov Model)的文本聲音合成系統(tǒng)導(dǎo)入混合激勵源模型，來實現(xiàn)聲音品質(zhì)的提高。
在該論文中，具體記載有為了合成同時具有周期成分和非周期成分的聲音例如濁擦音(voiced fricative)，而將頻率分割成多個帶域、按每個帶域判斷有聲無聲。
在該論文中記載的現(xiàn)有技術(shù)，通過對不同帶域處理殘差信號，在某種程度上提高由解碼裝置解碼的聲音信號的品質(zhì)。
但是，在殘差信號的現(xiàn)有的不同帶域的處理中，沒有考慮例如殘差信號強度的帶域依存性。
人類的實際的聲音中，當(dāng)在殘差信號中具有作為音調(diào)(pitch)的性質(zhì)的帶域為多個時，音調(diào)的強度一般按每個帶域而不同。當(dāng)在殘差信號中具有作為噪聲的性質(zhì)的帶域為多個時也同樣，殘差信號的強度一般按每個帶域而不同。
即，實際的聲音的激發(fā)信號不是相同強度的多個音調(diào)的疊加。此外，實際的聲音的激發(fā)信號也不是白噪聲(white noise)。
因此，在殘差信號的對不同帶域的處理中，沒有考慮殘差信號強度的帶域依存性會成為由解碼裝置解碼的聲音信號的品質(zhì)降低的原因。

發(fā)明內(nèi)容
本發(fā)明是鑒于上述實際情況而提出的發(fā)明，其目的在于提供對于聲音的編碼以及解碼可提高解碼的聲音信號的品質(zhì)的聲音編碼裝置、聲音解碼裝置、聲音編碼方法、聲音解碼方法、以及計算機可讀取的記錄媒體。
為了達成上升目的，本發(fā)明的第一方面的聲音編碼裝置包括預(yù)測分析部，其通過預(yù)測分析聲音信號，來獲得預(yù)測系數(shù)和殘差信號；不同帶域殘差信號生成部，其將所述殘差信號分割成每個帶域的不同帶域殘差信號；強度確定部，其按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及編碼部，其對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
另外，為了達成上述目的，本發(fā)明的第二方面的聲音解碼裝置包括接收部，其接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析而獲得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行了編碼而獲得的編碼不同帶域殘差信號強度；解碼部，其根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度，來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；聲源信號生成部，其按照每個所述帶域，來生成具有所述不同帶域殘差信號強度所表示的帶域依存性的不同帶域聲源信號；殘差信號復(fù)原部，其根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；和合成濾波器，其通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音。
為了達成上述目的，本發(fā)明第三方面的聲音編碼方法包括以下步驟預(yù)測分析步驟，通過預(yù)測分析聲音信號來獲得預(yù)測系數(shù)和殘差信號；不同帶域殘差信號生成步驟，將所述殘差信號分割成每個帶域的不同帶域殘差信號；強度確定步驟，按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及編碼步驟，對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
另外，為了達成上述目的，本發(fā)明的第四方面的聲音解碼方法包括以下步驟接收步驟，接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析所得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行編碼而獲得的編碼不同帶域殘差信號強度；解碼步驟，根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；聲源信號生成步驟，按照每個所述帶域生成具有所述不同帶域殘差信號強度所表示的帶域依存性的不同帶域聲源信號；殘差信號復(fù)原步驟，根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；以及合成步驟，通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音另外，為了達成上述目的，本發(fā)明第五方面的計算機可讀取記錄媒體記錄記錄了用于使計算機執(zhí)行以下步驟的程序預(yù)測分析步驟，通過預(yù)測分析聲音信號來獲得預(yù)測系數(shù)和殘差信號；不同帶域殘差信號生成步驟，將所述殘差信號分割成每個帶域的不同帶域殘差信號；強度確定步驟，按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及編碼步驟，對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
另外，為了達成上述目的，本發(fā)明第六方面的計算機可讀取記錄媒體，其記錄了用于使計算機執(zhí)行以下步驟的程序接收步驟，接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析所得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行編碼而獲得的編碼不同帶域殘差信號強度；解碼步驟，根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；聲源信號生成步驟，按照每個所述帶域生成具有所述不同帶域殘差信號所表示的帶域依存性的不同帶域聲源信號；殘差信號復(fù)原步驟，根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；以及合成步驟，通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音。
根據(jù)本發(fā)明，在聲音的編碼和解碼中，能夠提高所解碼的聲音信號的品質(zhì)。

圖1是本發(fā)明實施方式的聲音編碼裝置的功能結(jié)構(gòu)圖。
圖2是本發(fā)明實施方式的聲音解碼裝置的功能結(jié)構(gòu)圖。
圖3是本發(fā)明實施方式的聲音編碼兼聲音解碼裝置的物理結(jié)構(gòu)的示意圖。
圖4是表示基于MLSA的預(yù)測分析處理的流程圖。
圖5是表示線性預(yù)測分析處理的流程圖。
圖6是表示不同帶域殘差信號信息生成處理的流程圖。
圖7是表示不同帶域聲源生成處理的流程圖。
圖8是表示噪聲列生成處理的流程圖。
圖9是表示聲音信號復(fù)原處理的流程圖。
圖10是表示MLSA濾波器系數(shù)計算處理的一個例子的流程圖。
圖11A和圖11B是MLSA濾波器結(jié)構(gòu)的一個例子的示意圖。

具體實施例方式 以下，對本發(fā)明實施方式的聲音編碼裝置和聲音解碼裝置進行詳細說明。
圖1是本實施方式的聲音編碼裝置111的功能結(jié)構(gòu)圖。
聲音編碼裝置111，如圖1所示具有麥克風(fēng)121、A/D變換部123、預(yù)測分析部131、帶域濾波器部133、增益算出部135、有聲無聲判別以及音調(diào)提取部137、編碼部125、發(fā)送部127。
預(yù)測分析部131內(nèi)置有預(yù)測分析用逆濾波器算出器141。
帶域濾波器部133具有第一帶域濾波器151、第二帶域濾波器153、第三帶域濾波器155、以及第三帶域濾波器155以后的必需的帶域濾波器(圖中未示)。
增益算出部135具有第一增益算出器161、第二增益算出器163、以及第二增益算出器163以后的必需的增益算出器(圖中未示)。
有聲無聲判別以及音調(diào)提取部137具有第一有聲無聲判別以及音調(diào)提取器171、第二有聲無聲判別以及音調(diào)提取器173、和第二有聲無聲判別以及音調(diào)提取器173以后的必需的有聲無聲判別以及音調(diào)提取器(圖中未示)。
首先，向麥克風(fēng)121輸入聲音。麥克風(fēng)121將該聲音變換成模擬聲音信號。將該模擬聲音信號發(fā)送至A/D變換部123。A/D變換部123用于后面進行的分析以及編碼中的離散處理，將該模擬聲音信號變換成數(shù)字聲音信號。將該數(shù)字聲音信號發(fā)送至預(yù)測分析部131。
預(yù)測分析部131對由A/D變換部123所供給的數(shù)字聲音信號實施預(yù)測分析處理。在預(yù)測分析中例如使用基于MLSA(Mel Log Spectrum Approximation)的預(yù)測分析、或者線性預(yù)測分析。后面將使用圖4和圖5對兩種分析的步驟進行詳細的說明。
在預(yù)測分析中，粗略地對數(shù)字聲音信號進行時間分割，計算出時間分割后的各時間區(qū)間中的預(yù)測系數(shù)以及殘差信號。
對數(shù)字聲音信號進行時間分割的時間區(qū)間的長度例如優(yōu)選5ms。
以下，在預(yù)測分析部131中，將數(shù)字聲音信號暫時時間分割成M個時間區(qū)間。此外，設(shè)各時間區(qū)間所包含的數(shù)字聲音信號的數(shù)據(jù)(要素)個數(shù)為l(小寫的英文字母L)。此時，在整個數(shù)字聲音信號中含有N個(N＝l×M)數(shù)據(jù)。
預(yù)測分析部131將時間區(qū)間i(i為0≤i≤M-1的整數(shù))中的數(shù)字聲音信號Si＝{Si，0，Si，1，...，Si，l-1}變換成對應(yīng)于分析次數(shù)的預(yù)定個數(shù)的預(yù)測系數(shù)、以及殘差信號Di＝{di，0，di，1，...，di，l-1}。
更具體地，預(yù)測分析部131首先將所輸入的數(shù)字聲音信號進行時間分割、接下來，預(yù)測分析部131根據(jù)時間分割后的數(shù)字聲音信號Si計算出預(yù)測系數(shù)。接著，內(nèi)置于預(yù)測分析部131中的預(yù)測分析用逆濾波器算出部141根據(jù)該預(yù)測系數(shù)計算出預(yù)測分析用逆濾波器。然后，預(yù)測分析部131向該預(yù)測分析用逆濾波器輸入數(shù)字聲音信號Si，獲得來自預(yù)測分析用逆濾波器的輸出作為殘差信號Di。
將計算預(yù)測分析用逆濾波器的過程中所使用的預(yù)測系數(shù)從預(yù)測分析部131發(fā)送至編碼部125。
另一方面，殘差信號并不是從預(yù)測分析部131直接發(fā)送至編碼部125。這是由于當(dāng)將殘差信號直接送至編碼部125進行編碼時，信息量有可能過大。
因此，盡可能地僅提取殘差信號的本質(zhì)特征，由此，在預(yù)先減少信息量的基礎(chǔ)上，將殘差信號發(fā)送至編碼部125。
具體地，首先通過帶域濾波器部133將殘差信號Di分割成若干個帶域。當(dāng)殘差信號Di通過第一帶域濾波器151時，從殘差信號Di中提取出帶域1的頻率部分的信號。將由該第一帶域濾波器151提取出的信號稱為帶域1的殘差信號。同樣地，通過第二帶域濾波器153提取帶域2的殘差信號。此外，通過第三帶域濾波器155提取帶域3的殘差信號。帶域4以后的殘差信號也一樣，由帶域濾波器部133提取。
例如，將殘差信號Di分割成帶域1至6，優(yōu)選設(shè)帶域1為0～1kHz、設(shè)帶域2為1～2kHz、設(shè)帶域3為2～3kHz、設(shè)帶域4為3～5kHz、設(shè)帶域5為5～6.5kHz、設(shè)帶域6為6.5～8kHz。
由帶域濾波器部 133提取出的各帶域的殘差信號都被發(fā)送至增益算出部135和有聲無聲判別以及音調(diào)提取部137兩者中。
增益算出部135計算不同帶域的殘差信號的強度。將發(fā)送至增益算出部135的帶域1的殘差信號，輸入至增益算出部135中的第一增益算出器161。同樣地，將帶域2以后的殘差信號也分別輸入至第二增益算出器163以后的增益算出器。
這里，將用于識別帶域的變量記做ωRANGE。例如，由第一帶域濾波器151生成的信號是ωRANGE＝1的帶域的殘差信號。此外，由第二帶域濾波器153生成的信號是ωRANGE＝2的帶域的殘差信號。
然后，將時間分區(qū)i中的帶域ωRANGE的殘差信號記做D(ωRANGE)i＝{d(ωRANGE)i，0，d(ωRANGE)i，1，...d(ωRANGE)i，l-1}。
第一增益算出器161或第二增益算出器163等第ωRANGE增益算出器根據(jù)所輸入的D(ωRANGE)i算出時間分區(qū)i中的帶域ωRANGE的增益即G(ωRANGE)i。
增益G(ωRANGE)i表示殘差信號Di的帶域ωRANGE成分的強度(不同帶域殘差信號強度)。換言之，增益G(ωRANGE)i表示帶域ωRANGE中的殘差信號強度的帶域依存性。對于聲音，一般地如果帶域不同、則帶域內(nèi)的成分的強度也不同。在后述的圖2的聲音解碼裝置211合成聲音信號時使用G(ωRANGE)i。具體地，聲音解碼裝置211使用G(ωRANGE)i來合成反映了每個帶域的強度不同的聲音信號進行再生。這樣，聲音編碼裝置111按照每個帶域求出殘差信號Di的增益，由此，例如相比于殘差信號Di的增益為不依賴于帶域的固定值而進行處理的情況，聲音解碼裝置211可以再現(xiàn)高品質(zhì)的聲音信號。
可考慮多種方法作為計算增益G(ωRANGE)i的方法。例如，也可以通過FFT(Fast Fourier Transform)等技術(shù)方法對殘差信號Di進行傅立葉變換，將帶域ωRANGE的峰值或者平均值作為增益G(ωRANGE)i。
但是，本實施方式的聲音編碼裝置111中，通過帶域濾波器部133，將帶域ωRANGE的殘差信號D(ωRANGE)i作為由一個數(shù)值構(gòu)成的數(shù)值列{d(ωRANGE)i，0，d(ωRANGE)i，1，...d(ωRANGE)i，l-1}算出。由此，可以不必另外重新進行FFT等計算。使用該數(shù)值列，優(yōu)選例如 G(ωRANGE)i ＝10×log10[Avg{D(ωRANGE)i2}]、 Avg{D(ωRANGE)i2} ＝{d(ωRANGE)i，02+d(ωRANGE)i，12+...+d(ωRANGE)i，l-12}/1 來計算增益G(ωRANGE)i。即，取表示時間區(qū)間i中的帶域ωRANGE的殘差信號D(ωRANGE)i的數(shù)值列的平方平均值，并且將取對數(shù)而獲得的值作為增益G(ωRANGE)i。
取平方平均值是為了能夠不依賴于數(shù)值列{d(ωRANGE)i，0，d(ωRANGE)i，1，...d(ωRANGE)i，l-1}的各個數(shù)值的正負地求得信號強度的程度。此外，取對數(shù)是因為考慮了聲音大小與人類聽覺靈敏度之間的關(guān)系。
將這樣計算出的增益G(ωRANGE)i發(fā)送至編碼部125。
如上所述，由帶域濾波器部133提取的各帶域的殘差信號除了被發(fā)送至增益算出部135之外還被發(fā)送至有聲無聲判別以及音調(diào)提取部137。
發(fā)送至第一有聲無聲判別以及音調(diào)提取部137的帶域1的殘差信號，被輸入至有聲無聲判別以及音調(diào)提取部137中的、第一有聲無聲判別以及音調(diào)提取器171。同樣地，對于帶域2以后的殘差信號也被分別輸入至第二有聲無聲判別以及音調(diào)提取器173以后的有聲無聲判別以及音調(diào)提取器。
下面參照圖6詳細地說明第一有聲無聲判別以及音調(diào)提取器171或第二有聲無聲判別以及音調(diào)提取器173等第ωRANGE有聲無聲判別以及音調(diào)提取器進行的處理。綜述結(jié)論，第ωRANGE有聲無聲判別以及音調(diào)提取器判別帶域ωRANGE的殘差信號D(ωRANGE)i是有聲音還是無聲音，并將其判別結(jié)果發(fā)送至編碼部125。此外，第ωRANGE有聲無聲判別以及音調(diào)提取器在該判別結(jié)果為有聲音時，除了將該判別結(jié)果發(fā)送至編碼部125外，還將音調(diào)頻率(pitch frequency)值發(fā)送至編碼部125。
這樣，從預(yù)測分析部131向編碼部125發(fā)送預(yù)測系數(shù)、從增益算出部135向編碼部125發(fā)送各帶域的增益、從有聲無聲判別以及音調(diào)提取部137向編碼部125發(fā)送各帶域的有聲無聲的判別結(jié)果以及判別為有聲的各帶域的音調(diào)頻率。
其結(jié)果是，從殘差信號中提取出不同帶域的增益、不同帶域的有聲無聲判別結(jié)果、判別為有聲的不同帶域的音調(diào)頻率，并發(fā)送至編碼部125。考慮聲音信號的性質(zhì)，這些提取出的信息雖然信息量較少，但是是在本質(zhì)上帶有殘差信號性質(zhì)的特征的信息。以下，概括從殘差信號提取出的、不同帶域的增益、不同帶域的有聲無聲的判別結(jié)果、判別為有聲的不同帶域的音調(diào)頻率，統(tǒng)稱為不同帶域殘差信號信息。
這樣，通過僅將本質(zhì)上帶有殘差信號性質(zhì)的特征的少量的信息發(fā)送到編碼部125，與將殘差信號整體全部地發(fā)送到編碼部125相比，能夠減少由編碼部125進行編碼的信息量。因此，本實施方式的聲音編碼裝置111能夠?qū)⒙曇魤嚎s到以低比特率技術(shù)為前提的程度。
另一方面，作為按照每個帶域變化的信息的增益、有聲無聲的判別結(jié)果以及音調(diào)頻率對在圖2中的聲音解碼裝置211中的聲音的再生有幫助。因此，在與不從殘差信號Di中提取每個帶域的特征的情況相比，在聲音解碼裝置211中再生的聲音的品質(zhì)得以提高。
編碼部125接收預(yù)測系數(shù)、和表示上述的殘差信號的不同帶域的特征的不同帶域殘差信號信息，并對它們進行編碼。然后，編碼后的預(yù)測系數(shù)和編碼后的不同帶域殘差信號信息被發(fā)送至發(fā)送部127。下文中將編碼后的預(yù)測系數(shù)稱為編碼預(yù)測系數(shù)。另外，將編碼后的不同帶域殘差信號信息稱為編碼不同帶域殘差信號信息。
另外，對預(yù)測系數(shù)進行編碼的編碼部和對不同帶域殘差信號信息進行編碼的編碼部也可以彼此獨立地設(shè)置。在這樣的情況下，編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息分別從各自的編碼部發(fā)送至發(fā)送部127。
編碼部125使用任意的現(xiàn)有的編碼方法來對信息進行編碼。編碼方法已知有多種方法，信息的壓縮率也是多種多樣。另外，即使是相同的編碼方法，但根據(jù)成為編碼對象的信號性質(zhì)的不同，壓縮率可以變化。在本實施方式的聲音編碼裝置111中，優(yōu)選采用能夠?qū)㈩A(yù)測系數(shù)和不同帶域殘差信號信息最大限度地壓縮的編碼方法。但是，這里適用于任何的編碼方法都沒有問題。
不過，為了使圖1中的聲音編碼裝置111依次發(fā)送各時間區(qū)間中的信息、使圖2中的聲音解碼裝置從該信息大致實時地再生聲音，優(yōu)選預(yù)計容易使用壓縮后的信號量、且該信號量在任何時間區(qū)間都為相同程度的編碼方法。之所以這樣，是因為考慮到裝置的性能方面的制約事項，聲音分析處理及其后的發(fā)送處理、接收處理及其后的聲音合成處理設(shè)計容易。
圖1中的發(fā)送部127從編碼部125收到編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息，并發(fā)送至圖2中的聲音解碼裝置211。發(fā)送方法在本實施方式中為無線通信。另外，發(fā)送方法可以是有線、有線和無線并用等各種各樣的通信方法。
圖2是本實施方式的聲音解碼裝置211的功能結(jié)構(gòu)圖。聲音解碼裝置211使不同帶域的殘差信號的強度反映在復(fù)原的聲音信號中。
如圖2所示，聲音編碼裝置211具備接收部221、解碼部223、不同帶域聲源生成部231、合成用逆濾波器算出部235、殘差信號復(fù)原部233、合成用逆濾波器部225、D/A變換部227、以及揚聲器部229。
不同帶域聲音生成部231具有第一聲源生成器241、第二聲源生成器243、和第二聲源生成器243以后的需要的聲源生成器(圖中未示)。
接收部221從圖1中的聲音編碼裝置111的發(fā)送部127通過無線通信接收編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息，并將它們提供給解碼部223。
解碼部223對從接收部221供給的編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息進行解碼，并生成各時間分區(qū)中的預(yù)測系數(shù)和不同帶域殘差信號信息。具體來講，解碼部223按照每個時間分區(qū)生成預(yù)測系數(shù)、殘差信號的每個帶域的增益、殘差信號的每個帶域的有聲無聲判別結(jié)果、以及判別為有聲的每個帶域的音調(diào)頻率。
經(jīng)解碼的不同帶域殘差信號信息被發(fā)送至不同帶域聲源生成部231。此時，增益的信息和有聲無聲的判別關(guān)聯(lián)信息(有聲無聲的判別結(jié)果和有聲時的音調(diào)頻率)這兩種信息被按照每個帶域匯集起來。
即，帶域1的增益和帶域1的有聲無聲的判別關(guān)聯(lián)信息被匯集并輸入到第一聲源生成器241中，帶域2的增益和帶域2的有聲無聲的判別關(guān)聯(lián)信息被匯集并輸入到第二聲源生成器243中。帶域3以后的信息也進行同樣的處理。
第一聲源生成器241生成帶域1的脈沖列或者噪聲列，并將它們發(fā)送殘差信號復(fù)原部233。第二聲源生成部243生成帶域2的脈沖列或者噪聲列，并將它們發(fā)送至殘差信號復(fù)原部233。第三聲源生成器以后的聲源生成器也是同樣的。
即，不同帶域聲源生成部231生成作為各帶域的聲源信號的脈沖列或者噪聲列，并將它們發(fā)送至殘差信號復(fù)原部233。生成各帶域的脈沖列或者噪聲列的步驟在后文中參照圖7和圖8進行詳細說明。簡而言之，情況如下。例如，第一聲源生成器241在收到表示帶域1的殘差信號為有聲音的判別結(jié)果和音調(diào)頻率時，生成具有該音調(diào)頻率的大小為帶域1的增益的脈沖列。另一方面，第一聲源生成器241在收到表示帶域1的殘差信號為無聲音的判別結(jié)果時，從預(yù)先準(zhǔn)備的具有隨機的時間間隔的大小1的脈沖列中提取帶域1的成分，并將其乘以帶域1的增益生成噪聲列。
這樣，不同帶域聲源生成部231按照每個帶域生成具有不同帶域的增益所表示的帶域依存性的聲源信號即脈沖列或者噪聲列。
殘差信號復(fù)原部233是將從不同帶域生成部231供給的各帶域的脈沖列或者噪聲列全部疊加起來的加法器。聲音解碼裝置211進行的不同帶域殘差信號信息的處理與圖1中的聲音編碼裝置111進行的殘差信號的處理大致相反。因此，通過將不同帶域聲源生成部231所生成的脈沖列或者噪聲列疊加起來，可復(fù)原殘差信號。
但是，如前所述，從圖1中的聲音編碼裝置111發(fā)送至圖2中的聲音解碼裝置211的不同帶域殘差信號信息是捕捉了殘差信號Di的本質(zhì)特征的信息，而不是殘差信號Di本身。這樣，在發(fā)送側(cè)的聲音編碼裝置111中有刪除的信息，因此殘差信號復(fù)原部233不能夠?qū)⒃瓉淼臍埐钚盘朌i完全復(fù)原。即，嚴格來講，殘差信號復(fù)原部233不是將殘差信號Di完全復(fù)原，而是最大限度地利用所得的信息，生成接近殘差信號Di的信號。即，可以說殘差信號復(fù)原部233不是復(fù)原殘差信號Di＝{di，0，di，1，...，di，l-1}，而是生成疑似殘差信號D′i＝{d′i，0，d′i，1，...，d′i，l-1}。不過，如前所述，由圖1中的聲音編碼裝置111提取的聲音的本質(zhì)特征被傳遞至圖2中的聲音編碼裝置211，根據(jù)該特征來生成疑似殘差信號D′i。因此，疑似殘差信號D′i與殘差信號Di近似，其適合用作聲音再生用的激發(fā)信號(激發(fā)用的信號)。
另外，如前所述，殘差信號的激發(fā)信號不過是從不同的視角來看待相同的信號。
另一方面，由解碼部223解碼的預(yù)測系數(shù)被發(fā)送至合成用逆濾波器算出部235。合成用逆濾波器算出部235使用預(yù)測系數(shù)來算出聲音合成用的逆濾波器。該逆濾波器的算出可以使用已知的任意方法。所謂聲音合成用的逆濾波器是具有通過將激發(fā)信號輸入到該濾波器來合成聲音信號的性質(zhì)的濾波器。
合成用逆濾波器算出部235的逆濾波器的算出結(jié)果被發(fā)送至合成用逆濾波器部225。合成用逆濾波器225按照收到的逆濾波器的算出結(jié)果來確定聲音合成用的逆濾波器的規(guī)格。另外，也可以考慮通過合成用逆濾波器算出部235來生成合成用逆濾波器部225。
通過將疑似殘差信號D′i作為激發(fā)信號輸入到該合成用逆濾波器部225中，來復(fù)原數(shù)字聲音信號。對于以上的聲音信號的復(fù)原的步驟在后文中參照圖9來進行詳細說明。
另外，聲音解碼裝置211將與預(yù)測系數(shù)有關(guān)的信息全部接收。因此，若不考慮編碼和解碼的過程中可產(chǎn)生的信息量減少，合成用逆濾波器部225能夠完全復(fù)原原來的逆濾波器。另一方面，作為激發(fā)信號輸入到合成用逆濾波器部225的信號如前所述為疑似的殘差信號D′i。因此，合成用逆濾波器部225經(jīng)過逆濾波器合成的數(shù)字聲音信號并不是忠實地再現(xiàn)原來的聲音信號Si的信號。
但是，根據(jù)聲音信號的性質(zhì)提取的、表示殘差信號的本質(zhì)特征的信息被傳遞至聲音解碼裝置211。并且，使用該信息來進行疑似殘差信號的生成。所以，將該疑似殘差信號作為激發(fā)信號輸入到合成用逆濾波器部225的結(jié)果為，從合成用逆濾波器部225獲得的輸出是與原來的聲音信號Si接近的信號。
從合成用逆濾波器部225輸出的再生信號通過D/A變換部227變換成模擬聲音信號，并傳遞至揚聲器229。揚聲器229按照所收到的模擬聲音信號來發(fā)出聲音。
從聲音編碼裝置傳遞到聲音解碼裝置的信息，該信息量較少，擔(dān)心對作為發(fā)送對象的信號的性質(zhì)是不充分的信息，因而無法充分提高再生聲音的品質(zhì)。本實施方式的聲音編碼裝置111和聲音解碼裝置211，是這樣想出的裝置即使在從聲音編碼裝置11 1傳遞到聲音解碼裝置211的信息量受到限制的狀況下，也能能夠盡可能地再生高品質(zhì)的聲音。因此，本發(fā)明的發(fā)明人對如何能夠在盡量減少傳遞的信息量的同時在所傳遞的信息中充分保持聲音信號的特征進行了考察。其結(jié)果為，本發(fā)明的發(fā)明人著眼于作為發(fā)送對象的信號為聲音信號這一情況，在根據(jù)聲音信號的性質(zhì)的基礎(chǔ)上，將預(yù)測分析所得的殘差信號的每個帶域的性質(zhì)的差反映到聲音再生中。具體來講，在聲音信號的發(fā)送側(cè)的裝置提取殘差信號的每個帶域的強度，在聲音信號的接收側(cè)的裝置將殘差信號的每個帶域的強度反映到聲音再生中。殘差信號的每個帶域的性質(zhì)由于能夠以略微的信息量來表示，因此使得再生聲音的品質(zhì)大幅度上升。
參照圖1和圖2所說明過的聲音編碼裝置111和聲音解碼裝置211，在物理上，通過為使用便利而統(tǒng)合了兩裝置的功能的、圖3所示的聲音編碼兼解碼裝置311來實現(xiàn)。即，聲音編碼兼解碼裝置311與聲音編碼裝置一樣，能夠?qū)柠溈孙L(fēng)輸入的聲音信號進行編碼，并發(fā)送編碼數(shù)據(jù)。另外，聲音編碼兼解碼裝置311與聲音解碼裝置211一樣，能夠接收編碼數(shù)據(jù)并進行解碼，并將經(jīng)解碼的聲音信號從揚聲器輸出。作為聲音編碼兼解碼裝置311例如可以假定便攜電話。
如圖3所示，聲音編碼兼解碼裝置311具有圖1所示的麥克風(fēng)121和圖2所示的揚聲器229。
聲音編碼兼解碼裝置311還具有天線321、操作鍵323、無線通信部331、聲音處理部333、電源部335、輸入部337、CPU341、ROM(Read Only Memory只讀存儲器)343、和存儲部345。無線通信部331、聲音處理部333、電源部335、輸入部337、CPU341、ROM343、和存儲部345通過系統(tǒng)339相互連接。系統(tǒng)總線339是用于傳送命令和數(shù)據(jù)的傳送路徑。
在ROM343中保存有用于對聲音進行編碼和解碼的動作程序。
另外，圖1的預(yù)測分析部131、帶域濾波器部133、增益算出部135、有聲無聲判別以及音調(diào)提取部137、以及編碼部125的各功能通過CPU341進行的數(shù)值處理來實現(xiàn)。另外，圖2的解碼部223、不同帶域聲源生成部231、殘差信號復(fù)原部233、合成用逆濾波器算出部235、合成用濾波器部225的各功能通過CPU341進行的數(shù)值處理來實現(xiàn)。另外，圖1的A/D變換部123和圖2的D/A變換部227包含在聲音處理部333中。而且，圖1中的發(fā)送部127和圖2中的接收部211包含在無線通信部331中。
因此，在保存在ROM343中的動作程序中包含由于由CPU341進行上述數(shù)值處理的程序。
在ROM343中，除了動作程序之外，還保存聲音編碼兼解碼裝置311的整體控制所需要的操作系統(tǒng)。
CPU341通過執(zhí)行保存在ROM343中的動作程序和操作系統(tǒng)來對聲音進行編碼或者解碼。
這樣，CPU341按照保存在ROM343中的動作程序來進行數(shù)值運算。存儲部345保存作為處理對象的數(shù)值列、例如數(shù)字聲音信號Si，或保存作為處理結(jié)果的數(shù)值列、例如殘差信號Di。
存儲部345由RAM(Random Access Memory)351、硬盤裝置353、閃存355中的一個或者多個構(gòu)成。存儲部345具體來講存儲數(shù)字聲音信號、預(yù)測喜好、殘差信號、每個帶域的殘差信號、每個帶域的增益、每個帶域的有聲無聲的判別結(jié)果、判別為有聲音的每個帶域的音調(diào)頻率、編碼預(yù)測系數(shù)、編碼不同帶域殘差信號信息、按照每個帶域生成的脈沖列或者噪聲列、逆濾波器的算出結(jié)果以及疑似殘差信號等。
CPU341內(nèi)置寄存器(圖中未示)。CPU341按照從ROM343中讀出的動作程序，將作為處理對象的數(shù)值列適當(dāng)?shù)貜拇鎯Σ?45載入到寄存器中。CPU341對載入在寄存器中的數(shù)值列實施預(yù)定的運算處理，并將該處理結(jié)果的數(shù)值列保存在存儲部345中。
存儲部345所具有的RAM351和硬盤裝置353酌量各自的訪問速度和存儲容量，分擔(dān)作為處理對象的數(shù)值列，或者同時進行存儲。閃存355是可移動媒體。在閃存355中，根據(jù)需要復(fù)制有保存在RAM351或者硬盤裝置353中的數(shù)據(jù)。將存儲有所復(fù)制的數(shù)據(jù)的閃存355從聲音編碼兼解碼裝置311拔出，用于例如個人電腦等其他裝置對該數(shù)據(jù)的利用。
在聲音編碼兼解碼裝置311作為聲音編碼裝置111(圖1)發(fā)揮功能時，無線通信部331和聲音處理部333如下所述地發(fā)揮功能。首先，輸入到麥克風(fēng)121中的聲音通過聲音處理部333所具有的A/D變換部123(圖1)變換為數(shù)字信號。通過由CPU341、RAM343和存儲部345實現(xiàn)的圖1所示的聲音編碼裝置111的功能，數(shù)字聲音信號被編碼。并且，無線通信部331所具有的發(fā)送部127(圖1)使用天線321向?qū)Ψ?成為接收側(cè)的別的聲音編碼兼解碼裝置311)發(fā)送編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息。
另一方面，在聲音編碼兼解碼裝置311作為聲音解碼裝置211(圖2)發(fā)揮功能的情況下，無線通信部331和聲音處理部333如下所述地發(fā)揮功能。首先，無線通信部331所具有的接收部221(圖2)，使用天線321接收編碼預(yù)測系數(shù)和編碼不同帶域殘差信號信息。通過由CPU34、ROM343和存儲部345實現(xiàn)的圖2所示的聲音解碼裝置211的功能，接收到的編碼數(shù)據(jù)被解碼為數(shù)字聲音信號。數(shù)字聲音信號通過聲音處理部333所具有的D/A變換部227(圖2)變換為模擬聲音信號，并從揚聲器229作為聲音輸出。
輸入部337接收來自操作鍵323的操作信號，并將與操作信號對應(yīng)的鍵盤編碼器(key code)信號輸入到CPU341中。CPU341根據(jù)所輸入的鍵盤編碼器信號來確定操作內(nèi)容。
例如，將聲音分割成幾個帶域、或使各帶域?qū)挾葹槎鄬掃@樣的信息在ROM343中預(yù)先設(shè)定。但是，在用戶希望的情況下，使用操作鍵323和輸入部337，用戶自身能夠變更該設(shè)定。具體來講，使用操作鍵323，用戶能夠輸入頻率的數(shù)值等進行設(shè)定的變更。用戶還能夠使用操作鍵323來輸入例如電源接通/斷開等的預(yù)定的操作指令。
電源部335是用于驅(qū)動聲音編碼兼解碼裝置311的電源。
基于MLSA的預(yù)測分析處理下面，參照圖4所示的流程圖來說明作為圖1的預(yù)測分析部131所進行的預(yù)測分析的一例的、基于MLSA的預(yù)測分析。另外，如前所述，預(yù)測分析部131的功能通過CPU341(圖3)來實現(xiàn)。
這里，在預(yù)測分析處理開始之前，使在存儲部345(圖3)中保存有作為表示聲音的輸入波形的數(shù)字聲音信號的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}(i為0≤i≤M-1的整數(shù))。
CPU341將內(nèi)置的計數(shù)寄存器(counter register，圖中未示)作為用于對值i進行計數(shù)的輸入信號采樣計數(shù)器。當(dāng)開始預(yù)測分析處理時，CPU341使輸入信號采樣計數(shù)器的值i為i＝0來作為初始值(圖4中的步驟S411)。
CPU341從存儲部345將與輸入信號采樣計數(shù)器的值i對應(yīng)的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}從存儲部345載入到內(nèi)置的通用寄存器(圖中未示)中(步驟S413)。例如，在輸入信號采樣計數(shù)器設(shè)定為i＝0的情況下，載入輸入信號采樣S0＝{s0，0，s0，1，...，s0，l-1}。
下面，CPU341根據(jù)所載入的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}來計算倒譜(cepstrum)Ci＝{ci，0，ci，1，...，ci，l/2-1}(步驟S415)。在求倒譜時，可以使用任意的已知手法。在求倒譜時，大體上進行離散傅立葉變換、取絕對值、取對數(shù)、進行傅立葉逆變換這些手法是必須的。
接著，CPU341根據(jù)所求出的倒譜Ci＝{ci，0，ci，1，...，ci，l/2-1來計算MLS濾波器系數(shù)Mi＝{mi，0，mi，1，...mi，p-1}(步驟S417)。另外，p是基于MLSA的預(yù)測分析的次數(shù)。另外，求MLSA濾波器系數(shù)可以使用任意的已知手法。
然后，CPU341將MLSA濾波器系數(shù)Mi＝{mi，0，mi，1，...，mi，p-1}作為預(yù)測系數(shù)保存到存儲部345中(步驟S419)。
而且，CPU341根據(jù)MLSA濾波器系數(shù)Mi＝{mi，0，mi，1，...，mi，p-1}來計算預(yù)測分析用逆MLSA濾波器AIMi(步驟S421)。另外，步驟S421的處理可以說由圖1所示的預(yù)測分析用逆濾波器算出器141進行。另外，求預(yù)測分析用逆MLSA濾波器可以使用任意的已知手法。
CPU341通過使輸入信號采樣Si＝{si，0，si，1，...，si，l-1}通過所求出的預(yù)測分析用逆MLSA濾波器AIMi，來計算殘差信號Di＝{di，0，di，1，...，di，l-1}(步驟S423)。CPU341將所求出的殘差信號Di保存倒存儲部345中(步驟S425)。
通過以上的步驟S413～S425的處理，例如，在輸入信號采樣計數(shù)器設(shè)定為i＝0的情況下，將MLSA濾波器系數(shù)M0＝{m0，0，m0，1，...，m0，p-1}和殘差信號D0＝{d0，0，d0，1，...，d0，l-1}保存在保存部345中。
這里，CPU341判別輸入信號采樣計數(shù)器的值i是否達到M-1(步驟S427)。如果i≥M-1(步驟S427為Yes)，CPU341結(jié)束基于MLSA的預(yù)測分析處理。另一方面，如果i＜M-1(在步驟S427中為No)，則CPU341為了處理下一時間區(qū)間的輸入信號采樣，而將i增加1(步驟S429)，重復(fù)進行步驟S423～S427的處理。
線形預(yù)測分析處理下面，參照圖5所示的流程圖，對作為圖1的預(yù)測分析部131進行的預(yù)測分析的一例的線形預(yù)測分析進行說明。另外，如前所述，預(yù)測分析部131的功能通過CPU341(圖3)來實現(xiàn)。
這里，在開始預(yù)測分析處理之前，使在存儲部345(圖3)中保存有作為表示聲音的輸入波形的數(shù)字聲音信號的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}(i為0≤i≤M-1的整數(shù))。
CPU341將內(nèi)置的計數(shù)寄存器(圖中未示)作為用于對值i進行計數(shù)的輸入信號采樣計數(shù)器。當(dāng)開始預(yù)測分析處理時，CPU341使輸入信號采樣計數(shù)器的值i為i＝0來作為初始值(圖5中的步驟S511)。
CPU341從存儲部345將與輸入信號采樣計數(shù)器的值i對應(yīng)的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}從存儲部345載入到內(nèi)置的通用寄存器(圖中未示)中(步驟S513)。例如，在輸入信號采樣計數(shù)器設(shè)定為i＝0的情況下，載入輸入信號采樣S0＝{s0，0，s0，1，...，s0，l-1}。
下面，CPU341根據(jù)所載入的輸入信號采樣Si＝{si，0，si，1，...，si，l-1}來計算線形預(yù)測系數(shù)Ai＝{ai，1，ai，2，...，ai，n}(步驟S515)。另外，n為線形預(yù)測分析的次數(shù)。作為線形預(yù)測系數(shù)的計算方法，只要是評價為殘差信號是基于預(yù)定尺寸而足夠小的計算方法，則可以使用任意的已知手法。例如，最好采用廣為公知的、組合了自身相關(guān)函數(shù)的計算和萊文森·德賓(levinson·Durbin)算法的計算方法。
接著，CPU341將線形預(yù)測系數(shù)Ai＝{ai，1，ai，2，...，ai，n}作為預(yù)測系數(shù)保存到存儲部345中(步驟S517)。
而且，CPU341根據(jù)線形預(yù)測系數(shù)Ai＝{ai，1，ai，2，...，ai，n}來計算預(yù)測分析用逆線形預(yù)測濾波器AIAi(步驟S519)。另外，步驟S519的處理可以說由圖1所示的預(yù)測分析用逆濾波器算出器141進行。另外，求預(yù)測分析用逆線形預(yù)測濾波器可以使用任意的已知手法。
CPU341通過使輸入信號采樣Si＝{si，0，si，1，...，si，l-1}通過所求出的預(yù)測分析用逆線形預(yù)測濾波器AIAi，來計算殘差信號Di＝{di，0，di，1，...，di，l-1}(步驟S521)。CPU341將所求出的殘差信號Di保存倒存儲部345中(步驟S523)。
通過以上的步驟S513～S523的處理，例如，在輸入信號采樣計數(shù)器設(shè)定為i＝0的情況下，將線形預(yù)測系數(shù)數(shù)A0＝{a0，1，a0，2，...，a0，n}和殘差信號D0＝{d0，0，d0，1，...，d0，l-1}保存在保存部345中。
這里，CPU341判別輸入信號采樣計數(shù)器的值i是否達到M-1(步驟S525)。如果i≥M-1(步驟S525為Yes)，CPU341結(jié)束線形預(yù)測分析處理。另一方面，如果i＜M-1(在步驟S525中為No)，則CPU341為了處理下一時間區(qū)間的輸入信號采樣，而將i增加1(步驟S527)，反復(fù)進行步驟S513～S525的處理。
不同帶域殘差信號信息生成處理下面，參照圖6所示的流程圖，對作為圖1的增益算出部135以及有聲無聲判別以及音調(diào)提取部137進行的不同帶域殘差信號信息生成處理進行說明。另外，如前所述，增益算出部135以及有聲無聲判別以及音調(diào)提取部137的功能通過CPU341(圖3)來實現(xiàn)。
這里，對時間分區(qū)i的不同帶域殘差信號信息生成處理進行說明。
另外，通過將殘差信號Di輸入到帶域濾波器部133(圖1)中而生成的不同帶域的殘差信號D(ωRANGE)已經(jīng)保存在存儲部345(圖3)中。
CPU341將內(nèi)置的計數(shù)寄存器(圖中未示)用于保存帶域識別變量ωRANGE。當(dāng)開始不同帶域殘差信號信息生成處理時，CPU341使帶域識別變量ωRANGE為ωRANGE＝1來作為初始值(圖6中的步驟S611)。
CPU341從存儲部345將帶域ωRANGE的殘差信號D(ωRANGE)i＝{d(ωRANGE)i，0，d(ωRANGE)i，1，...，d(ωRANGE)i，l-1}從存儲部345載入到內(nèi)置的通用寄存器(圖中未示)中(步驟S613)。例如，在設(shè)定為ωRANGE＝1的情況下，載入帶域1的殘差信號D(1)i＝{d(1)i，0，d(1)i，1，...，d(1)i，l-1}。
接下來，CPU341根據(jù)所載入的殘差信號D(ωRANGE)i來算出增益G(ωRANGE)i(步驟S615)。增益G(ωRANGE)I的算出方法如前所述， G(ωRANGE)i ＝10×log10[Avg{D(ωRANGE)i2}]、 Avg{D(ωRANGE)i2} ＝{d(ωRANGE)i，02+d(ωRANGE)i，12+…d(ωRANGE)i，l-12}/1 CPU341將所算出的增益G(ωRANGE)i保存到存儲部345中(步驟S617)。
接下來，CPU 341判別殘差信號D(ωRANGE)i是否為有聲音(步驟S619)。
是否為有聲音換言之為殘差信號D(ωRANGE)i是否具有作為音調(diào)的性質(zhì)。如果殘差信號D(ωRANGE)i具有周期性，則可以說殘差信號D(ωRANGE)i具有作為音調(diào)的性質(zhì)。因此，要調(diào)查殘差信號D(ωRANGE)i是否具有周期性。
要調(diào)查是否具有周期性，可以使用任意的已知手法。例如，優(yōu)選根據(jù)殘差信號求出標(biāo)準(zhǔn)化了的自身相關(guān)函數(shù)，來調(diào)查在該函數(shù)中是否存在足夠大小的極大值。如果存在該極大值，則可以說殘差信號存在周期性。另外，可以說帶來該極大的時間間隔是殘差信號的周期。另一方面，如果不存在該極大值，則可以說殘差信號不具有周期。
殘差信號D(ωRANGE)i的自身相關(guān)函數(shù)C(t)為 C(t)＝d(ωRANGE)i，0×d(ωRANGE)i，t +d(ωRANGE)i，1×d(ωRANGE)i，t+1 +... +d(ωRANGE)i，l-1-t×d(ωRANGE)i，l-1。此外，設(shè)殘差信號D(ωRANGE)i中含有的要素數(shù)為單位。即，變量t取從0倒(l-1)的整數(shù)值。因此，嚴格來講，時間為將對殘差信號D(ωRANGE)i中包含的各要素進行采樣的時間間隔乘以t而得到的值。因此，為了求出音調(diào)頻率，需要將t變換成時間。此外，由于在本實施方式中由于對在殘差信號D(ωRANGE)i中包含的各要素進行采樣的時間間隔為固定，所以時間與t成比例。
通過使用該自身相關(guān)函數(shù)C(t)，可以在原理上了解是否存在極大值。但是，需要將為計算數(shù)值而可能不常發(fā)生的、偶然產(chǎn)生的極大值除外。因此，根據(jù)超過預(yù)定閾值Cth的極大值的存在，推定周期性的存在。但是，C(t)從上式可知，與殘差信號D(ωRANGE)i的各要素大小的次序(order)的乘積成比例。因此，自身相關(guān)函數(shù)C(t)隨著殘差信號D(ωRANGE)i的各要素值變大而變大。于是，閾值Cth必需與殘差信號D(ωRANGE)i的大小相符地適當(dāng)變更。因此，閾值Cth設(shè)為常量，對自身相關(guān)函數(shù)C(t)進行標(biāo)準(zhǔn)化。
如果自身相關(guān)函數(shù)C(t)的大小不依賴于殘差信號D(ωRANGE)i的大小，則自身相關(guān)函數(shù)C(t)的標(biāo)準(zhǔn)化的方法，可以為任意的方法。例如，優(yōu)選將標(biāo)準(zhǔn)化因子REG(t)和標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)定義為 REG(t)＝[{d(ωRANGE)i，02+d(ωRANGE)i，12+…+d(ωRANGE)i，l-1-t2}×{d(ωRANGE)i，t2+d(ωRANGE)i，t+12+...+d(ωRANGE)i，l-12}]0.5 CREG(t)＝C(t)/REG(t)。
閾值Cth只要是對于判別是否在標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)中明確存在極大值有效的數(shù)值，可以為任意值。由于CREG(t＝0)始終為1，所以優(yōu)選例如使閾值Cth為相當(dāng)于1一半的0.5。
其結(jié)果是，在步驟S619中，CPU341根據(jù)殘差信號D(ωRANGE)i計算標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)，判別在標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)中是否存在成為CREG(t＝tMAX)＞Cth(＝0.5)的極大值CREG(t＝tMAX)。
當(dāng)在標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)中存在極大值時，即殘差信號D(ωRANGE)i具有作為有聲音的性質(zhì)時(步驟S619；Yes)，CPU341將表示有聲無聲的函數(shù)即聲無聲判別函數(shù)FlagVorUV(ωRANGE)i設(shè)定為FlagVorUV(ωRANGE)i＝”V”，并存儲在存儲部345中(步驟S621)。并且，CPU341通過取標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)的極大值時的t的值即tMAX的倒數(shù)，來計算音調(diào)頻率Pitch(ωRANGE)i(步驟S623)。CPU341將計算出的音調(diào)頻率Pitch(ωRANGE)i存儲在存儲部345中(步驟S6225)，并使處理進入到步驟S629。
當(dāng)標(biāo)準(zhǔn)化自身相關(guān)函數(shù)CREG(t)中不存在成為CREG(t)＞Cth(＝0.5)的極大值時(步驟S619；No)，CPU341將有聲無聲判別函數(shù)FlagVorUV(ωRANGE)i設(shè)定為FlagVorUV(ωRANGE)i＝”UV”，并存儲在存儲部345中(步驟S627)，使處理進入到步驟S629中。
通過以上的步驟S613～S627的處理，例如在設(shè)定成ωRANGE＝1時，將帶域l的增益G(l)i以及帶域l的有聲無聲判別函數(shù)FlagVorUV(l)i存儲在存儲部345中。并且，當(dāng)FlagVorUV(l)i＝”V”時，將帶域l的音調(diào)頻率Pitch(l)i存儲在存儲部345中。
在步驟S629中，CPU341判別是否對所有帶域進行了步驟S613～S627的處理。如果對所有帶域進行了處理(步驟S629；Yes)，則CPU341結(jié)束不同帶域殘差信號信息生成處理。如果沒有帶所有的帶域進行處理(步驟S629；No)，則CPU341為了處理下一帶域的殘差信號，而使帶域識別變量ωRANGE增加1(步驟S631)，重復(fù)步驟S613～S629的處理。
這樣，對殘差信號的每一帶域進行增益的計算、有聲無聲的判別、以及有聲時的音調(diào)提取。
不同帶域聲源生成處理以下，參照圖7所示的流程圖對圖2的不同帶域聲源生成部231進行的不同帶域聲源生成處理進行說明。此外，如已描述的那樣，通過CPU341(圖3)來實現(xiàn)不同帶域聲源生成部231的功能。
這里，對時間分區(qū)i中的不同帶域聲源生成處理進行說明。
此外，中解碼部223中已解碼的、不同帶域的增益G(ωRANGE)i、有聲無聲判別函數(shù)FlagVorUV(ωRANGE)i、音調(diào)頻率Pitch(ωRANGE)i被存儲在存儲部345(圖3)中。
CPU341將內(nèi)置的計數(shù)寄存器(圖中未示存儲)用于帶域識別變量ωRANGE的存儲。當(dāng)開始不同帶域聲源生成處理時，CPU341將帶域識別變量ωRANGE作為初始值，設(shè)為ωRANGE＝1(圖7的步驟S711)。
CPU341從存儲部345向內(nèi)置的通用寄存器(圖中未示)載入帶域ωRANGE的增益G(ωRANGE)i和有聲無聲判別函數(shù)FlagVorUV(ωRANGE)i(步驟S713)。例如，在設(shè)定ωRANGE＝1時載入帶域l的增益G(l)和帶域l的有聲無聲判別函數(shù)FlagVorUV(l)i。
接著，CPU341判別所載入的有聲無聲判別函數(shù)FlagVorUV(ωRANGE)i是否為FlagVorUV(ωRANGE)i＝”V”(步驟S715)。即，CPU341判別原來的殘差信號D(ωRANGE)i是否為有聲音。
原來的殘差信號D(ωRANGE)i為有聲音時，在圖6的步驟S623中，通過發(fā)送側(cè)的聲音編碼兼解碼裝置311的有聲無聲判別以及音調(diào)提取部137(圖1)生成音調(diào)頻率Pitch(ωRANGE)i。因此，在接收側(cè)的聲音編碼兼解碼裝置311的存儲部345中存儲音調(diào)頻率Pitch(ωRANGE)i。因此，在原來的殘差信號D(ωRANGE)i為有聲音時(步驟S715；YES)，CPU341從存儲部345向內(nèi)置的通用寄存器(圖中未示)載入音調(diào)頻率Pitch(ωRANGE)i(步驟S717)。例如，在設(shè)定成FlagVorUV(l)i＝”V”時，載入帶域l的音調(diào)頻率Pitch(l)i。
接下來，進行殘差信號的復(fù)原作業(yè)。即，CPU341生成大小為增益G(ωRANGE)i、周期為音調(diào)頻率Pitch(ωRANGE)i的倒數(shù)的脈沖列D’(ωRANGE)i＝{d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1}(步驟S719)。該帶域ωRANGE的脈沖列D’(ωRANGE)i是復(fù)原后的有聲音的殘差信號。另外，以與原來的殘差信號D(ωRANGE)i的各要素的采樣間隔相同的時間間隔生成脈沖列D’(ωRANGE)i的各要素(d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1)。
因此，脈沖列D’(ωRANGE)i的各要素(d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1)按時間順序排列。并且，在按時間順序排列的要素列中，在與音調(diào)頻率Pitch(ωRANGE)i的倒數(shù)即音調(diào)周期對應(yīng)的間隔，出現(xiàn)值為G(ωRANGE)i的要素，其它要素的值為0。
在步驟S715中判別為原來的殘差信號D(ωRANGE)i不為有聲音時(步驟S715；NO)，原來的殘差信號D(ωRANGE)i是無聲音。因此，CPU341按照預(yù)定的順序生成反映增益G(ωRANGE)l的、并且作為帶域ωRANGE的噪聲適合的噪聲列D’(ωRANGE)i＝{d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1}(步驟S721)。該帶域ωRANGE的噪聲列D’(ωRANGE)i是復(fù)原后的無聲音的殘差信號。
此外，參照圖8對噪聲列生成處理的所述預(yù)定順序進行說明。
在原來的殘差信號D(ωRANGE)i為有聲音和無聲音時，都生成脈沖列或者噪聲列即不同帶域的疑似殘差信號D’(ωRANGE)i＝{d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1}。CPU341為了將該部同帶域的疑似殘差信號D’(ωRANGE)i用于后述的聲音信號的再生，而將其存儲在存儲部345中(步驟S723)。
通過以上的步驟S713～S723的處理，例如在設(shè)定成ωRANGE＝1時，將脈沖列或者噪聲列即帶域l的疑似殘差信號D’(l)i存儲在存儲部345中。
接著，CPU341判別是否對于所有的帶域進行了步驟S713～S723的處理(步驟S725)。具體地，CPU341判別是否對于所有的帶域進行了殘差信號的復(fù)原(換言之，疑似殘差信號的生成)。如果對所有的帶域進行了處理(步驟S725；Yes)，則CPU341結(jié)束不同帶域聲源生成處理。如果還剩有未進行處理的帶域(步驟S725；No)，則CPU341為了生成下一帶域的疑似殘差信號，而將帶域識別變量ωRANGE增加1(步驟S727)，重復(fù)步驟S713～S725的處理。
這樣，按每個帶域生成脈沖列或噪聲列。
噪聲列生成處理，以下，參照圖8所示的流程圖對圖7的步驟S721中的噪聲列的生成的具體步驟進行說明。此外，已在圖7的步驟S711或S727中設(shè)定帶域識別變量ωRANGE，在步驟S713中載入增益G(ωRANGE)i。
首先，CPU341生成大小為±1、周期為隨機數(shù)的基本噪聲列Ri＝{Ri，0，Ri，1，...，Ri，l-1}(步驟S811)。
以與原來的殘差信號D(ωRANGE)i的各要素的采樣間隔相同的時間間隔來生成基本噪聲列Ri的各要素(Ri，0，Ri，1，...，Ri，l-1)。因此，基本噪聲列Ri的各要素(Ri，0，Ri，1，...，Ri，l-1)按時間順序排列。并且，在按時間順序排列的要素列中，以隨機的間隔出現(xiàn)值為+1或-1的要素，其它要素的值為0。
CPU341使所生成的基本噪聲列Ri經(jīng)過在取出帶域ωRANGE的成分的帶域濾波器，由此來生成帶域ωRANGE的基本噪聲列R(ωRANGE)i＝{R(ωRANGE)i，0，R(ωRANGE)i，1，...R(ωRANGE)i，l-1}(步驟S813)。
CPU341將所生成的帶域ωRANGE的基本噪聲列R(ωRANGE)i乘以增益G(ωRANGE)i，由此生成帶域ωRANGE的噪聲列D’(ωRANGE)i＝{d’(ωRANGE)i，0，d’(ωRANGE)i，1，...d’(ωRANGE)i，l-1}(步驟S815)，結(jié)束噪聲列生成處理。
聲音信號復(fù)原處理以下，參照圖9所示的流程圖對圖2的合成用逆濾波器算出部235以及合成用逆濾波器部225進行的聲音信號復(fù)原處理進行說明。此外，對采用基于MLSA的預(yù)測分析(圖4)作為預(yù)測分析的情況進行說明。但是，在采用線性預(yù)測分析(圖5)等其它預(yù)測分析時也可以按照同樣的步驟來進行聲音信號復(fù)原處理。另外，如上所述，通過CPU341(圖3)來實現(xiàn)合成用逆濾波器算出部235以及合成用逆濾波器部225的功能。
此外，設(shè)為由解碼部223解碼過的預(yù)測系數(shù)(MLSA濾波器系數(shù))Mi＝{mi，0，mi，1，....，mi，P-1}(i為0≤i≤M-1的整數(shù))已存儲在存儲部345(圖3)中。并且，設(shè)為由殘差信號復(fù)原部233復(fù)原過后疑似殘差信號D’i＝{d’i，0，d’i，1，...，d’i，l-1}(i為0≤i≤M-1的整數(shù))也已存儲在存儲部345中。
CPU341將內(nèi)置的計數(shù)寄存器(圖中未示)用作輸入信號采用計數(shù)器，其用于對值i進行計數(shù)。當(dāng)開始聲音信號復(fù)原處理時，CPU341將輸入信號采樣計數(shù)器的值i作為初始值，設(shè)為i＝0(圖9的步驟S911)。
CPU341，從存儲部345向內(nèi)置的通用寄存器(圖中未示)載入對應(yīng)于輸入信號采樣計數(shù)器的值i的預(yù)測系數(shù)Mi＝{mi，0，mi，1，...，mi，P-1}(步驟S913)。例如，當(dāng)將輸入信號采樣計數(shù)器設(shè)定為i＝0時，載入預(yù)測系數(shù)M0＝{m0，0，m0，1，...，m0，P-1}。
接著，CPU341根據(jù)所載入的預(yù)測系數(shù)Mi＝{mi，0，mi，1，...，mi，P-1}來計算合成用逆濾波器CIMi(步驟S915)。此外，圖2的合成用逆濾波器算出部235進行步驟S915的處理。此外，對于合成用逆濾波器可以采用已知的任意方法。
接下來，CPU341從存儲部345向內(nèi)置的通用寄存器(圖中未示)載入疑似殘差信號D’i＝{d’i，0，d’i，1，...，d’i，l-1}，使疑似殘差信號D’i經(jīng)過合成用逆濾波器CIMi，由此復(fù)原聲音信號S’i＝{s’i，0，s’i，1，...，s’i，l-1}(步驟S917)。此外，對于使疑似殘差信號經(jīng)過合成用逆濾波器，可以采用已知的任意方法。
CPU341將復(fù)原后的聲音信號S’i＝{s’i，0，s’i，1，...，s’i，l-1}存儲在存儲部345中(步驟S919)。
通過以上的步驟S913～S919的處理，例如在將輸入信號采樣計數(shù)器設(shè)定為i＝0時，將聲音信號S’0＝{s’0，0，s’0，1，...，s’0，l-1}存儲在存儲部345中。
接下來，CPU341判別輸入信號采樣計數(shù)器的值i是否達到M-1(步驟S921)。若i≥M-1(步驟S921；Yes)，則由于所有的聲音信號已被復(fù)原，CPU341結(jié)束聲音信號復(fù)原處理。若i＜M-1(步驟S921；No)，則CPU341為了復(fù)原下一時間區(qū)間的聲音信號，而將i增加1(步驟S923)，并重復(fù)步驟S913～S921的處理。
接著，對通過圖4的步驟S417中的倒譜Ci來計算MLSA濾波器系數(shù)Mi的步驟的一例進行說明。
圖10是表示MLSA濾波器系數(shù)計算處理的一例的流程圖。CPU341按照如圖10的步驟S1011～S1035所示流程來進行計算，由此根據(jù)倒譜C’＝{ci，0，ci，1，...，ci，l/2-1}來求出MLSA濾波器系數(shù)Mi＝{mi，0，mi，1，...，mi，P-1}。此外，α是近似用的數(shù)值，當(dāng)以10kHz來采樣聲音信號時優(yōu)選α＝0.35。此外，β＝1-α2。mi(0≤m≤p-1)初始化為0。
圖1 1A和圖11B表示使用這樣求出的MLSA濾波器系數(shù)的MLSA濾波器結(jié)構(gòu)的一例。P1～P4是近似用系數(shù)，例如，優(yōu)選P1＝0.4999、P2＝0.1067、P3＝0.0117、P4＝0.0005656。
如以上說明，在本實施方式的聲音編碼裝置111中，當(dāng)對殘差信號進行編碼時，將殘差信號按每個帶域具有某種強度這樣的信息與殘差信號一起進行編碼。由此，通過在聲音解碼裝置221中使用該信息，可以取得合適的激發(fā)信號(疑似殘差信號)。并且，通過使用該激發(fā)信號來解碼聲音信號，可以提高聲音的品質(zhì)。
當(dāng)將殘差信號分割成多個帶域時，存在較強地表現(xiàn)出作為有聲音的性質(zhì)的帶域、較強地表現(xiàn)出作為無聲音的性質(zhì)的帶域。因此，在本實施方式地聲音編碼裝置111中，按每個帶域判別不同帶域殘差信號是有聲音還是無聲音，并將該判別結(jié)果編碼。由此，根據(jù)本實施方式，可以向聲音解碼裝置傳送根據(jù)每一帶域的特征而編碼的殘差信號，能夠提高解碼的聲音品質(zhì)。
通過音調(diào)頻率對有聲音附加特征。因此，在本實施方式的聲音編碼裝置111中，當(dāng)某一帶域的殘差信號具有作為有聲音的性質(zhì)時，從該帶域的殘差信號中提取音調(diào)頻率，由該音調(diào)頻率來代表該帶域的殘差信號。因此，根據(jù)本實施方式，可以在保持該帶域的特征的同時，減少要編碼的信息量。并且，信息量的減少有利于低比特率通信。
此外，在本實施方式的聲音編碼裝置111中，對每一帶域，根據(jù)不同帶域殘差信號的自身相關(guān)函數(shù)的形狀來判別不同帶域殘差信號是有聲音還是無聲音。因此，根據(jù)本實施方式，如上所述通過在判別中采用預(yù)定的基準(zhǔn)，可以容易地判別是有聲音還是無聲音。并且，當(dāng)判別為是有聲音時，還可以同時求出音調(diào)頻率。
另外，本實施方式地聲音編碼裝置111中，進行基于MLSA的預(yù)測分析或者線性預(yù)測分析。因此，根據(jù)本實施方式可以使分析合成型的聲音壓縮適用于低比特率。
此外，在本實施方式的聲音解碼裝置211中，生成用于反映從聲音編碼裝置11 1傳遞的不同帶域殘差信號強度的激發(fā)信號，通過該激發(fā)信號來對聲音信號進行復(fù)原。由此，根據(jù)本實施方式，激發(fā)信號成為與人類本來的聲音相同的、在每一帶域具有特征的信號。因此，可以進行高頻之的聲音信號的解碼。
此外，本發(fā)明并不限于上述實施方式，還可以進行多種變形及應(yīng)用。上述的硬件結(jié)構(gòu)或塊結(jié)構(gòu)、流程圖僅為例示，并沒有限定。
例如，假設(shè)便攜電話作為圖3所示的聲音編碼兼解碼裝置311。但是，本發(fā)明也可同樣應(yīng)用于PHS(Personal Handyphone System)、PDA(Personal DigitalAssistance)、筆記本型以及臺式型個人計算機等中的聲音處理。例如，當(dāng)將本發(fā)明應(yīng)用于個人計算機時，可以對個人計算機附加聲音輸入輸出裝置、通信裝置等。由此，計算機具有作為便攜電話的硬件的功能。并且，通過存儲媒體或通信來散發(fā)用于使計算機執(zhí)行上述處理的計算機程序，在計算機中安裝該程序并進行執(zhí)行，由此，可以使該計算機作為本發(fā)明的聲音編碼裝置或聲音解碼裝置來發(fā)揮功能。
即，上述實施方式是用于說明，而不對本發(fā)明的范圍進行限定。因此，將各個要素或所有要素進行與之等同的置換這樣的實施方式也包含在本發(fā)明的范圍之中。
權(quán)利要求
1.一種聲音編碼裝置，包括
預(yù)測分析部(131)，其通過預(yù)測分析聲音信號，來獲得預(yù)測系數(shù)和殘差信號；
不同帶域殘差信號生成部(133)，其將所述殘差信號分割成每個帶域的不同帶域殘差信號；
強度確定部(135)，其按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及
編碼部(125)，其對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
2.根據(jù)權(quán)利要求1所述的聲音編碼裝置，其特征在于，
還包括有聲無聲判別部(137)，其按照每個所述帶域來判別所述不同帶域殘差信號是有聲音還是無聲音，
所述編碼部(125)還對所述有聲無聲判別部(137)的判別結(jié)果進行編碼。
3.根據(jù)權(quán)利要求2所述的聲音編碼裝置，其特征在于，
還包括音調(diào)提取部(137)，其從由所述有聲無聲判別部(137)判別為有聲音的不同帶域殘差信號提取不同帶域音調(diào)頻率，
所述編碼部(125)還對所述音調(diào)提取部(137)所提取到的不同帶域音調(diào)頻率進行編碼。
4.根據(jù)權(quán)利要求2所述的聲音編碼裝置，其特征在于，
所述有聲無聲判別部(137)按照每個所述帶域，根據(jù)所述不同帶域殘差信號的自身相關(guān)函數(shù)的形狀來判別所述不同帶域殘差信號是有聲音還是無聲音。
5.根據(jù)權(quán)利要求1所述的聲音編碼裝置，其特征在于，
所述預(yù)測分析是MLSA(Mel Log Spectrum Approximation)分析，所述預(yù)測系數(shù)是MLSA濾波器系數(shù)，所述殘差信號是作為MLSA濾波器的逆濾波器輸出而求出的信號。
6.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，所述預(yù)測分析是線形預(yù)測分析，所述預(yù)測系數(shù)是線形預(yù)測系數(shù)，所述殘差信號是作為線形預(yù)測濾波器的逆濾波器輸出而求出的信號。
7.一種聲音解碼裝置，包括
接收部(221)，其接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析而獲得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行了編碼而獲得的編碼不同帶域殘差信號強度；
解碼部(223)，其根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度，來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；
聲源信號生成部(231)，其按照每個所述帶域，來生成具有所述不同帶域殘差信號強度所表示的帶域依存性的不同帶域聲源信號；
殘差信號復(fù)原部(233)，其根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；和
合成濾波器(235)，其通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音。
8.一種聲音編碼方法，包括以下步驟
預(yù)測分析步驟，通過預(yù)測分析聲音信號來獲得預(yù)測系數(shù)和殘差信號；
不同帶域殘差信號生成步驟，將所述殘差信號分割成每個帶域的不同帶域殘差信號；
強度確定步驟，按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及
編碼步驟，對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
9.一種聲音解碼方法，包括以下步驟
接收步驟，接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析所得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行編碼而獲得的編碼不同帶域殘差信號強度；
解碼步驟，根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；
聲源信號生成步驟，按照每個所述帶域生成具有所述不同帶域殘差信號強度所表示的帶域依存性的不同帶域聲源信號；
殘差信號復(fù)原步驟，根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；以及
合成步驟，通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音。
10.一種計算機可讀取記錄媒體，記錄了用于使計算機執(zhí)行以下步驟的程序
預(yù)測分析步驟，通過預(yù)測分析聲音信號來獲得預(yù)測系數(shù)和殘差信號；
不同帶域殘差信號生成步驟，將所述殘差信號分割成每個帶域的不同帶域殘差信號；
強度確定步驟，按照每個所述帶域根據(jù)所述不同帶域殘差信號來求出不同帶域殘差信號強度；以及
編碼步驟，對所述預(yù)測系數(shù)和每個所述帶域的所述不同帶域殘差信號強度進行編碼。
11.一種計算機可讀取記錄媒體，記錄了用于使計算機執(zhí)行以下步驟的程序
接收步驟，接收對預(yù)測分析聲音信號所得的預(yù)測系數(shù)進行編碼而獲得的編碼預(yù)測系數(shù)；以及對通過該預(yù)測分析所得的殘差信號的、表示每個帶域的強度的不同帶域殘差信號強度進行編碼而獲得的編碼不同帶域殘差信號強度；
解碼步驟，根據(jù)所述編碼預(yù)測系數(shù)和所述編碼不同帶域殘差信號強度來對預(yù)測系數(shù)和每個所述帶域的不同帶域殘差信號強度進行解碼；
聲源信號生成步驟，按照每個所述帶域生成具有所述不同帶域殘差信號所表示的帶域依存性的不同帶域聲源信號；
殘差信號復(fù)原步驟，根據(jù)每個所述帶域的所述不同帶域聲源信號來復(fù)原殘差信號；以及
合成步驟，通過合成所述預(yù)測系數(shù)和所述復(fù)原后的殘差信號來復(fù)原聲音。
全文摘要
本發(fā)明提供一種聲音編碼裝置、聲音解碼裝置、聲音編碼方法、聲音解碼方法、以及計算機可讀取的記錄媒體。在聲音編碼裝置(111)中，帶域濾波器部(133)將由預(yù)測分析部(131)生成的殘差信號分解成每個帶域的成分。然后，增益算出部(135)和有聲無聲判別以及音調(diào)提取部(137)求出帶有各帶域特征的強度、有聲音和無聲音的區(qū)別、以及有聲音時的音調(diào)頻率。該所求出的信息與預(yù)測系數(shù)一起被編碼，并傳遞至聲音解碼裝置(211)。在聲音解碼裝置(211)中，在反映原來的殘差信號的各帶域的特征的同時生成激發(fā)信號。因此，該激發(fā)信號可高效地再現(xiàn)原來的殘差信號。
文檔編號G10L11/02GK101123091SQ20071014023
公開日2008年2月13日申請日期2007年8月6日優(yōu)先權(quán)日2006年8月7日
發(fā)明者井手博康申請人:卡西歐計算機株式會社

完整全部詳細技術(shù)資料下載