電話線路上的模擬語音信號,經(jīng)話路帶寬濾波(符合ITU-T G.712建議)后,被8kHz采樣,量化成16bit線性PCM數(shù)字信號輸入到編碼器。該編碼器是基于線性預測分析合成技術,盡量減少實際語音與合成語音之間經(jīng)聽覺加權后差分信號的能量為準則來進行編碼的。編碼器的結構框圖如圖1所示,其主要部分有:
·線性預測分析和LPC系數(shù)的量化;
·開環(huán)基音周期估計;
·自適應碼本搜索;
·固定碼本搜索;
·碼本增益量化。
下面分別描述這五部分的主要技術。
·線性預測分析與LPC系數(shù)的量化
首先對信號進行加線性預測分析窗,分析窗由兩部分組成。第一部分是半個漢明窗,第二部分是四分之一個余弦信號。將加窗后的語音信號通過LevinsonDurbin算法獲得線性預測濾波器系數(shù)ai i=1......10。由于線譜對參數(shù)比線性預測系數(shù)具有更好的內插特性和量化特性[3], G.729將LPC參數(shù)轉換成相應的線譜對參數(shù),最后對線譜對參數(shù)進行量化。
·開環(huán)基音分析
為了減少自適應碼本搜索的復雜度,需要計算開環(huán)基音Top,使自適應碼本搜索在開環(huán)基音值附近進行。基音值的范圍在18~145個樣本點之間。
·自適應碼本搜索
G.729對每個子幀進行閉環(huán)基音搜索,它通過最小化原始語音信號和重構語音信號的加權均方誤差來進行閉環(huán)基音搜索。對子幀1的閉環(huán)基音T1的搜索是局限在開環(huán)基音Top的一個小范圍內,對子幀2的閉環(huán)基音T2的搜索是局限在閉環(huán)基音T1的一個小范圍內。這樣可以減少基音搜索的復雜度。
·固定碼本搜索
G.729固定碼本矢量含有四個非0脈沖,每個脈沖的幅度要可以是+1或-1。通過最小化加權語音信號和加權重構語音信號的均方誤差來進行固定碼本的搜索。
·增益量化
G.729對自適應碼本增益和固定碼本增益采用二級共軛結構碼本進行矢量量化。在碼本搜索時,采用預搜索策略,使得運算量只為全搜索算法的1/4。