語音編碼器方法歸納起來可以分成三大類:波形編碼、信源編碼、混合編碼。
1.波形編碼
波形編碼比較簡單,編碼前采樣定理對(duì)模擬語音信號(hào)進(jìn)行量化,然后進(jìn)行幅度量化,再進(jìn)行二進(jìn)制編碼。解碼器作數(shù)/模變換后再由低通濾波器恢復(fù)出現(xiàn)原始的模擬語音波形,這就是最簡單的脈沖編碼調(diào)制(PCM),也稱為線性PCM?梢酝ㄟ^非線性量化,前后樣值的差分、自適應(yīng)預(yù)測等方法實(shí)現(xiàn)數(shù)據(jù)壓縮。波形編碼的目標(biāo)是讓解碼器恢復(fù)出的模擬信號(hào)在波形上盡量與編碼前原始波形相一致,也即失真要最小。波形編碼的方法簡單,數(shù)碼率較高,在64kbit/s至32kbit/s之間音質(zhì)優(yōu)良,當(dāng)數(shù)碼率低于32kbit/s的時(shí)候音質(zhì)明顯降低,16 kbit/s時(shí)音質(zhì)非常差。
2.信源編碼
信源編碼又稱為聲碼器,是根據(jù)人的發(fā)生機(jī)理,在編碼端對(duì)語音信號(hào)進(jìn)行分析,分解成有聲音和無聲音兩部分。聲碼器每隔一定時(shí)間分析一次語音,傳送一次分析的的道德有/無聲和濾波參數(shù)。在解碼端根據(jù)接收的參數(shù)再合成聲音。聲碼器編碼后的碼率可以做得很低,如1.2kbit/s、2.4kbit/s,但是也有其缺點(diǎn)。首先是合成語音質(zhì)量較差,往往清晰度可以而自然度沒有,難于辨認(rèn)說話人是誰,其次是復(fù)雜度比較高。
3.混合編碼
混合編碼是將波形編碼和聲碼器的原理結(jié)合起來,數(shù)碼率約在4kbit/s—16kbit/s之間,音質(zhì)比較好,最近有個(gè)別算法所取得的音質(zhì)可與波形編碼相當(dāng),復(fù)雜程度介乎與波形編碼器和聲碼器之間。
上述的三大語音編碼方案還可以分成許多不同的編碼方案。
語音編碼屬性可以分為四類,分別是比特速率,時(shí)延、復(fù)雜性和質(zhì)量。比特律是語音編碼很重要的一方面。比特速率的范圍可以是從保密的電話通信的2.4kbit/s到64kbit/s的G.711PCM編碼和G.722寬帶(7KHz)語音編碼器。