摘 要: 介紹了利用數字信號處理芯片TMS320VC5509實現MP3解碼的方案。討論了MP3霍夫曼解碼方法,并利用DSP的C語言在TMS320VC5509上實現了該算法。利用CCS的Profile功能對運算復雜度進行了估算,結果顯示TMS320VC5509完全能夠達到該解碼算法的計算量要求,并能夠實現實時解碼。
關鍵詞: DSP TMS320VC5509 McBSP CCS MP3 霍夫曼解碼
TMS320VC5509(以下簡稱C5509)是TI公司C5000 DSP 系列中的新一代產品,該芯片最低工作電壓為0.9V,其核的最低功耗僅為0.05MW/MIPS,性能最高可達800 MIPS。C5509為嵌入式DSP應用及高性能儀器儀表、智能機器人、手持設備、數字音頻播放器和數碼相機等應用提供了有效的解決方案。MP3是指MPEG(活動圖像專家組)國際標準音頻第三層編/解碼,MP3編碼是通過將音頻信號由時域信號轉換為頻域信號,并根據人類心理聲學特征去除部分冗余信息實現的,ISO/IEC11172-3 Part 3給出了詳細的編/解碼標準。解碼涉及霍夫曼解碼、修正余弦反變換(IMDCT)、子帶合成等復雜運算模塊。本文利用C5509實現對MP3的解碼運算。
1 C5509 DSP 處理器的特點和工作原理
1.1 C5509 DSP的性能概述
C5509有32×16bit" title="16bit">16bit指令緩沖隊列,可實現高效的塊循環操作;兩個17×17bit的MAC單元,可在單周期內執行兩次MAC操作;1個40bit的ALU、1個40bit的桶型移位器,4個40bit的累加器可執行比C54系列DSP更高效的算術運算,在400MHz的晶振驅動下,可達到800MIPS的性能。以44.1kHz采樣率的MP3數據流為例,對128kbit/s數據率的MP3數據進行解碼。霍夫曼解碼、IMDCT、子帶合成等運算模塊共需消耗1.3MIPS的CPU資源,對于平均每秒必須解碼44.6幀數據來講,總運算量為44.6×1.3=57.98MIPS,C5509完全可以滿足此速度要求。
C5509還具有128K×16bit的片上" title="片上">片上RAM,其中包括64KB" title="64KB">64KB的DARAM、192KB的SARAM和64KB的片上ROM。
與眾多TMS320系列DSP處理器一樣,C5509采用了哈佛結構,共有12組獨立總線,其中包括3組數據讀總線、2組數據寫總線、5組數據地址總線" title="地址總線">地址總線、1組程序讀總線和1組程序地址總線,這些總線并行地為各個計算單元提供指令和操作碼,從而為高速的數據運算提供了有力的保障。
1.2 C5509 DSP的外設介紹
C5509提供了專用的外部存儲器接口(EMIF),用于控制DSP與外部存儲器之間所有數據的傳輸。可與EMIF無縫鏈接的存儲器有:異步存儲器(ROM、FLASH、 SRAM)、同步突發SRAM、同步DRAM(SDRAM),并可支持可選的32、16、8位數據訪問。對EMIF編程時,必須根據實際的外部存儲器考慮如何分配片內使能空間(CE)。通過EMIF接口,主處理器可將數據和程序置于片外,從而節省了片上硬件資源。
其次,C5509有3個獨立的多通道緩存串口(McBSP),使得C5509能夠直接與其他C55xx系列DSP、多媒體數字信號編解碼器等設備高速互連,這些McBSP可以提供全速雙工通信,并支持128通道的收發,接收或者發送可以選擇使用獨立的時鐘,字寬為8、12、16、20、24位任選。
為保證與常見的異步通信模塊進行數據通信,C5509提供了與TL16C550C等專用異步通信接口IC互連的UART,外部數據經由TL16C550C進出DSP的UART,最終交給片內CPU處理。圖1為與C5509配合使用的典型專用異步通信接口IC(TL16C550C)的管腳圖。
C5509的UART每接到數據就會產生相應的中斷請求,通知CPU及時采集數據,將Rx線上的串行數據放入接收寄存器中,在滿足緩沖區長度后,寄存器的并行數據再交給CPU做后續處理。
2 解碼算法說明
2.1 MP3文件的格式
MP3文件以幀為基本單位,每幀的構成如表1所示。由于MP3文件數據格式采用了比特池技術,故主數據有可能在幀頭之前,具體位置可由幀邊信息" title="邊信息">邊信息所包含的main_data_begin變量獲得。
解碼時首先將一定長度(本系統為2kbit)的數據讀入C5509的內部RAM中,然后尋找幀的同步字sync_word(FFF)。如果找到同步字,則以其為首的32bit即為幀頭。由幀頭中的校驗位可知是否有校驗數據,如無,則其后的256bit數據即為幀邊信息。主數據一般包含兩個粒度組(gr)的數據,每個粒度組又包含左右聲道(ch)兩部分的數據信息,各個聲道數據可獨立解碼,故將每個粒度單個聲道解碼的程序編寫為單個的*.c文件,以適應單聲道或者其他MP3格式的解碼。MP3編碼根據人類心理聲學,將每個粒度組分為三部分數據:第一部分對應低頻采樣的Big_values(大值區),用較大絕對值的量化值存放低頻值;第二部分為Count1區,用絕對值較小的量化值存放中頻值,所有量化值的可能取值為1,0,-1;第三部分為編碼為零的Zero高頻區,零數據無須在MP3文件中出現,只需在解碼時詢問每個粒度組的計數是否已經達到576。若計數為576,則說明該粒度組已解完576個頻率線的量化值。
上述幀邊信息存儲了供后續解碼的全部重要信息。為方便引用,將其定義為結構體。部分元素的定義和注釋如下:
struct Granule {
unsigned part2_3_length; //用以計算Count1
//區位置;
unsigned big_values; //用以計算Big_values
//區位置;
unsigned table_select[3]; //用以確定查找哪一
//個霍夫曼表;
……
};
table_select[3]的值就是霍夫曼表的下標h,可在解主數據時鎖定某個具體的霍夫曼表。
2.2 MP3數據的霍夫曼解碼原理
如上小節所述,每個粒度組的數據根據聲學特性將0到奈奎斯特頻率的頻率線分為Big_values、Count1和Zero三個區。在解碼時,Big_values區對應的霍夫曼碼表格式如表2所示,而Count1區碼表格式如表3所示。
存放霍夫曼碼表的文件huffman.h中包含32個供Big_values區查詢用的碼表和2個供Count1區查詢用的碼表。為了方便快速查得短長度的編碼值,還增加了輔助表h_cue[34][16]。當開始解主數據時,將定長(例如32位)數據dataword()入棧,首先移出該緩存區的前四位數據,作為查輔助表的頭數據lead,然后根據lead值和幀邊信息中的霍夫曼查找表下標h,得出輔助表的具體數據h_cue[h][lead],這個數據只是指向Big_values區或者Count1區某個表的首地址h_tab,具體要用到該表的哪個數據仍需程序提供一個偏移量繼續判斷。此時可以先由緩存區中去掉lead四個位的數據與鎖定的霍夫曼表對比,如果這后面的數據與被鎖定的霍夫曼表頭的碼字一致,則可馬上得到解碼的數據;若是兩個碼字不一致,則還需由h_cue[h][lead]和h_cue[h][lead+1]的差值得到偏移量,從而最終得到正確的解碼數據。(格式如表2和表3所示)。
另外,由于MP3編碼中對絕對值小于等于15的量化值直接編碼,對絕對值大于15的量化值采用ESC(附加值)編碼,所以在得到加碼數據后還需判斷是否要為其添加附加值和符號位。詳細的解碼流程如圖2所示。
MP3解碼的主要運算量集中在霍夫曼解碼、反量化、IMDCT、子帶合成四個運算模塊,而霍夫曼解碼占整個運算量總和的1/5。利用CCS的Profile工具對44.1kHz采樣率、128kbps比特率的MP3數據進行運算復雜度的估算,可得本系統的解碼模塊消耗的運算量為1.3MIPS。由此可知,對于每秒解50幀以上的實時解碼,DSP要承擔65MIPS的運算復雜度,利DSP實現的本解碼模塊是完全可以勝任的。
參考文獻
1 彭啟琮. TMS320VC55x系列DSP的CPU與外設. 北京:清華大學出版社,2005:275~388
2 TMS320VC5509A Fixed-Point Digital Signal Processor Data Manual.Texas Instruments Incorporated,2005:13~50
3 TMS320C55x DSP Programmer’s Guide. Texas Instruments Incorporated, 2001:4~84
4 范建軍. MP3文件格式剖析.咸寧師專學報,2002;22(6):77~79
5 王潮營. 基于DSP的MP3解碼器的研究與實現(碩士學位論文).哈爾濱:哈爾濱工程大學信息與通信工程學院,2004:9~25