1 引言
在Altera的Nios嵌入式處理器中。用戶可以在Nios指令系統中增加用戶自定制指令來滿足某種特定的應用需求。自定制指令可以訪問存儲器或Nios系統外的邏輯資源。增強系統的實時處理能力,特別適用于DSP、數據包處理及對計算密集型軟件進行優化。
Altera高性能快速傅立葉變換(FFT)處理器IP核FFT V2.2.0為實現高速FFT算法提供了成功的解決方案,將FFT算法定制為Nios嵌入式處理器的用戶指令,用已實現的高性能FFT算法作為Nios嵌入式系統的一個加速模塊,使系統可以完成復雜的數據處理任務。
2 Nios自定制指令的軟硬件接口
使用用戶自定制指令,用戶能夠向Nios的ALU和指令系統增加用戶自定制功能,完整的用戶自定制指令包括用戶自定制邏輯和軟件宏兩部分。
用戶自定制邏輯是完成用戶操作的硬件部分,Nios最多支持5個用戶自定制邏輯作為ALU的一部分。軟件宏提供軟件接口,Nios將創建相應C/C++和匯編的宏代碼,使得用戶能夠訪問用戶自定制邏輯。Nios自定制指令支持多種設計文件,主要有Verilog HDL、VHDL、EDIF netlist file、Quartus II Block Design File等。由于用戶自定制指令邏輯需要直接連到ALU上.所以Nios提供一套預先定義好名稱和功能的接口,如圖1所示。Nios配置向導會掃描用戶自定義邏輯,搜索需要的端口。并把這些端口連到ALU上,這就要求用戶自定制邏輯必須指定所需的端口類型,使用預先定義的端口名稱。保證自定制邏輯端口能正確地連到ALU。
當然,Nios也允許用戶自定制指令與Nios系統外部的功能模塊進行信息交流。如果配置向導沒能識別用戶邏輯模塊的某個端口。它將該端口引出到系統模塊的頂層.使得外部邏輯可以訪問這些信號,這些端口用export標記。當用戶自定制邏輯被集成到Nios處理器的ALU后.可以通過軟件訪問用戶自定制邏輯,Nios系統中包括5個用戶操作碼,如表1所示,用戶可以通過用C/C++或匯編寫的宏來調用這些操作碼,通過它們來訪問用戶自定制邏輯。
表1 用戶操作碼、類型和操作
寫C/C++代碼時,Nios寄存器的使用是透明的,編譯器會自動選擇寄存器,而在匯編中則必須指定寄存器。在增加了用戶自定制指令后,Nios配置向導會自動創建相應的宏,支持對宏進行手工命名,以提高軟件代碼的可讀性。
在C/C++中通過一個函數調用來訪問用戶自定義指令。SOPC Builder自動生成的Nios系統頭文件(excalibur.h)里包含了C/C++的宏定義,有兩種不同的C/C++宏可供使用,其中前一個使用了prefix端口,后一個沒有使用prefix端口。
nm_
nm_
3 FFT算法實現
FFT算法由Altera的FFT IP核FFT V2.2.0實現,FFT V2.2.0是一個高性能、參數化快速傅立葉變換(FFT)處理器IP核,對Altera StratixII、Stratix GX、Stratix以及Cyclone系列器件進行了設計優化.可以完成變換長度為2m(6≤m≤14)的基-2/4按頻率抽取(DIF)的復數FFT算法,IP核使用模塊浮點結構可在
數據處理過程中保持最大數據動態范圍,以獲得最大信噪比SNR與最少邏輯需求之間的平衡。
此處FFT V2.2.0相關參數設置為:變換長度(Transform Length)選擇1024點,數據精度選擇16位,旋轉因子精度選擇16位,I/O數據流選擇Streaming形式,復數乘法器結構(Structure)由3個乘法器、5個加法器完成。
圖2給出了FFT算法模塊的外部端口,I/O接口協議采用Atlantic接口,輸入接口為主設備匯端(Master Sink),輸出接口為主設備源端(Master Source),Atlantic接口相關內容可查閱文獻3,圖3為FFT在Modelsim環境下的仿真結果。
4 定制Nios核的FFT指令
應用SOPC Builder系統開發工具建立一個嵌入Nios軟核的基本SOPC系統,系統組件如圖4所示。顯然,用戶可以根據實際應用的需要增加其它SOPC系統組件,這里僅分析定制FFT算法指令相關內容。
通過自定制指令“Custom Instruction”界面中Import按鈕導入設計好的FFT.vhd文件,定制用戶指令FFT,這里使用USR1操作碼,如圖5所示。
在Nios系統中用戶自定制邏輯必須與指定的端口類型匹配,對于FFT來說,其輸入和輸出都是實部和虛部為16位的復數,正好可以用一個32位的值來表示 這樣FFT.vhd程序的端口(port)可以按如下方法設置:
PORT(
clk:IN STD_ LOGIC;
reset:IN STD_LOGIC;
dataa:IN STD_LOGIC_VECTOR(31 DOWNTO 0);
result:OUT STD_LOGIC_VECTOR(31 DOWNTO 0);
start:IN OUT STD_LOGIC:=‘0’;
clk_en:IN STD LOGIC:=‘0’
……
);
即將程序中原有16位長的data_real_in,data_imag_in,fft_real_out,fft_imag_out端口換成兩個32的輸入輸出端口dataa和result,另外,還必須加上start和clk_en兩個輸入端口,雖然這兩個端口信號在程序中沒有作用。端口例化時再與原有端口對應,如下所示:
data_real_in => dataa(31 downto 16),
data_imag_in => dataa(15 downto 0),
fft_real_out => result(31 downto 16),
fit_imag_out => result(15 downto 0),
FFT其余Atlantic接口信號用export標記,這些端口引出到系統模塊的頂層,外部邏輯可以訪問這些信號。
重新生成SOPC系統并更新后得到如圖6所示的加入自定制FFT算法指令的Nios處理器,將其全程編譯并下載到相應FPGA后,結合Atlantic接口邏輯、FIFO存儲器電路,用戶即可在C或C++中調用nm_fft指令來完成1024點的高速FFT算法。
5 結論
自定制Nios處理器的用戶指令方法,使設計者可以為某種特定的應用定制自己的指令,定制指令的方法在降低軟件復雜性的同時,明顯地提高了Nios處理器的性能.幫助系統完成復雜的數據處理。
本文作者創新點:基于IP核FFT V2.2.0實現了變換長度為1024點的高速復數FFT算法,提出了一種新穎的在Nios嵌入式系統中定制用戶FFT算法指令的方法,使系統可以完成復雜的數據處理任務,增強了系統的實時處理能力。
參考文獻:
[1]梁曦捷,肖璋.一種基于FPGA的順序迭代FFT設計 微計算機信息,2005,1-2
[2]Altera DataSheet FFT Compiler Megacore Function User Guide 2.2.0 rev1 2005.10
[3]Altera DataSheet Custom instructions for the Nios embedded Processor User Guide ve1.1.2 2002.9
[4]Altera DataSheet Altera Interface Functional Specificmion Ver.3.0 2002.6
[5]潘松 黃繼業 曾毓 SOPC技術實用教程[M]北京清華大學出版社2005年3月131-139