《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > RAID存儲設備的發展及其應用

RAID存儲設備的發展及其應用

2009-07-20
作者:胡勁草 陳金樹

  摘 要: 介紹了近年來計算機用于RAID的存儲設備接口的發展,陳述了RAID設備應用中應當考慮的因素,并在最后指出了目前許多客戶在使用RAID盤陣列時存在的誤區。
  關鍵詞: 廉價的冗余磁盤陣列(RAID) 小型計算機系統接口總線(SCSI) 串行存儲結構總線(SSA) 光纖通道 I/O


  隨著數字化革命的推進,對計算機存儲系統在存儲數據量、可靠性和存取速度上都提出了嚴峻的挑戰。外存儲設備成為多媒體、CAD、數據庫等應用不可避免的瓶頸。雖然SLED(Single Large Expensive Disk)在數據存儲容量和讀寫速度上有較大幅度的提高,但是與CPU以及內存的發展速度相比較,其性能的提高卻顯得很有限。從PC機磁盤技術上發展起來的RAID(廉價冗余磁盤陣列)提供了另一個解決方案。和SLED相比,其存儲速度,數據可靠性,低功耗和可擴展性等都有很大的優勢,因而已經成為目前高速、大容量、關鍵數據存儲解決方案的主流。而正是由于RAID的諸多優點,工業界在這十幾年中開發出了一系列可應用于RAID的存儲設備接口。本文按照技術的發展順序,對各種RAID應用存儲設備接口作了綜合性的介紹。最后,作者分析了現在用戶挑選RAID存儲設備中存在的誤區。
1 存儲設備接口
1.1 并行SCSI和SCSI2
  并行SCSI(SCSI1)標準是在1986年建立的。時至今日,一些高端服務器和工作站所采用的存儲設備接口多數仍然使用的是SCSI。它支持最多可達7個8位設備,最大傳輸速度可以達到5MB/s。誕生于1992年的SCSI2實際上在并行SCSI基礎上進行了改善,目前的標準實現有兩種,Fast(傳輸峰值速度為10MB/s)和Wide(20MB/s)。雖然它可以進行32位的傳輸,但到目前只用16位進行傳輸。它支持同步傳輸模式,差分信號,命令隊列和奇偶校驗。與SCSI1相比較,它的接頭也要小的多。圖1為其邏輯框圖。


  從圖1可見,構成一個并行SCSI系統的關鍵部分是SCSI接口適配卡、數據線,采用菊花鏈模式連接的驅動器以及端接器(并行SCSI總線要求在總線兩端有端接器)。
  在此類系統中,要求每個組成設備(包括接口卡和磁盤驅動等)都有一個0~7的唯一ID。為了提高擴展性能,使之可以用于規模更大的系統,SCSI2的LUN支持使之能允許多個邏輯或虛擬設備共享一個物理ID號,而每個邏輯或虛擬設備則通過一個唯一的子地址來標識。
  雖然此類SCSI存儲設備多用于單一主機的訪問,但采用一定的設置技巧,它也可以被用于集群系統中。
  由于傳輸過程中不可避免地存在著噪聲和信號衰減,使并行SCSI總線的傳輸距離不可能太長,通常來說它只能用于傳輸距離小于3m的應用。為了提高傳輸距離,業界在系統中引入高電壓信號差分(HVD)以增大抗干擾能力,從而使總線的傳輸距離可以進一步擴展至25m左右,但是差分信號的引入使接口的引腳數目增大了一倍。
  由于并行SCSI總線應用的廣泛性,在一定時期內其不可能被完全淘汰。而新一代的存儲設備接口為了提供對這些SCSI設備的后向兼容,一般都提供了和SCSI總線進行轉換的接口橋。
1.2 SCSI3
  SCSI3進一步在SCSI2的功能上進行了完善,力圖使之有更好的兼容性以拓展其應用空間。和SCSI2相比較,SCSI3支持Ultra SCSI和光纖通道,SCAM支持(一種即插即用的系統自動配置協議)。它支持SCA(Single Connector Attachment)接口,SCA2接口(也就是有熱插拔功能的SCA接口)和VHDCI(Very High Density Cable Interface)接口。
1.3 Ultra SCSI(Fast 20)
  Ultra SCSI在實現SCSI3協議的基礎上將總線的傳輸帶寬增至40MB/s。為了達到更高的傳輸速度,Ultra SCSI采用了新的信號和時鐘技術。為了最大程度的兼容已在應用領域中占主導地位的SCSI2設備,Ultra SCSI的設計使之能和SCSI2設備一塊使用,但這種混合使用是以峰值速度下降為總線上所掛最慢設備的傳輸速度為代價的。
1.4 Ultra2 SCSI
  Ultra2 SCSI是在Ultra SCSI基礎上邁出的很自然又很重要的一步。它采用LVD(低電平差分信號)技術以及其它的一些改良將總線傳輸速度進一步提高至80MB/s。同時,Ultra2 SCSI每個通道支持多達16個設備,傳輸距離可達12m。同時,由于它是在并行SCSI的技術上發展起來的,使之有很好的后向兼容性,價格相對也比較便宜,因此成為目前解決新一代大容量存儲系統IO瓶頸的很有競爭力的一個方案,并且也得到了許多存儲設備生產廠家的大力支持。
1.5 SSA(Serial Storage Architecture)
  為了替代那些陳舊而且慢速的并行SCSI總線接口, IBM牽頭聯合多個制造商建立了一個新的開放式存儲接口標準SSA(ANSI X3T0.1)。SSA的關鍵技術是所謂的“空間復用技術”,這一技術允許傳輸在總線上并發進行從而增大傳輸帶寬。和并行SCSI的鏈接模式相比,SSA采用了不同的拓撲結構:環形拓撲結構,其基本構成框架可如圖2所示。每個SSA環可以支持多達127個設備,傳輸長度可達到15m。


  在圖2中,SSA控制卡可以同時控制兩個數據傳輸環路,而每個環路上峰值傳輸速度可以達到80MB/s。
  圖2的每一環路事實上是一個雙環結構,傳輸指令在這個環路上挨個傳遞直到到達目的存儲器。由于SSA的“空間復用”技術,各個存儲器之間可以以最多為20MB/s的速度進行相互備份,從而依靠這種復用達到傳輸速度總和的增長。但是采用這種技術,當系統需要從存儲設備中讀或寫時,其速度卻只能達到20MB/s,低于Ultra SCSI和Ultra2 SCSI。因而這種系統主要應用于集群環境。
  雙環結構使其有良好的容錯性能(這類似于通信中的自愈環的概念)。比如說圖2中的磁盤3由于故障不能正常工作,如果磁盤2和4想進行傳輸,則此時傳輸就不能通過3來進行。在這種情況下,系統將檢測到此故障而將磁盤2和4的路由改至經過控制卡。當環中的某一段磁盤出現故障,比如上圖中的3和5同時出現故障,SSA會標志3、4、5不可用,從而形成一個新的單環結構。
1.6 光纖通道仲裁環(FC-AL)
  光纖通道是又一種開放式標準,是由ANSI和OSI定義的,它是一種串行的高速數據傳輸技術,支持許多重要的高層協議,如IP、ATM、IEEE902、HIPPI(High Performance Parallel Interface)、SCSI等。FC并沒有它自己的指令集,而僅僅是用來實現在各個FC設備間傳輸數據。同時,FC并不如它的名字所說局限于用光纖作為其傳輸介質,事實上它允許采用廉價的銅纜(比如雙絞線或者同軸線)按照協議規范來傳輸(當然此時傳輸的是電信號)。總之,它是一種規范而非實現的定義。
  FC的諸多優點是有目共睹的。它可以有高達100MB/s的傳輸速度,可以支持多達16兆個設備,傳輸距離可大于一萬米。對多種拓撲結構的支持使它有很好的靈活性,應用范圍廣闊,結構簡單(串行纜線,沒有端結器,能夠自動分配ID),內置的校驗算法使之格外可靠,而對眾多協議的支持使它的集成尤為容易。
  FC支持的數據包的長度是可變的,從0字節到2048字節。這使它特別適用于象數據庫那樣IO塊較小的應用。同時由于它所引入的額外數據并不多,使之也能很好地用于象視頻這樣的場合。
  FC支持多種拓撲結構,包括點對點結構,仲裁環結構和交換式結構。當用FC來架構存儲系統時,一般采用的是仲裁環式的拓撲結構。因此這里有必要了解一下仲裁環拓撲結構。
  仲裁環(AL)結構如圖3所示,它最多可以菊花鏈的方式支持達127個端口。在這種結構下,數據在這條鏈上從一個設備傳送到下一個相鄰設備。AL上的每個端口被標識為NL端口,在一個鏈中同一時刻只能有兩個當前活動端口,而其它的端口只是為中繼器簡單地將信號傳送到下一個端口。這就是說100MB/s的傳輸速度實際上為環上的所有設備所共享的。和令牌環一樣,環上的所有端口檢測經過自己的所有消息,留取屬于自己的部分,然后將所有不屬于自己的消息傳遞給下一個端口。


  FC-AL的RAID控制卡一般采用單端口控制卡或雙端口控制卡的形式。前者提供了一條光纖通道,而后者采用雙通道的形式來提高數據傳輸的可靠性。圖4、圖5依次給出了單端口和雙端口控制卡掛接磁盤存儲器的基本框圖。


  單端口系統成本較低,但是由于它只由單環組成,因而可靠性不高。當纜線或其它連接構件出現故障時,FC控制卡就不能正常地與FC磁盤進行通信。雙端口控制卡的結構在一定程度上減少了這種不可靠。由下圖可見,在一條纜線出現故障時,雙環結構允許用另一條纜線進行所有通信,從而增加了系統的可靠性。
  FC硬盤驅動器使用40針的SCA接口,這使之可以無需轉換就能直接插入配有SCA插槽的外置式硬盤籠子中。但是SCA接口又使得FC硬盤無法直接掛接到FC控制卡上,而必須通過一個專用的FC-SCA到DB9的適配器進行接口轉換。
  FC硬盤的籠子并不僅僅簡單地提供一個固定FC硬盤的框架,同時它在一定程度上提供了功率和溫度的控制。對于那些提供熱插拔功能的硬盤籠子,內置有端口旁路電路,用來在環路上的某個硬盤出現故障時將此硬盤旁路,從而保證整個環路仍然暢通。
  為了向某些應用提供最高的數據安全,一些硬盤籠子上配備有兩條完全獨立的環路,以備在一條通路出現故障時系統能夠照常運作。同時高檔的硬盤籠子必須提供一個管理接口用來和主機進行控制信息的通信,如向主機報告風扇和電源故障,以及當主機檢測到有一硬盤出現用指示燈標識此硬盤。由于通常情況下每個FC存儲設備間的距離不是很大,因而在此類系統中一般采用銅纜,如屏蔽雙絞線,代替昂貴的光纜來作為傳輸介質。利用銅纜在100MB/s的碼率下可以達到25m的傳輸距離。
  如果各個FC存儲設備間距超過了25m,則應用光纖替代銅纜作為傳輸介質。在上述碼率下,采用62.5μm的多模光纖傳輸距離可達175m,用50μm多模光纖傳輸距離可達500m,而用9μm的單模光纖更可以將傳輸距離增至10km。為了采用光纖作為傳輸介質,FC控制卡和硬盤籠子必須配置有MIA(Media Interface Adapter)來實現光電信號的轉換。
2 RAID應用中應注意的一些方面
  RAID的一個很誘人的特點是它能將數據同時分散到數個磁盤中進行讀寫,從而可以幾倍于單一磁盤的速度進行數據傳輸。由于FC-AL能夠輕而易舉地將傳輸速度提高至100Mbyte/s,而Ultra 2 SCSI的峰值傳輸速度也可以達到80MB/s,Ultra Wide SCSI-3的數據傳輸速度則為40MB/s。與這些速度相比,實際物理硬盤的讀寫速度則要慢的多了。7200轉的Ultra Wide SCSI-3讀寫速度只有不到10MB/s。為了進一步提高速度,制造商們費力地加快磁盤轉速,并且為針對RAID應用制造了轉速高達10000轉的磁盤,但其讀寫速度仍然只能達到12MB/s。同時,伴隨高轉速而來的諸如功耗,散熱等問題不可避免地導致了制造成本的大幅度提高,使速度上的突破相對成本來說似乎有些得不償失。這就不難解釋為什么在大多數應用方案中用戶都盡可能多地在陣列控制卡上掛接磁盤,以求最大限度的利用總線帶寬了。
  但是增加磁盤的速度并不能無限制地增大傳輸速度。以Ultra Wide SCSI-3為例,理論上在掛接了4個7200轉的硬盤后總線帶寬就已經飽和了。此時總線帶寬就成為了整個IO系統的瓶頸。為了進一步提高傳輸速度,不少硬件RAID控制卡提供了同時利用多條內部SCSI總線的方法來增加傳輸帶寬。
  在對傳輸速度需要求進行精確估計的時候,除了上面所說的一些數據外還需考慮IO塊大小以及傳輸SCSI指令所需額外帶寬的因素。通常情況下傳輸1M的數據,需要傳送大約320K的SCSI指令數據。仍以上面所說的Ultra Wide SCSI-3為例,在理想情況下,如果每個Ultra Wide SCSI-3硬盤以10MB/s的速度進行讀寫,那么在掛接3個硬盤時,SCSI指令所引入的額外數據將達到30MB/s×320K=9.6MB/s,也就是說在掛接3個硬盤時,總線帶寬就已經飽和了。雖然在同步突發傳輸方式下,指令數據比較明顯地下降,但是由于多數應用并不是持續地工作在突發方式,因此在傳輸速度要求很高的情況下,這種額外數據的引入對傳輸速度的影響是不容忽視的。FC-AL采用了一種特殊的處理方法,它在傳輸SCSI指令時首先將所有的指令打成一個包,將此包在數據傳輸開始前進行傳送。通過這種處理,很大程度地壓縮了指令的額外數據,從而可以使其總線上的持續傳輸速度達到90MB/s。
  RAID系統處理數據傳輸的時間可以分為以下三部分:操作系統產生IO請求包的時間,RAID控制卡及磁盤驅動器處理IO請求的時間以及磁盤用于實際讀寫數據塊的時間。和前兩個速度相比較,磁盤的實際讀寫速度成為了瓶頸。為了提高系統的性能,一般的RAID控制器上都配有大量的緩存用來暫時轉儲數據。由于RAID控制卡能快速地將CPU要寫的數據首先存儲到緩存中作為過渡,因此大幅度地減少了在寫盤過程中消耗的CPU資源。而新一代的智能型控制卡更有超前讀的緩存,使讀盤時的CPU資源也在一定程度上得到了節約。因此在選擇存儲設備時,用戶也應根據自己的應用確認系統所應采用的緩存策略。
3 用戶選購RAID系統時的誤區
  在各RAID生產、銷售商大張旗鼓地鼓吹各自產品傳輸速度的今天,大家似乎都忘了RAID的另一個重要角色:通過數據冗余來實現對關鍵數據的保護。傳輸速度成為各家公司推銷其產品的叫賣點,這造成了不少用戶不從自身應用的特殊性(例如應用中數據的可靠性要求,平均IO的數據塊大小以及設備的軟件支持)考慮,在購買RAID系統時盲目地追求廠商的標稱傳輸速度。
  事實上,由于應用的差異,不可能存在一種對所有應用而言都是最優的方案。用戶在購買RAID系統時,應該從自己的應用出發,通過分析實際的IO負載和主機配置對應用有一個清楚的認識。這就意味著用戶必須了解應用中典型IO塊的大小,對數據容錯性能的要求確定自己所應采用的RAID級別。同時根據所需要達到的峰值速度以及平均速度,數據共享等一系列指標,在考慮到各個RAID生產廠商在對系統定義上的差異(如有些廠商使用每秒能進行的IO請求數而不是用MB/s來衡量系統速度,有些廠商對RAID級別的定義又有可能和工業標準不通等等)下,通過仔細的分析和市場調研來決定最后的解決方案。
參考文獻
1 Andreas Koepf.Fibre Channel Technology.USA:ICP Cor-poration,1998
2 Andreas Koepf.New Mass Storage Interfaces:Ultra 2SCSI and Fibre Channel.USA:ICP Corporation,1999
3 Brian R. Sorby.Throughput And I/O's Within RAID Applications.USA:Computer Technology Review
4 David A. Patterson,Garth Gibson,et al. A Case for Redundant Arrays of Inexpensive Disks (RAID).USA:University of California Berkeley,1987
5 David N.Reilly.New Technologies Put More Intelligence on RAID Controllers.Computer Technology Review.July 1997
6 Eric Ridedel,Catharine Van Ingen,Jim Gray.A Perfor-mance Study of Sequential IO on Windows NTTM 4.0.USA:Microsoft Research,September 1997
7 Grey P.Schulz.New Storage Interfaces.USA:Computer Technology Review,July 1997
8 Greg P. Schulz.SSA and Fibre Channel-Myths and Realities.USA:Computer Technology Review.August 1997
9 Greg P. Schulz.Fibre Channel and Storage Area Net-works.USA:Computer Technology Review.October 1999
10 Jim Gray.Prashant Shenoy.Rules of Thumb in Data Engineering.USA:Microsoft Research,February 2000
11 Stephen Ferrari.PCI-to-SCSI RAID vs SCSI-to-SCSI RAID - An Application Discussion.USA:Computer Technology Review,June 1999
12 Serial Storage Architecture - A High-Performance Open Storage Interface.IBM WWW, 1997
13 RAID definitions.Adjile Systems WWW

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 亚洲成人国产 | 国产中文字幕久久 | 成人亚洲欧美日韩中文字幕 | 五月天综合视频 | 免费一级毛片不卡不收费 | 日韩精品中文字幕久久 | 善良的嫂子3在线 | 亚洲国产精品综合久久 | 日韩免费视频一区二区 | 久久精品日日躁夜夜躁欧美 | 奇米在线影视 | 黄色大片影院视频免费 | 一级片在线视频 | 激情综合激情 | a级免费视频 | 婷婷在线视频 | 成人午夜看片 | 99视频在线免费看 | 六月色播 | 五月天综合婷婷 | 欧美日韩色视频 | 亚洲精品影院久久久久久 | 国产不卡的一区二区三区四区 | 福利网在线 | 四虎免费观看 | 99热这里只有精品国产动漫 | 成人久久久久 | 彬彬来了免费观看完整版 | 五月天婷婷基地 | 日日操人人 | 精品国产免费人成高清 | 色婷婷综合欧美成人 | 夜久久 | 国产中文字幕第一页 | 成人久久免费视频 | 国产区在线观看视频 | 深爱婷婷网 | 国产99精品在线观看 | 99在线免费视频 | 全国男人的天堂网站 | 久久亚洲国产午夜精品理论片 |