海量數據存儲
GS9200系列分(fēn)布式存儲采用(yòng)存儲服務(wù)器集群的方式來滿足海量數據的存儲需求,大量的存儲服務(wù)器構成的一個分(fēn)布式的虛拟化存儲池,能(néng)夠為(wèi)應用(yòng)提供單卷EB級别的存儲容量。所有(yǒu)的應用(yòng)客戶端都可(kě)以共享訪問虛拟化存儲池中(zhōng)的數據,能(néng)夠很(hěn)好的保證應用(yòng)系統數據的一緻性,且存儲池中(zhōng)的資源可(kě)以按照應用(yòng)性能(néng)和容量需求進行動态的彈性分(fēn)配。
海量文(wén)件高效檢索
應用(yòng)平台中(zhōng),大量應用(yòng)的持續運行會産(chǎn)生海量的數據,海量的數據不僅僅意味着容量的增長(cháng),也會帶來大量的文(wén)件數量增長(cháng)。為(wèi)了滿足應用(yòng)平台的長(cháng)期發展,集群存儲系統必須要能(néng)夠高效存儲管理(lǐ)足夠多(duō)的文(wén)件數量。集群存儲系統采用(yòng)元數據服務(wù)器集群的方式來滿足海量文(wén)件數量的存儲需求以及海量文(wén)件數量帶來的元數據性能(néng)需求,可(kě)支撐單卷2千億以上文(wén)件的快速檢索需求。
元數據服務(wù)器集群中(zhōng),元數據最大可(kě)擴展至128台,采用(yòng)兩兩互備的形式提供訪問,且集群中(zhōng)所有(yǒu)的元數據服務(wù)器都是對等的,元數據均衡地存放在所有(yǒu)的元數據服務(wù)器中(zhōng)。完全對等的元數據服務(wù)器集群架構使得每台元數據服務(wù)器都能(néng)夠同時提供服務(wù),突破了傳統單元數據服務(wù)器架構對文(wén)件數量的限制以及存儲服務(wù)能(néng)力的限制。
在元數據服務(wù)器中(zhōng),所有(yǒu)的元數據都是存放在永久性存儲區(qū)中(zhōng),隻有(yǒu)頻繁訪問的活躍性元數據才會在緩存中(zhōng)駐留,所有(yǒu)的元數據内容更新(xīn)都會及時地刷新(xīn)到永久性存儲區(qū)中(zhōng)。上述的元數據存儲方式在滿足元數據服務(wù)器單元數據存儲能(néng)力的同時也提高了單個元數據服務(wù)器的服務(wù)能(néng)力,即使整個平台突然斷電(diàn)也不會發生數據的丢失,甚至從而導緻整個存儲平台的崩潰。
元數據服務(wù)器集群是以内置的負載均衡機制來共同維護一個統一的名(míng)字空間,元數據的存儲負載和訪問負載都均勻地分(fēn)布到各個元數據服務(wù)器上。元數據集群之上存在一個虛拟層,客戶端在訪問時可(kě)通過此虛拟層确定元數據存在于那台物(wù)理(lǐ)元數據節點上,所有(yǒu)元數據訪問一步定位,無須中(zhōng)間代理(lǐ)轉發。
高并發訪問
在數據讀取的過程中(zhōng),元數據信息是采用(yòng)随機讀取的形式進行的,數據信息是采用(yòng)順序讀取的形式進行,當高并發訪問時,随機讀取與順序讀取的同時進行會對服務(wù)器以至于整個文(wén)件系統造成很(hěn)大的壓力,造成并發訪問性能(néng)低下。
GS9200文(wén)件系統是采用(yòng)數據通道與元數據通道分(fēn)離的形式實現,且元數據服務(wù)器與數據存儲服務(wù)器可(kě)動态進行擴容,從而加大元數據服務(wù)器檢索能(néng)力,與數據傳輸的性能(néng),也就是說在高并發訪問情況發生時,元數據服務(wù)器可(kě)迅速的檢索到數據元數據信息,然後讓數據存儲端與訪問端直接建立數據通道,進行并發數據讀取,從而提升高并發訪問效率。
GS9200的元數據可(kě)根據元數據服務(wù)器内存大小(xiǎo)将熱點的元數據盡量多(duō)地駐留在内存中(zhōng),提升元數據訪問的效率,同時得益于現在固态硬盤的發展,元數據在緩存中(zhōng)不命中(zhōng)的情況下也可(kě)以極高的帶寬提供元數據查詢服務(wù)。
實際應用(yòng)中(zhōng),十台元數據服務(wù)器的吞吐率可(kě)超過數十萬文(wén)件/秒(miǎo),且此值不是元數據極限值,隻是根據應用(yòng)實際環境得到的一個檢測時的最高值。
高數據讀寫性能(néng)
整個集群存儲系統是一個帶外模式的IO訪問架構,客戶端訪問存儲系統模型如下圖所示,數據通道和元數據通道完全分(fēn)開,所有(yǒu)的數據讀寫都直接在Client(客戶端)和iStore(存儲服務(wù)器)之間進行,整個IO架構不存在任何單點性能(néng)限制。
存儲服務(wù)器集群中(zhōng)所有(yǒu)的存儲服務(wù)器都同時提供IO服務(wù),能(néng)夠向應用(yòng)服務(wù)器提供GByte/s級的聚合IO帶寬,能(néng)夠滿足雲計算平台中(zhōng)大量的應用(yòng)服務(wù)器同時訪問存儲系統帶來的性能(néng)需求。
集群存儲系統的雙集群模式(元數據服務(wù)器集群和存儲服務(wù)器集群)使得整個存儲平台在架構上沒有(yǒu)任何性能(néng)瓶頸,能(néng)夠提供超過100GByte/s的聚合IO帶寬以及1000萬次以上的IOPS(每秒(miǎo)讀寫次數)。
動态在線(xiàn)擴展
集群存儲系統中(zhōng)的元數據服務(wù)器集群和存儲服務(wù)器集群都可(kě)以在線(xiàn)動态擴展。
存儲服務(wù)器集群的擴展包括存儲服務(wù)器數量和存儲服務(wù)器中(zhōng)磁盤數量的擴展,存儲服務(wù)器集群的擴展帶來的是容量上的增長(cháng),在擴展過程中(zhōng)無需中(zhōng)斷存儲系統上應用(yòng)的運行,擴展的容量即插即用(yòng)。而且随着存儲服務(wù)器數量的增多(duō),整套集群存儲系統的聚合帶寬也會線(xiàn)性的增長(cháng)。
元數據服務(wù)器集群的擴展帶來的是文(wén)件數量存儲能(néng)力的增長(cháng),整個擴展過程對整個應用(yòng)平台完全透明,擴展的元數據服務(wù)器即刻能(néng)夠提供服務(wù),前端應用(yòng)無需進行任何配置。随着元數據服務(wù)器數量的增多(duō),整套集群存儲系統所提供的元數據服務(wù)能(néng)力也會呈線(xiàn)性增長(cháng),能(néng)夠管理(lǐ)的文(wén)件總個數也線(xiàn)性增加。
高可(kě)靠性
在集群存儲系統設計中(zhōng),假設任何硬件設備都是不可(kě)靠的,集群存儲系統的可(kě)靠性不依賴任何硬件設備來實現,在集群存儲系統中(zhōng)任何元數據服務(wù)器、存儲服務(wù)器、磁盤以及網絡設備的失效都不影響集群存儲系統的穩定運行。
數據動态遷移
随着應用(yòng)平台的持續運行和擴展,集群存儲系統也需要進行不斷的擴展。擴展帶來了一個問題,新(xīn)添加的存儲服務(wù)器中(zhōng)沒有(yǒu)任何的數據,而原有(yǒu)的存儲服務(wù)器空間利用(yòng)率卻維持在一個較高的狀态,此時集群存儲系統隻能(néng)在新(xīn)添加的存儲服務(wù)器上為(wèi)數據分(fēn)配空間,從而導緻整個集群存儲系統的寫入性能(néng)不能(néng)得到有(yǒu)效提升。為(wèi)此需要在系統擴容後可(kě)以将原有(yǒu)存儲服務(wù)器上的一部分(fēn)數據動态的遷移到新(xīn)添加的存儲服務(wù)器中(zhōng),直到整個存儲服務(wù)器集群的空間利用(yòng)率都達到一個相同的狀态。
在進行數據動态遷移過程中(zhōng)前端應用(yòng)無需停止服務(wù),而且數據動态遷移過程對前端的應用(yòng)服務(wù)器是完全透明的,從而在擴容的同時也提高了整個平台的IO效率。數據動态遷移過程可(kě)以随時中(zhōng)斷,用(yòng)戶可(kě)以在前端應用(yòng)負載較高的情況下将數據遷移過程停止,在合适的時間重新(xīn)啓動數據動态遷移任務(wù),數據動态遷移任務(wù)将繼續進行。
數據動态遷移的實現還帶來一個好處,存儲系統可(kě)以籍此替換老舊的過保硬件。管理(lǐ)員可(kě)以将一台存儲服務(wù)器上的數據動态遷移到剩餘的完好存儲服務(wù)器上,在數據遷移完成之後即可(kě)在集群存儲系統中(zhōng)删除此存儲服務(wù)器。借助數據動态遷移功能(néng)集群存儲系統可(kě)以有(yǒu)效安(ān)全的撤除老舊設備,從而在線(xiàn)更新(xīn)集群存儲系統中(zhōng)的所有(yǒu)的硬件。從上述可(kě)以得到,集群存儲系統可(kě)以确保雲存儲系統持續不斷地運行下去,并進行自我更新(xīn),實現可(kě)伸縮性綠色節能(néng)。
數據隔離與交互
存儲平台是一個公(gōng)共的服務(wù)平台,存儲系統需要在共享訪問的基礎上減少不同應用(yòng)之間的相互幹擾。在這裏,GS9200系列分(fēn)布式存儲可(kě)以讓不同的應用(yòng)挂載到集群存儲系統中(zhōng)不同的子目錄下,這樣既滿足了同一應用(yòng)不同服務(wù)器之間的共享訪問需求,又(yòu)隔離了不同應用(yòng)的數據。這樣的數據隔離是邏輯上的隔離,各應用(yòng)在相互隔離的情況下還能(néng)夠共享集群存儲系統的剩餘空間和整體(tǐ)IO性能(néng),無需将集群存儲系統像SAN系統那樣分(fēn)割成多(duō)個小(xiǎo)塊,在滿足需求的同時也簡化了整個存儲平台的管理(lǐ),且linu可(kě)動态的對此目錄進行容量設置。
文(wén)件系統POSI接口兼容
為(wèi)了廣泛支持各種現有(yǒu)的應用(yòng)和方面構建新(xīn)的應用(yòng)系統,GS9200系列分(fēn)布式存儲采用(yòng)POSI接口作(zuò)為(wèi)應用(yòng)訪問接口。POSI接口是一個廣泛應用(yòng)于各個操作(zuò)系統的一個API規範,采用(yòng)POSI接口作(zuò)為(wèi)集群存儲系統的訪問方式能(néng)夠滿足應用(yòng)領域中(zhōng)多(duō)樣化的應用(yòng)系統訪問存儲系統的兼容性。POSI也是一個應用(yòng)廣泛的編程模型,現有(yǒu)的應用(yòng)可(kě)以無縫的遷移到應用(yòng)平台上。
文(wén)件系統和對象存儲互通
GS9200支持提供全面的S3對象存儲接口能(néng)力,同時還支持文(wén)件系統和對象存儲實現數據互通的功能(néng)。
為(wèi)了融合兩種場景,GS9200在對象系統裏面加入了存儲池的概念,對象的存儲池分(fēn)為(wèi)不同的類型(普通、FS),租戶基于存儲池創建bucket,該bucket訪問方式取決于bucket歸屬的存儲池的模式。
業務(wù)和存儲融合運行能(néng)力
GS9200存儲系統具(jù)備在自身的存儲節點之上運行相關業務(wù)系統(比如WebServer、流媒體(tǐ)、高性能(néng)計算、虛拟化)的能(néng)力,實現業務(wù)程序和存儲系統在同一批物(wù)理(lǐ)服務(wù)器中(zhōng)融合運行的模式。
GS9200的融合運行模式能(néng)夠大幅度降低構建成本和日常的運維管理(lǐ)工(gōng)作(zuò)難度,真正實現在擴展計算能(néng)力或者存儲能(néng)力按需擴展。
秒(miǎo)級的快照功能(néng)
GS9200實現了秒(miǎo)級的ROW方式快照,具(jù)有(yǒu)以下幾個特點:
ROW方式的快照,沒有(yǒu)寫放大
對數據寫入性能(néng)沒有(yǒu)影響
支持大量快照并存
基于切片的快照,快照顆粒度小(xiǎo),空間占用(yòng)小(xiǎo)。
快照功能(néng)可(kě)為(wèi)文(wén)件或者卷創建多(duō)達無限數量的基于增量的曆史時間點拷貝。當發生數據“軟”故障,比如軟件程序導緻的數據損壞、病毒破壞、意外删除等,可(kě)以通過對合适的時間點标記進行“回滾”來快速恢複數據。該功能(néng)特别适用(yòng)于關鍵性業務(wù)的連續數據保護。