

企業(yè)級SSD(Solid State Drive)是基于閃存技術(shù)的高性能、高可靠性的固態(tài)硬盤,專為滿足企業(yè)級應(yīng)用場景的需求而設(shè)計。為了滿足各種高速數(shù)據(jù)處理和可靠性要求較高的應(yīng)用場景,企業(yè)級SSD在設(shè)計和制造過程中通常考慮的關(guān)鍵因素有高性能、高可靠性、可維護(hù)性、高安全性等。
領(lǐng)先的功能性和加速性
云化、虛擬化等技術(shù)趨勢的持續(xù)演進(jìn)對存儲設(shè)備在內(nèi)的IT基礎(chǔ)設(shè)施,在性能以及靈活性方面提出更高的要求。對于SSD而言,要確保功能性與加速優(yōu)化的領(lǐng)先,需要關(guān)注一些重點指標(biāo)和特性,常見的包括:
1.多命名空間:將閃存空間劃分成若干個獨(dú)立的邏輯存儲空間,可實現(xiàn)資源利用率的提升、性能隔離、數(shù)據(jù)安全以及帶寬控制等目的,大幅提高SSD的靈活性。
2.單根I/O 虛擬化(SR-IOV):是一種將PCIe物理硬件資源共享給虛擬機(jī)的標(biāo)準(zhǔn),是基于硬件的虛擬化方案。SR-IOV可將單個物理設(shè)備虛擬出多個PCIe設(shè)備,從虛擬機(jī)環(huán)境即可直接訪問硬件,提高I/O性能。與其他功能相結(jié)合,可進(jìn)一步實現(xiàn)數(shù)據(jù)隔離以及QoS性能保障等目標(biāo)。
3.TRIM操作:操作系統(tǒng)通過TRIM命令通知SSD無效數(shù)據(jù)所在地址,減少后續(xù)寫入操作所產(chǎn)生的垃圾數(shù)據(jù),提高垃圾回收時的效率,以及提高SSD的讀寫速度和壽命。
4.多流技術(shù):SSD根據(jù)上層主機(jī)提供的Stream ID進(jìn)行冷熱數(shù)據(jù)的識別,將具有相同或相似生命周期的數(shù)據(jù)寫入到相同的擦除單元中。通過對寫入操作的優(yōu)化,有效降低寫放大系數(shù),提高SSD的性能和耐用性。
豐富的可維護(hù)性
隨著存儲方案的不斷豐富和升級,諸如超融合方案這樣要求全天候服務(wù)的情況越來越普遍。在這樣的系統(tǒng)中,對軟件和硬件的監(jiān)控以及集群業(yè)務(wù)的日常運(yùn)維是非常關(guān)鍵的工作。當(dāng)存儲節(jié)點或SSD硬盤發(fā)生故障時,可能會對整個集群的業(yè)務(wù)產(chǎn)生影響,導(dǎo)致性能下降甚至業(yè)務(wù)中斷。因此,SSD硬盤的可維護(hù)性對于維持集群的高性能和穩(wěn)定運(yùn)行至關(guān)重要,典型功能包括:
1. 健康監(jiān)控:通過標(biāo)準(zhǔn)的管理接口獲取健康監(jiān)控信息,用戶可了解SSD狀態(tài)以及預(yù)測可能出現(xiàn)的問題。健康監(jiān)控可以記錄SSD的溫度、使用時間、讀寫次數(shù)、壞塊數(shù)量等參數(shù),并提供智能報警和建議。
2. 帶外管理:當(dāng)服務(wù)器廠商不具備上層應(yīng)用程序的接管權(quán)限時,管理員可借助帶外管理(Out-of-Band Management)實現(xiàn)遠(yuǎn)程維護(hù)、巡檢硬盤等操作。
3. 熱插拔:企業(yè)級SSD可借助電容提供的備用電源,在主機(jī)電源故障、暴力熱插拔、或外部供電中斷等情況下,確保數(shù)據(jù)被正確地寫入閃存存儲介質(zhì)。
4. 后臺巡檢:NAND特性受電磁隧道效應(yīng)影響,下電時有逃逸風(fēng)險,帶電時有讀寫干擾,經(jīng)過長時間的運(yùn)行,盤內(nèi)數(shù)據(jù)可能發(fā)生偏移。系統(tǒng)可提供全盤巡檢,并根據(jù)偏移量采取數(shù)據(jù)搬遷恢復(fù)等策略,以保證SSD離電后數(shù)據(jù)仍然可以保存一定的天數(shù)。
5. 在線診斷:當(dāng)SSD出現(xiàn)下電失敗或呈現(xiàn)只讀狀態(tài)時,在線診斷功能可以提供修復(fù)建議,減少用戶不必要的線下插拔盤操作,降低故障恢復(fù)成本。
完備的可靠性
在常見的云場景下,用戶數(shù)據(jù)傳輸路徑愈發(fā)復(fù)雜,數(shù)據(jù)在經(jīng)歷多個部件和軟件流程后,都有可能在中間環(huán)節(jié)出現(xiàn)錯誤而導(dǎo)致SSD存儲數(shù)據(jù)的錯誤。由此可見,存儲設(shè)備可靠性的提升對于數(shù)據(jù)的保護(hù)尤為重要。
1. 端到端數(shù)據(jù)保護(hù):在數(shù)據(jù)流經(jīng)的每個環(huán)節(jié)都提供相應(yīng)的保護(hù)機(jī)制,例如在PCIe接口、SSD控制器、閃存接口等位置,各段的傳輸路徑都提供糾錯或檢錯算法,降低數(shù)據(jù)出錯的概率和風(fēng)險。這種保護(hù)也叫全路徑端到端數(shù)據(jù)保護(hù)能力,可以通過不可修復(fù)錯誤率(Uncorrectable Bit Error Rate,簡稱UBER)進(jìn)行量化。
2. DIF/DIX特性:數(shù)據(jù)讀寫、存儲、傳輸過程中出現(xiàn)比特跳變但系統(tǒng)未檢測到,將造成靜默數(shù)據(jù)錯誤,其中,F(xiàn)PGA發(fā)生比特跳變的錯誤高于ASCI。NVMe借助在SSD控制器內(nèi)添加保護(hù)信息PI(Protection Information)完成數(shù)據(jù)一致性的檢驗。PI可支持DIF(Data Integrity Field)和DIX(Data Integrity Extensions)兩種數(shù)據(jù)保護(hù)機(jī)制。其中,DIF保證HBA、陣列和硬盤的數(shù)據(jù)完整性,而DIX保證應(yīng)用、主機(jī)系統(tǒng)、HBA卡的數(shù)據(jù)完整性。若PI與數(shù)據(jù)通路上的檢驗點不匹配,則系統(tǒng)采用重讀、重試等機(jī)制校驗數(shù)據(jù)。
3. 掉電保護(hù):企業(yè)級SSD一般采用額外的電容作為備電,當(dāng)主機(jī)服務(wù)器電源異常時,備電可以保障硬盤通過完整的下電流程,將SSD緩存中的元數(shù)據(jù)、客戶業(yè)務(wù)數(shù)據(jù)等保存到硬盤,避免數(shù)據(jù)丟失甚至硬盤故障。
憶聯(lián)提供高價值關(guān)鍵特性
憶聯(lián)作為面向全領(lǐng)域、全生態(tài)的固態(tài)存儲產(chǎn)品提供商,其面向企業(yè)核心業(yè)務(wù)場景的企業(yè)級SSD(簡稱ESSD)提供了豐富的高價值特性,圍繞功能性、加速性、可維護(hù)、可靠性等諸多方面全面支撐企業(yè)的業(yè)務(wù)場景。
圖為憶聯(lián)ESSD UH811a和UH831a,采用自研主控,支持PCIe Gen 4高速接口和NVMe 1.4標(biāo)準(zhǔn)協(xié)議,提供卓越的企業(yè)級可靠性和性能
以數(shù)據(jù)保護(hù)為例,憶聯(lián)將保障用戶數(shù)據(jù)安全角度作為產(chǎn)品的核心基礎(chǔ),提供從應(yīng)用層軟件到主機(jī)系統(tǒng)、SSD控制器、DDR、以及NAND閃存數(shù)據(jù)的全路徑保護(hù),確保數(shù)據(jù)在整條通路里的安全存儲和安全傳輸,且提供優(yōu)于業(yè)界一個數(shù)量級的UBER。
路徑保護(hù)具體包括:
? 盤內(nèi)所有寄存器cache和buffer實現(xiàn)100% ECC占用保護(hù);
? DDR總線和器件配置獨(dú)立的ECC顆粒,支持1比特糾錯、2比特告警;
? 憶聯(lián)自有SAP智能算法,提升flash命中率,閃存生命周期內(nèi)命中失敗率可控制在百萬分之一,降低讀取誤碼率;
? SSD盤片實現(xiàn)單RAID保護(hù)。
此外,在加速性和可維護(hù)性等方面,憶聯(lián)也提供業(yè)內(nèi)領(lǐng)先的指標(biāo),包括從512到4K的多種靈活可配置扇區(qū)格式、最大可支持64個namespace等,滿足客戶多層次的需求。
在企業(yè)級業(yè)務(wù)場景不斷豐富、要求不斷提升的情況下,憶聯(lián)ESSD深挖客戶真實需求,提供更多高價值的特性,依托高性能、低延遲、高可靠性且各具差異化競爭力的產(chǎn)品,持續(xù)助力客戶業(yè)務(wù)增長。
地址:深圳市南山區(qū)記憶科技后海中心B座19樓
電話:0755-2681 3300
郵箱:support@unionmem.com
