近年來(lái),隨著(zhù)互聯(lián)網(wǎng)、大模型、IoT等技術(shù)的發(fā)展,相關(guān)應用的規模也迅速增長(cháng),由此產(chǎn)生了大量數據存儲和處理需求。據估計【1】,2023年全世界產(chǎn)生了147 ZB數據,到2025年這個(gè)數字將變成181 ZB。不僅數據量快速增長(cháng),大模型、HPC等應用對性能要求也很高,傳統大容量HDD無(wú)法滿(mǎn)足。在此背景下,2024年大容量QLC SSD的市場(chǎng)份額得到了快速增長(cháng)。
本期開(kāi)始我們將分為三期圍繞QLC SSD的優(yōu)缺點(diǎn)、應用收益、設計難點(diǎn),以及適用場(chǎng)景等方面展開(kāi)討論。
本文選取了兩個(gè)有代表性的QLC SSD和TLC SSD盤(pán)片進(jìn)行對比【1,2】。
QLC SSD的單盤(pán)最大容量為61.44TB,而典型TLC SSD的最大容量為7.68TB。存儲相同數據量,QLC SSD占用更少的機架空間。在單盤(pán)故障的情況下,QLC SSD的影響范圍也更大。因此,QLC SSD更適合用在具有多盤(pán)之間數據冗余保護的系統中,如全閃陣列、全閃分布式存儲等。在這樣的系統中,單盤(pán)失效不會(huì )導致整個(gè)系統業(yè)務(wù)斷供。
◎圖1:典型QLC SSD與TLC SSD對比
盡管QLC SSD的單盤(pán)功耗更大,但由于其單盤(pán)容量更大,因此QLC SSD每個(gè)TB的平均功耗更小。典型QLC SSD平均每TB功耗為0.2W,而TLC SSD平均每TB的功耗為1.1W。按照一臺服務(wù)器配置12片SSD、服務(wù)器(不含SSD)功耗500W計算,QLC SSD的整系統每TB功耗是0.9W,而TLC SSD為6.5W,兩者之間相差懸殊。
QLC在每個(gè)cell中存儲4 bits信息,相比TLC的信息存儲密度更高。但是QLC的擦寫(xiě)次數相對TLC更少,這導致QLC SSD的耐久性比TLC SSD差一些。典型QLC SSD的DWPD值為0.58,而TLC SSD的DWPD為1,相差并不懸殊。
大尺寸順序讀寫(xiě)請求的性能與小尺寸(4KB)隨機讀性能,QLC SSD與TLC SSD均基本持平。
4KB隨機寫(xiě)性能,QLC SSD只有TLC SSD的五分之一左右。QLC SSD只有38K IOPS,而TLC SSD達到了200K IOPS。下一期將詳細解釋造成這種差異的原因。
從以上對比可以看出,大容量QLC SSD特別適合數據量大、存儲成本敏感、性能要求高、且讀多寫(xiě)少的場(chǎng)景。
◎圖2:典型QLC SSD與HDD對比
如圖2所示,與QLC SSD相比,HDD的最大容量小很多。HDD的順序讀寫(xiě)和隨機讀寫(xiě)性能與QLC SDD相比都差很多。HDD的單盤(pán)功耗小一些,但是每TB平均功耗比QLC SSD差很多。
雖然HDD沒(méi)有每日寫(xiě)入數據量(DWPD)這個(gè)指標,但是HDD有一個(gè)workloads rate指標,例如Ultrastar? DC HC560的workloads指標是每年最多550TB。如果讀出和寫(xiě)入的數據量超出workloads值,那么HDD的性能會(huì )降低,并且可靠性指標年故障率(AFR)也會(huì )上升。如果把workloads視為DWPD,那么這款HDD的DWPD只有0.075,這與QLC SSD的0.58相差很大。
與HDD相比,QLC SSD每TB價(jià)格高,QLC SSD另外一個(gè)短板是數據保持時(shí)間短一些,斷電之后QLC SSD的數據可靠保持三個(gè)月左右,超過(guò)三個(gè)月就有數據丟失風(fēng)險。如果不斷電,而是讓QLC SSD一直處于帶電空閑狀態(tài),則沒(méi)有數據丟失風(fēng)險。
未來(lái)在很長(cháng)一段時(shí)間內,HDD在每TB采購價(jià)格上仍然顯著(zhù)優(yōu)于QLC SSD。但是,QLC SSD的每TB功耗更低,在很多應用場(chǎng)景中,QLC SSD的總體擁有成本比HDD更低,下面以一個(gè)100PB對象存儲系統為例來(lái)說(shuō)明。
對象存儲用來(lái)保存圖片、視頻等數據,數據量特別大,對性能要求不高,對存儲成本要求比較苛刻。因此,現在大多數對象存儲是基于HDD的,或者用少量SSD做緩存,完整數據存儲在HDD上。
由于對象存儲的易用性和可擴展性很好,公有云上對象存儲價(jià)格比塊存儲便宜很多,越來(lái)越多上層應用把數據保存在對象存儲中。例如,很多公有云上的在線(xiàn)分析型(OLAP)數據庫的數據就保存在對象存儲中。因此,未來(lái)勢必會(huì )對對象存儲提出更高的性能要求,除了順序訪(fǎng)問(wèn)的吞吐量要求之外,還會(huì )提出更高的IOPS要求。
下圖是一個(gè)100PB的對象存儲系統,使用不同硬盤(pán)來(lái)構建,其結果差異很大。其中三種硬盤(pán)分別是3.5寸20TB HDD、61.44TB QLC SSD、7.68TB的TLC SSD??梢?jiàn)使用QLC SSD的對象存儲系統所需的服務(wù)器數量、機架數量都更少,能耗也更低,性能卻高很多。隨著(zhù)價(jià)格逐漸降低,高密度QLC SSD將會(huì )逐漸進(jìn)入對象存儲系統,逐步替代HDD。
◎圖3:100PB對象存儲系統使用不同盤(pán)的情況對比
利用硬盤(pán)模擬磁帶機的在線(xiàn)備份系統,寫(xiě)入數據量大,對存儲空間成本要求苛刻。傳統觀(guān)念認為,在線(xiàn)備份只能使用HDD,SSD無(wú)法滿(mǎn)足成本要求。但是,大容量QLC SSD成本下降到一定程度時(shí),會(huì )在大部分在線(xiàn)備份系統中替代HDD。
◎圖4:100PB對象存儲系統用不同盤(pán)的機架數量對比
研究表明【4】,在一個(gè)10PB存儲容量的大模型應用環(huán)境中,相較于 HDD 和 TLC SSD 混合系統,完全采用 QLC SSD 的系統在能耗效率方面優(yōu)勢顯著(zhù),足足高出 79.5%。
綜上對比,QLC SSD、TLC SSD以及HDD三種盤(pán)型中,QLC SSD在單TB上的平均功耗更小、存儲密度更高,在對象存儲等系統中總TCO更低,這些都將推動(dòng)存儲的更新?lián)Q代。
參考鏈接:
1.https://explodingtopics.com/blog/data-generated-per-day
2.https://www.solidigmtech.com.cn/products/technology/d5-p5336-product-brief.html
3.https://download.semiconductor.samsung.com/resources/data-sheet/Samsung_SSD_PM9A3_Data_Sheet_Rev1.0.pdf
4.https://signal65.com/wp-content/uploads/2024/12/Solidigm-100MW_Signal65-Insights.pdf
地址:深圳市南山區記憶科技后海中心B座19樓
電話(huà):0755-2681 3300
郵箱:support@unionmem.com