在語(yǔ)言大模型(LLM)、推理大模型(如DeepSeek)等AI應用爆火的當下,數據存儲和訪(fǎng)問(wèn)速度、模型訓練與推理效率等相關(guān)話(huà)題也逐步升溫,SSD在其中扮演著(zhù)不可或缺的角色。跟隨本欄目,快速了解SSD存儲正在進(jìn)行著(zhù)哪些變革。
上期我們對QLC SSD、TLC SSD以及HDD分別進(jìn)行了優(yōu)勢對比,并得出了成本分析。本期將重點(diǎn)介紹QLC SSD在設計上存在的諸多挑戰及解決之道。
從硬件設計及成本上考慮,高密度QLC SSD存儲容量增加時(shí),其配置的DRAM容量通常不變,這意味著(zhù)盤(pán)內單位扇區(Indirect Unit)會(huì )變大。
例如,標準的4TB TLC 4KB扇區SSD需要配置4GB DRAM來(lái)保存L2P表。對于64TB QLC SSD若其DRAM的配置容量保持不變,則必須使用64KB扇區。此時(shí)如果執行一個(gè)4KB的隨機寫(xiě)IO,則需要執行“讀-改-寫(xiě)”的過(guò)程,這將產(chǎn)生16倍的寫(xiě)放大。而TLC SSD的4KB隨機寫(xiě)則無(wú)此問(wèn)題。
因此,盡管QLC SSD大尺寸連續寫(xiě)性能與TLC SSD持平,但是其4KB隨機寫(xiě)性能遠低于TLC SSD,根源在于其內部扇區更大。
在操作系統下發(fā)給SSD盤(pán)的讀寫(xiě)請求中,尺寸小于4KB的請求較為少見(jiàn),而實(shí)際運行中4KB的讀寫(xiě)請求數量卻不少,主要源于以下幾個(gè)方面:
l 塊設備接口的邏輯扇區(LBA)尺寸是512B或者4KB;
l 主流操作系統的內存頁(yè)面的尺寸設定為4KB;
l 文件系統的空間分配單位通常不小于4KB。
針對這些問(wèn)題,操作系統的內存管理和文件系統正在積極修改,以適應更大的SSD內部扇區尺寸,隨著(zhù)時(shí)間的推移,技術(shù)將逐步演進(jìn)成熟,更好地支撐大型內部扇區。
另外,當前的DWPD測試標準是基于JEDEC JESD218制定的,采用4KB寫(xiě)負載進(jìn)行評估。雖然4KB寫(xiě)負載并不能準確模擬實(shí)際應用中可能出現的各種工作負載,但是DWPD仍然是評估SSD性能的重要指標,因而必須堅持使用統一的測試標準??紤]到QLC SSD的盤(pán)內扇區較大的特性,在這一測試標準下,DWPD測試結果通常會(huì )顯得較為遜色。
解決此類(lèi)現象的思路包括對DWPD測試標準進(jìn)行調整,使用更加適合QLC SSD特性的寫(xiě)負載進(jìn)行評估,或者針對QLC SSD制定專(zhuān)項的測試規范,結合其特有的存儲單元結構和寫(xiě)入機制,以便更準確地反映QLC SSD在不同使用場(chǎng)景下的表現。行業(yè)內的標準化組織也能盡早推動(dòng),形成能夠覆蓋不同NAND類(lèi)型的綜合性測試標準,以體現更公平的性能評估。
目前大容量的SSD普遍采用TLC或QLC NAND,一般會(huì )采用16~32顆NAND FLASH顆粒。顆粒數量的增加會(huì )帶來(lái)整盤(pán)的器件布局、PCB堆疊設計的挑戰。
一般企業(yè)級的SSD,主要器件包括1顆SoC,5-10顆DDR(含ECC),多顆NAND FLASH顆粒,備電電容等。要在有限的空間內實(shí)現,對PCB的布局密度提出了更高的要求。
表1、常見(jiàn)企業(yè)級SSD硬件形態(tài)
在極端的場(chǎng)景下,例如9顆DDR+32顆NAND FLASH,單層PCB已經(jīng)無(wú)法放下, 此時(shí)就需要用兩層或者更多層PCB堆疊來(lái)實(shí)現,PCB通過(guò)柔性PCB或者接插件鏈接。比如憶聯(lián) UH610 SSD,采用了高密布局和兩層PCB堆疊來(lái)實(shí)現。
圖1、憶聯(lián)UH610采用柔性PCB
此外,大容量SSD的NAND顆粒一般采用ODP或HDP的封裝,也就是一個(gè)顆粒(package)會(huì )封裝8個(gè)或者16個(gè)Die。對于HDP來(lái)說(shuō),芯片的高度就會(huì )稍高于采用ODP、QDP等Die數較少的封裝形式,進(jìn)而影響結構的堆疊設計。
對于單個(gè)SSD來(lái)說(shuō),雖然最大功耗的上限是固定的,但是由于降額的要求,最大功耗場(chǎng)景在一般的業(yè)務(wù)運行過(guò)程中很難出現,我們需要更多關(guān)注的是業(yè)務(wù)場(chǎng)景下的“典型功耗”。
表2、各硬件形態(tài)SSD最大功耗
一方面,受限于供電、散熱和SI,即使是大容量的SSD,其最大性能仍略低于普通容量的SSD。但在典型的業(yè)務(wù)場(chǎng)景下,兩者可達到的性能是基本一致的。SoC的功耗主要取決于性能,因此對于某一款具體的SoC而言,相同業(yè)務(wù)壓力下的功耗,可以認為是基本不變的。
另一方面,隨著(zhù)SSD容量的增加,采用的介質(zhì)(NAND FLASH)不論是Die的數量,還是單Die的容量,均會(huì )增加。采用4KB FTL(Flash Translation Layer)粒度的標準SSD,為了支撐更大的物理容量,FTL表項數量也會(huì )隨容量成比例增加,帶來(lái)DDR顆粒的容量或數量增加。NAND FLASH和DDR顆粒的增加,不論是數量,還是總的Die面積(即規模)增加,都會(huì )使漏電流隨之變大,進(jìn)而導致SSD靜態(tài)功耗增加。因此整盤(pán)的功耗會(huì )隨著(zhù)容量增加而增大。
圖2、2TB和16TB SSD 14G帶寬順序讀功耗分布
從單個(gè)SSD的角度來(lái)看,布局密度增加以及PCB的堆疊設計,增加了SSD的風(fēng)阻,帶來(lái)了更高的風(fēng)壓,風(fēng)量就會(huì )降低,用于熱交換的空氣變少,導致SSD溫度升高。
圖3、阻力越大,風(fēng)量越小
SSD上的器件(NAND、DDR等)功耗增加,會(huì )使流經(jīng)SoC的空氣,被更多的加熱;外殼殼體也會(huì )被加熱到更高的溫度,也會(huì )使SSD溫度升高。
對于一個(gè)系統來(lái)說(shuō),不論是服務(wù)器還是專(zhuān)用的存儲設備,散熱都需要滿(mǎn)足SSD的最大功耗的要求。但是如前面分析,我們更應該關(guān)注“典型功耗”。大容量SSD的典型功耗增加,意味著(zhù)同樣業(yè)務(wù)性能下,需要更高的風(fēng)扇轉速或者液冷工質(zhì)流速,提供更多的風(fēng)量或流量散熱。
綜上所述,QLC SSD在逐漸嶄露頭角的同時(shí),也在不斷攻克內部扇區尺寸、布局與堆疊、功耗與散熱等設計上的挑戰,這些創(chuàng )新也為QLC SSD的進(jìn)一步應用鋪平了道路。
隨著(zhù)市場(chǎng)對存儲解決方案需求的不斷演變,QLC SSD將會(huì )在哪些業(yè)務(wù)場(chǎng)景中取得領(lǐng)先優(yōu)勢,又將如何推動(dòng)存儲技術(shù)的進(jìn)一步發(fā)展呢?敬請持續關(guān)注本系列文章。
地址:深圳市南山區記憶科技后海中心B座19樓
電話(huà):0755-2681 3300
郵箱:support@unionmem.com