當下,開(kāi)源大模型DeepSeek憑借其強大的語(yǔ)言理解和生成能力,已成為全民追捧的AI工具。無(wú)論是文案創(chuàng )作還是代碼編寫(xiě),只需“DeepSeek一下”即可輕松解決。然而,隨著(zhù)用戶(hù)訪(fǎng)問(wèn)量的激增,服務(wù)器無(wú)響應、等待時(shí)間長(cháng)等問(wèn)題也屢見(jiàn)不鮮。一時(shí)間,能夠離線(xiàn)運行,且更具隱私性的DeepSeek端側部署也成為新風(fēng)向。
本地部署雖具備諸多優(yōu)點(diǎn),但對電腦的硬件配置卻有一定的要求。大模型包含大量參數,即使是蒸餾過(guò)的小模型,模型大小也動(dòng)輒幾十GB甚至上百GB。電腦除了需要CPU、GPU能夠高效運行之外,一款高性能的SSD也必不可少。 憶聯(lián)AM541搭載新一代Jaguar6020主控,內置高容量SRAM及IO加速模塊,順序讀取速度高達7000 MB/s,能夠輕松應對DeepSeek大模型加載等高負載場(chǎng)景,為用戶(hù)提供流暢的使用體驗,讓用戶(hù)真正實(shí)現“DeepSeek自由”。
在DeepSeek本地加載運行過(guò)程中,SSD是整個(gè)數據流的第一棒。當DeepSeek完成本地部署后,模型文件即保存在SSD中。當用戶(hù)加載模型時(shí),會(huì )先將大模型文件從SSD讀取到系統內存中,再由內存中轉傳輸到顯存,由GPU進(jìn)行推理運算。因此,SSD的性能越好,就能越快將數據傳輸到GPU進(jìn)行計算,體現在實(shí)際應用中就是大模型的加載時(shí)間越短。
加載大模型時(shí)數據流方式
為了驗證憶聯(lián)AM541的性能及場(chǎng)景適配度,我們通過(guò)Ollama模型框架在本地部署了Deepseek-R1 8B模型,采用憶聯(lián)AM541 1TB SSD及國內友商1TB A產(chǎn)品搭配GeForce RTX 3060 Ti 顯卡,在同等環(huán)境下進(jìn)行了模型加載測
系統配置
大模型加載時(shí)SSD狀態(tài)(見(jiàn)右側圖)
測試結果顯示,搭載AM541的PC在加載大模型時(shí)表現出色,首次加載時(shí)間(最快)僅為2.486秒,領(lǐng)先國內一線(xiàn)SSD廠(chǎng)商同類(lèi)產(chǎn)品約9%。這一成績(jì)充分體現了AM541對DeepSeek等高負載應用100%適配,能夠為用戶(hù)帶來(lái)更加流暢的使用體驗。
更短加載時(shí)間背后,反映的是SSD更高的性能及更加靈活的場(chǎng)景適應性。得益于SoC內置的加速模塊,AM541的標稱(chēng)順序讀寫(xiě)速度達到了7000 MB/s、5600 MB/s ,4KB隨機讀寫(xiě)速度可達800K IOPS、800K IOPS。從DeepSeek加載時(shí)的pattern解析來(lái)看,AM541性能波峰接近7GB/s,這與其標稱(chēng)的性能高度吻合。
AM541緣何更快?測試人員進(jìn)一步對加載過(guò)程進(jìn)行了trace解析,發(fā)現模型加載過(guò)程主要以大size命令的低QD順序讀為主,而AM541自帶的Big SRAM策略及延遲控制機制在處理此類(lèi)命令時(shí)優(yōu)勢明顯,使得大模型加載時(shí)間大幅領(lǐng)先友商。
此外,經(jīng)測試發(fā)現,當大模型在搭載AM541的電腦上完成首次加載后,模型文件即被DRAM緩存,因此當設備Idle后再次加載時(shí),模型文件可以直接從DRAM傳輸到VRAM,加載時(shí)間比首次更快,真正將DeepSeek變?yōu)橛脩?hù)的“私人工具“,隨時(shí)暢享“DeepSeek自由”。
隨著(zhù)AI本地化趨勢的加速,DeepSeek一體機等終端設備也逐漸普及。在消費電子領(lǐng)域,已有主流 PC廠(chǎng)商將DeepSeek大模型嵌入AIPC中,多款手機也開(kāi)始發(fā)力AI大模型。未來(lái),個(gè)人電腦、手機等終端設備極有可能會(huì )搭載多種大模型,甚至各種行業(yè)應用也會(huì )接入大模型。面對不同參數規模的AI模型,以及不同模型頻繁切換帶來(lái)的高頻讀寫(xiě)過(guò)程,SSD不僅要有足夠大的容量,同時(shí)對SSD的全面性能及穩定性都是一種考驗。
依托硬件加速及先進(jìn)的軟件算法,AM541不僅在低QD Latency上具備優(yōu)勢,在多種混合讀寫(xiě)中均有出色表現,可輕松應對多應用場(chǎng)景。
在PCMark10測試中,AM541跑分超過(guò)了3700,比友商同類(lèi)產(chǎn)品A高出約300分,在辦公、游戲、內容創(chuàng )作等多個(gè)場(chǎng)景中性能領(lǐng)先,其中,在常見(jiàn)的數字內容創(chuàng )作中,AM541平均比友商同類(lèi)產(chǎn)品快10.5%。
AI浪潮奔涌不停,技術(shù)創(chuàng )新日新月異,作為底層硬件支撐,SSD在A(yíng)I本地化進(jìn)程中扮演著(zhù)關(guān)鍵角色。憶聯(lián)AM541憑借其硬核性能,不僅為DeepSeek大模型的本地化部署提供了高效解決方案,也為用戶(hù)帶來(lái)了前所未有的使用體驗。未來(lái),憶聯(lián)將緊跟行業(yè)趨勢,聚焦端側大模型的技術(shù)痛點(diǎn),推進(jìn)技術(shù)創(chuàng )新與產(chǎn)品迭代,為AI生態(tài)的繁榮發(fā)展提供持續動(dòng)能。
地址:深圳市南山區記憶科技后海中心B座19樓
電話(huà):0755-2681 3300
郵箱:support@unionmem.com