伊莉討論區

標題: 跨世代3D Xpoint技術 Intel Optane SSD 900 [打印本頁]

作者: j80801010    時間: 2017-12-25 11:52 AM     標題: 跨世代3D Xpoint技術 Intel Optane SSD 900

本帖最後由 j80801010 於 2017-12-26 10:59 AM 編輯

本帖為轉載




Intel殺手級SSD產品「Optane SSD 900」系列正式登場,採用革命性的3D Xpoint Optane 非發揮性記憶體技術,官方號稱其性能與耐用度相較傳統快閃記憶體(NAND)會高1,000倍,究竟實際性能有多強勁!? 筆者找來Intel Optane SSD 900 280GB與上代旗艦型號Intel SSD 750 400GB作對比測試。





SSD市場的大魔王


Intel絕對是SSD市場的大魔王,憑著強大的研發能力加上精良的半導體技術,過去多次為SSD市場帶來革新突破,回顧過去Intel SSD產品有不少經典名作,並為SSD市場帶來巨大衝擊︰


  • 2009年第三季,Intel推出業界首款平衡價格、容量、壽命、效能的X25-M SSD系列,並支援TRIM功能降低GC對SSD負擔,為SSD普及鋪成新路。
  • 2014年第一季,Intel推出業界首款企業級控制器與防止斷電資料遺失保護的SSD 730系列,超高寫入壽命與強悍的IOPS,是當代SATA SSD最顛峰之作之一。
  • 2015年第三季,Intel推出首款消費級NVMe SSD 750系列,藉著NCQ獲得非常強悍效能,宣告高效能PCIe SSD時代的來臨。
  • 2017年第四季,Intel帶來全新的3D Xpoint技術的Optane SSD 900,根據官方說法「這是 25 年來首見的全新類別革命性記憶體」,其性能與耐用度都比傳統快閃記憶體(NAND)強大1,000 倍,宣告高階SSD新時代來臨。



3D XPoint技術原理



Intel於IDF2011大會上首次展示PCM可運作儲存晶片樣本


Intel早於2009年已提出可堆疊的非揮發性相變化記憶體(PCM)晶片技術,並與Micron合作開發次世代的儲存,並於2011年美國IDF大會上首次展示可實際運作的樣本,代號為「Hybrid Memory Cube」,2012年正式將技術命名為「3D XPoint」並不斷針對物料作出改良,2015年改用GeSbTe硫族化合物,相較其他PCM技術更快、更穩定。



3D XPoint技術有別於傳統快閃記憶體(NAND),利用GeSbTe硫族化合物非晶態下,短直徑能階(Energy level)與低密度游離電子(delocalized electron)特性,大幅提高電阻值,儲存行為抹除(Reset)邏輯狀態為「0」;晶態則相反電阻低,儲存行為寫入(Set)邏輯狀態為「1」,透過材料相變化來記錄數位訊號,透過5層堆疊技術組成的儲存立方。





Intel Optane SSD 900


Intel Optane SSD 900P是Optane家族第三個產品,研發代號Mansion Beach,另備有伺服器級P4800X與入門級Optane Memory,900P提供兩款Form Factor,包括U.2介面及今次評測採用的 HHHL (Half Height Half Length)擴充卡,兩者在性能上完全相同,同樣基於PCI Express x4接口,為玩家提供更具彈性的選擇。



市場定位方面,Intel Optane並非要取代NAND SSD,而是填補記憶體(DRAM)與快閃記憶體 (NAND)中間的缺口,中堅玩家可以考量採用Optane Memory作銜接,與HDD或入門級SSD組成Hybrid Drive配置,高階玩家可以採用Intel Optane SSD與HDD或SSD共存,因此Optane SSD 900P只提供280GB及400GB兩種不同容量。



此次測試樣本為Intel Optane SSD 900 280GB HHHL版本,採用堅實的鋁合金外殼並設有坑紋以提升散熱面積,卡背亦加入金屬散熱背板,產品待機功耗為 5W 、讀取最高功耗約 14W,相較Intel SSD 750功耗略為上升,因此對散熱有一定要求,用家需選擇放置於機箱風扇氣流可及的位置,以避免產品因過熱而不穩。



Intel Optane SSD 900 280GB採用Intel SLL3D 7通道NVMe主控制器,與企業級的P4800X完全相同,PCB上正背面合共有21顆3D Xpoint顆粒,儲存總容量為336GB,扣除預留空間(Over-provisioning)後可用容量為280GB,由於Optane SSD有別於傳統SSD設計,不需加入快取記憶體,意味著也不需要提供電容來防止意外斷電。



採用與Intel Optane Memory一樣的3D Xpoint顆粒,型號為「29P16BIBLDNF」,採用20nm制程、封裝大小約241.12mm²,單顆容量為128Gb (16GB),儲存密度為0.62Gb/mm²。



由於3D Xpoint顆粒並沒有GC blocks可以任意寫入,意味著不會產生4kB不對齊造成讀取段差,影響速度或是寫入放大等問題,而且校驗方式異於NAND Flash的LDPC,沒有MLC、TLC限制Cell越大需要越多ECC,寫入速度等趨近讀取速度。





如何分辨SSD好壞 !?


在了解3D XPoint性能表現前,還需要了解如何分辨SSD好壞,一般常看到的測試不外乎連續讀/寫(Seq R/W)與4K隨機讀寫(4K Random R/W)來衡量SSD效能,當然還有一些細項如SSD壽命(耐寫DWPD)、延遲時間(latency)、價格等等,這邊會逐一介紹。


連續讀取/寫入(Sequential Read/Write)


Sequential Read/Write泛指單一大型檔案(連續空間)做操作,舉例來說SSD寫入檔案,簡述其操作流程


1.從SSD的Map Table標示為使用的blocks。

2.抹除(Garbage Collection ,GC)一個空間。

3.將資料寫入到標示blocks中。


當然操作流程是連貫動作可同時讀/寫,假設操作1GB連續空間,標示使用區域、抹除與填入資料,三組動作僅需操作一次即可,即為連續讀/寫,這只是最常被拿來衡量SSD好壞的指標,目前絕大部分SATA SSD連續讀/寫都可以做到550R、500W,PCIe SSD可以達到破千讀寫,拿連續讀/寫來評比SSD略顯粗糙。


4kB隨機讀取/寫入(4kB Random Read/Write)


連續讀取好比一套百科全書,連續不中斷的把內容搬出來,但讀者並非每次都需要整套百科全書內容,而是其中某冊、某章、某節,這篩選讀取動作不只要看內容,還需頻繁翻目錄,而電腦操作也是一樣道理,很少遇到連續讀/寫的情境,作業系統、遊戲也不是將全部應用程式、特效、章節、人物、影片等全部讀進來,「頻繁且小量讀/寫」就是4kB R/W真面目。


延遲時間(Latency)


  • HDD搜尋延遲時間
    一般HDD為9~12ms,硬碟轉速(RPM)越快搜尋延遲越低。
  • 傳統NAND Flash SSD
    低負載時搜尋速度約100us,高負載時搜尋時間會在100us~2ms浮動,負載越重延遲越高。
  • 3D Xpoint技術更接近DRAM
    低負載搜尋時間約10us,高負載約100~500us。

佇列深度(Queue Depth)


佇列深度(QD)指發送/接收指令數量,QD越高代表同一時間能操作的IO數量越多


  • SATA介面下AHCI模式最高的QD32,也就是32條線可同時讀寫。
  • 非NVMe的PCIe SSD為QD128。
  • NVMe協定的SSD一舉提升到QD65536。

消費級SSD在QD64下差不多就是極限,企業級的SSD可以到QD256,但高QD也會造成超高延遲時間。


IOPS (Input/Output Operations Per Second)


IOPS中文翻譯為「每秒讀/寫次數」,每秒可讀寫次數越多,代表控制器與Flash顆粒越強悍,這是一個SSD很關鍵的指標,一般使用MB/s來標示,但也可以跟IOPS互轉換,常用IOPS指標為4kB,常見硬碟格式NTFS、EXT4、ZFS預設的Block size剛好也為4kB。


  • MB/s轉IOPS 公式
    BytesPerSec / TransferSizeInBytes = IOPS



Intel Optane SSD 900 vs Intel SSD 750



此次測試樣本採用Intel Optane SSD 900P 280G,對照組採用選用上一代旗艦Intel SSD 750 400G HHHL,排除NAND降速問題Intel SSD 750使用全新樣本作測試。為免PCIe頻寬不足造成延遲或誤差,測試採用Intel Core i7-7900X搭配ASROCK X299 Taichi主機板、64GB DDR4-3200系統記憶體。



測試採用CrystalDiskMark 6.0,由日本人 Hiyohiyo 專為支援 NVMe SSD 開發的磁碟測試程式,提供磁碟連續讀取和連續寫入的速度、 512kB 及 4KB 隨機讀取及隨機寫入、最高可以測到QD512與64 Thread,非常適合測定高效能的NVMe SSD。測試次數設定為5、測定大小為32GiB,間隔時間為1分鐘。



Intel Optane SSD 900P 280G不管是線性或4kB上都有非常亮眼表現,Intel SSD 750 400G在4kB QD32下也有非常優異的表現,讀寫都超過Optane SSD 900P 280G,始終18 Channel的控制器在平行讀寫優勢,還是會大於7 Channel控制器。




單執行緒連續讀寫



在單執行緒連續讀寫方面,在QD2時900P 280G與750 400G均已達到最高寫入速度,900P 280G在寫入方面始終保持約50%的優勢。



讀取方面,900P 280G在QD2時已是最高讀取速度,而750 400G則要到QD16才能達到最佳讀取速度,性能差異與900P 280G減少至只差10%。





單執行緒4kB隨機讀寫



在單執行緒4kB隨機讀寫方面,測定各QD對最大讀寫性能的影響,由於750 400G擁有多達36 Channel的平行寫入能力,在單執行緒4kB寫入性能方面扳回一城,性能表現上力壓900P 280G。



單執行緒4kB讀取方面,是傳統NAND SSD的性能死穴,900P 280G在QD1性能是750 400G的7倍,並且在QD4開始馬力全開,相較750 400G在QD4還沒辦法發揮到25%,要較高的GD才開始將差距收窄,並憑著多通道控制器與36顆粒平行讀取,在QD32開始取回優勢。





多執行緒4kB隨機讀寫(QD1)



固定QD1測試多執行緒測試方面,可以測定多開每個桯式可測定多開每個程式獲得最大IO數量,900P 280G在QD4就會碰到單執行緒讀/寫極限,而多執行緒可輕鬆突破瓶頸,寫入速度最高達2100MB/s水平。



在QD1測試多執行緒讀取方面,750 400G在多執行緒程式多開下,低QD就會碰到I/O讀取瓶頸,要靠多通道控制器與36顆粒平行讀取,在非常多的執行緒下才能追回兩者之間的差距。





多執行緒4kB隨機讀寫(QD4)



在多執行緒4kB隨機讀寫下,900P 280G的優勢更為明顯,在雙執行緒下即可發揮90%的讀寫效能,相較750G 400G就算在最高性能下仍不及900P 280G的單執行緒4kB的寫入表現,完全發揮3D Xpoint技術的性能優勢。



多執行緒4kB隨機讀取方面,採用3D Xpoint技術的900P 280G有著先天優勢,在單線程下表現較750P 400G有8倍的性能差距,750P 400G需要在8執行緒下才能達至90%讀取效能,要在較多的執行緒才能扳回,這也是傳統NAND Flash的性能死穴。





8執行緒4kB隨機讀寫



在8執行緒4kB隔機讀寫測試,由於900P 280G及750 400G都可以達至最佳效能發揮,藉此項測試能探究兩者之間4kB隨機讀寫的性能極限。



可以看到900P 280G在QD2就達到了80%讀寫性能,QD4已達至最高效能,而750 400G在QD2還沒能發揮到30%,更要到QD19才能發揮到最高效能。





IOPS 8執行緒測試



IOPS方面,900P 280G官方標示為IOPS Read 550,000、Write 500,000,750 400G官方標示則為 IOPS Read 430,000、Write 230,000,但兩者的性能差距並未能在數字上實際反映。


900P 280G在QD4 就達到了官方標示的讀取最大值,但寫入部分可能是執行緒設定不夠多,造成無法跑到極限速度。750 400G要到才能達到官方標示的IOPS。




延遲時間(Latency)



4kB隨機讀/寫延遲是Optane最大賣點之一,從數據來看不管是QD1與QD16,NAND在99.999%負載IO延遲都相當高,此時操作會有相當大的卡頓感,而Optane延遲幾乎都壓制在100us內,再高負載I/O都不會卡死,非常適合極端操作的使用者與大型資料庫使用。


混合讀/寫相當考驗控制器效能與顆粒強度,極度負載下900P反應速度還是控制在50us內,非常厲害,NAND延遲時間則是落在1.83ms與2.7ms。




IO Meter測試



為了榨出900P最大IOPS,眾多測試軟體中,還是IOMETER為最佳選擇,設定值為20個執行緒、每個執行緒QD4。



4kB讀/寫分別達標 56萬與53萬IOPS,有符合官方標示,而128kB表現也相當亮眼,讀/寫分別為36萬與31萬IOPS。






實際使用感


  • Windows 10 1709開機從BIOS check過後開始算,轉了1/3圈、歡迎畫面沒看到,一閃即逝,桌面讀取也幾乎瞬間完成
  • 開Chrome 62.0.3202.94也是一點擊就開,開Office 2016歡迎畫面一閃即逝,開檔案總管按下去秒開,沒有任何延遲
  • 在C:\Windows內搜尋任意檔案都是兩秒內會有結果。
  • Windows 10 重灌 1709,從BIOS 開始選灌到進桌面 6分鐘,包含選版本等設定。(重灌碟VE-300裝Intel 530)。
  • 整體表現只有快,還是快,感覺現在電腦上的延遲只剩下程式打開的歡迎畫面,如果沒有歡迎畫面的軟體按下去幾乎都是秒開。
  • 4kB隨機讀寫750最高溫度43度,900P為51度,900P用戶會建議掛一顆小風扇降溫。(室溫23.5度)
  • 實測兩套大型開發軟體Visual Studio 2017 與AutoCAD 2018開啟速度。


心得:事實上我對於Intel這個產品線一直有很高的困惑

對於計結有概念的大概都可以了解為何現行需要這麼多層記憶體(cache ram hdd...)

然而現在已經開始大量普及SSD,且價格在趨勢上也是未來越便宜

是否真的有必要再RAM和HDD間再插入一個做為CACHE使用?





作者: ooww    時間: 2017-12-27 11:32 PM

Intel寫得很厲害
應該是下一世代的產品
但是我們看看samsung960 series還比Intel 900P快
這......
Samsung上一世代就導入的產品已經贏Intel下一世代了

作者: felixwei1102    時間: 2017-12-28 12:24 AM

提示: 作者被禁止或刪除 內容自動屏蔽
作者: droomagon    時間: 2017-12-28 08:21 AM

之前三腥也有出這種類似的PCIe SSD 卡,我記得價錢也很貴,沒有多少人會去買




歡迎光臨 伊莉討論區 (http://a401.file-static.com/) Powered by Discuz!