算力爆發!RTX 4080 SUPER本地AI出圖效率起飛


3樓貓 發佈時間:2024-04-08 18:32:29 作者:電腦報 Language

在CES 2024上,NVIDIA正式發佈了GeForce RTX 40 SUPER系列顯卡,其中的RTX 4080 SUPER相對RTX 4080升級又降價,性價比暴增,為4K遊戲玩家提供了上佳的選擇。而ROG旗下的ROG STRIX RTX 4080 SUPER OC在一眾超公版RTX 4080 SUPER中堪稱旗艦級代表作,廣受發燒級玩家好評。那麼,對於需求大顯存和強大算力的AIGC用戶來說,RTX 4080 SUPER的使用體驗又是如何呢?我們不妨就用ROG STRIX RTX 4080 SUPER OC來實戰一下吧。

↓點擊視頻瞭解AIGC生產↓

ROG STRIX RTX 4080 SUPER OC:詮釋全方位的豪華

ROG STRIX RTX 4080 SUPER OC採用了新的ROG STRIX家族式外觀設計,在外觀風格上加入了大量賽博龐克世界觀的元素。導流殼表面採用極具特色的紅藍漸變配色,左上角設計有經過鏡面處理的圖騰化ROG信仰Logo,與散熱風扇上三隻自帶霓虹效果的“玩家之眼”相互映襯。
散熱配置方面,ROG STRIX RTX 4080 SUPER OC採用全新的散熱模組設計,配備包圍式金屬導流殼、金屬背板以及壓鑄金屬框架,大幅增強顯卡扛變形的能力。而3.5槽大規模散熱系統能提供更大的散熱空間和更多的散熱鰭片,內部採用均熱板直觸與熱管內埋設計,內置4個8毫米和3個6毫米熱管。相比傳統的均熱板設計,可以讓顯卡在承受500W的熱負載時,溫度再降低5℃。
顯卡還配備3個Axial-tech軸流風扇,風扇直徑達到104mm,可提供更大的風量和風壓。並且具備中間風扇反轉設計,有效減少擾流,提升散熱氣流利用率。風扇採用雙滾珠軸承,擁有比傳統油封軸承更長壽命。該風扇支持0dB技術,可以在GPU核心溫度低時完全停轉,減少低負載時的噪聲。顯卡尾部還具備2個PWM FanConnectⅡ接口,玩家可以根據需求連接風扇,提升平臺整體的散熱性能。
供電部分,ROG STRIX RTX 4080 SUPER OC採用超合金數字供電方案,GPU部分使用了MP2888A控制芯片+MP86992(70A)MOSFET,顯存部分使用UP9529QQKF+SIC654A(50A)供電方案,可為顯卡高頻狀態運行提供充足而穩定的動力。另外,ROG STRIX RTX 4080 SUPER OC也採用了華碩全自動化製程技術,可以有效消除生產中的人為失誤,帶來更高的耐用性。
接口部分,ROG STRIX RTX 4080 SUPER OC提供了3個DP 1.4接口和2個HDMI 2.1接口,滿足玩家組建多顯示器系統和8K分辨率、高刷新率顯示器的需求沒有任何問題。規格方面,ROG STRIX RTX 4080 SUPER OC的默認的加速頻率為2640MHz,OC模式下的加速頻率為2670MHz,相比公版頻率高出不少(公版為2550MHz)。
大家都知道,Stable Diffusion是當下最火的本地AI出圖工具,RTX 4080 SUPER擁有強悍的算力和16GB超大顯存,並且擁有無與倫比的CUDA生態,因此也是運行它最高效、兼容性最好的裝備。那麼接下來就看看ROG STRIX RTX 4080 SUPER OC實際的AI出圖表現吧。

超大顯存+強勁算力,RTX 4080 SUPER出圖太犀利

測試平臺 顯卡:ROG STRIX RTX 4080 SUPER OC 處理器:Intel酷睿i9 14900K 內存:芝奇DDR5 6000 16GB×2 主板:ROG MAXIMUS Z790 HERO 硬盤:WD_BLACK SN850X 2TB 電源:ROG THOR雷神1200W Platinum II 操作系統:Windows 11專業版23H2
▲生成10張分辨率為512×512的圖片,ROG STRIX RTX 4080 SUPER OC僅花費47秒

▲生成10張分辨率為512×512的圖片,ROG STRIX RTX 4080 SUPER OC僅花費47秒

我們先用Stable Diffusion跑個賽博小姐姐試試,使用麥橘唯美模型、DPM++ 2K Karras採樣方式、512×512分辨率、迭代步數50、提示詞引導係數7、每批次1張一共10批次,隨機種子這裡固定為14方便測試對比。從測試結果來看,一共10張圖,ROG STRIX RTX 4080 SUPER OC僅花費47秒,效率相當高。
▲把分辨率提升到1024×1024再生成10張圖,ROG STRIX RTX 4080 SUPER OC也只花費了99.5秒

▲把分辨率提升到1024×1024再生成10張圖,ROG STRIX RTX 4080 SUPER OC也只花費了99.5秒

覺得512×512分辨率不夠用?沒關係,我們可以直接把分辨率提升到1024×1024,數量還是1×10張,這樣雖然對顯存的要求變高了,但RTX 4080 SUPER的16GB大顯存依然沒有壓力,完成的時間為99.5秒,像素量提升到原來的4倍,而時間只增加了一倍多一點點,可見ROG STRIX RTX 4080 SUPER OC出圖真的很強。
▲使用高清修復,將剛才生成的512×512圖片提升到2048×2048,ROG STRIX RTX 4080 SUPER OC使用時間僅為44.8秒

▲使用高清修復,將剛才生成的512×512圖片提升到2048×2048,ROG STRIX RTX 4080 SUPER OC使用時間僅為44.8秒

我們知道,Tile模型的作用之一就是高清修復模糊圖片,這裡用之前生成的一張512×512的賽博小姐姐圖片,放入Tile模型修復,並將分辨率提升4倍至2048×2048,可以看到修復後的整張圖片確實精細了很多,增加了不少細節。而ROG STRIX RTX 4080 SUPER OC完成這個操作僅花了44.8秒,而且16GB超大顯存在這裡也發揮了巨大的作用,讓高分辨率AI計算成為可能。
光是ROG STRIX RTX 4080 SUPER OC自己秀肌肉大家可能還感受不到它AI出圖的強大性能,所以這裡我們用NVIDIA官方的標準來進行了對比。具體設置方面,採樣方式為Euler a、採樣步數為50、CFG Scale為7.5、每批次出圖數為2、批次為10,最後統計每分鐘出圖數量。可以看到,ROG STRIX RTX 4080 SUPER OC的出圖速度大約是RTX 4080的105%,相對RTX 3080 Ti更是提升了42%之多,而相對酷睿i9 13900K來講的話,則是快了181倍。
此外,RTX 系列GPU還可以通過NVIDIA的TensorRT優化模型,從而進一步大幅提升Stable Diffusion的出圖速度。我們使用NVIDIA TensorRT分別對Stable Diffusion XL和Stable Diffusion V1.5的模型進行了優化,由此來對比優化前後ROG STRIX RTX 4080 SUPER OC出圖效率的變化。在使用Stable Diffusion V1.5的模型時,我們分別選用了512×512、768×768的出圖分辨率,而在使用Stable Diffusion XL模型時選用了1024×1024的出圖分辨率(與訓練模型的圖片分辨率相同)。其他參數方面,採樣方式為Euler a、採樣步數為50、CFG Scale為7、每批次出圖數為1、批次為10。
從測試結果可以看到,使用TensorRT後,ROG STRIX RTX 4080 SUPER OC在三種環境下出圖的速度提升了101%、142%和104%,都達到了翻倍以上的增幅,可見TensorRT的效果的確非常出色,值得Stable Diffusion玩家使用——當然,也要搭配ROG STRIX RTX 4080 SUPER OC這樣的AI利器才能讓它發揮作用。

總結:RTX 4080 SUPER不光是4K遊戲利器,AIGC一樣犀利無比

從前面的測試可以看到,ROG STRIX RTX 4080 SUPER OC憑藉強大的算力和16GB超大顯存的加持,在Stable Diffusion中不但提供了非常強悍的出圖效率,也擁有出色的高分辨率出圖適應性,確實稱得上是遠超主流顯卡的高端AI出圖利器。此外,我們也看到ROG STRIX RTX 4080 SUPER OC擁有豪華的用料與精湛的做工,這也確保了它在滿載出圖的過程中可以提供可靠的穩定性。總而言之,如果你需要一款能夠同時提供4K高幀遊戲體驗與強悍AI算力的高端裝備,那麼ROG STRIX RTX 4080 SUPER OC確實是個很好的選擇。

© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com