自打2022年英特爾正式發佈旗下Arc系列獨立顯卡,在獨顯領域的討論終於從AMD、NVIDIA兩家之爭擴展到了第三家。對於英特爾而言,首次試水的Arc A系列在發佈的2年內像升級打怪一般,攻克了一個又一個需要大量行業經驗積累才能解決的問題,例如對DX9、DX11遊戲的支持程度,再例如光線追蹤單元利用的效率,以及驅動穩定程度等等。
從現在這個時間點來看,Intel Arc A系列雖然說不上一鳴驚人,但成長的速度令人印象深刻,光是過去一段時間接連50多次的驅動更新,以及對120款以上游戲發佈當日的Day-0支持,都讓Intel Arc的性價比愈發凸顯。
但只有驅動層面更新是遠遠不夠的,特別是在AI視覺運算和光線追蹤效果逐漸具備普適性,A、N兩家新顯卡蓄勢待發,是時候重新定義性價比概念了。因此在距離CES 2025不到一個月的時間點上,英特爾正式發佈並開賣銳炫Arc B580系列,以Battlemage戰鬥法師為名,點燃GPU迭代的第一把火。
如果你是Intel Arc A750用戶,或者計劃在近期構建一套高性價比的臺式機PC,眼前的Intel Arc B580顯然是值得期待的,它定位2000元檔的價位段,並帶來全新的Xe2架構和大量的硬件升級,配合軟件和驅動積極更新的節奏,都暗示著Intel Arc B580很有嘗試的必要。
那麼Intel Arc B580的戰鬥力究竟如何?我們的首發評測就此奉上。
戰鬥法師BMG-G21
在月初的媒體溝通會上,英特爾表明Intel Arc B系列先發的兩款型號為Intel Arc B580和Arc B570兩款,其中Intel Arc B580先發,Arc B570則會安排到2025年1月份。
兩款GPU的核心均來自型號為MG-G21的SoC,基於Xe2架構打造,採用臺積電N5製程,晶體管數量達到196億個,Die Size為272mm2。因此Intel Arc B580和Arc B570的主要區別在於Xe Core數量和顯存數量的區別。
Xe2架構同樣已經應用到了前段時間已經發布的Lunar Lake CPU的核顯中,全新的Xe2架構加入了XVE矢量引擎、更高效的XMX引擎等,特別是XMX矩陣單元在底層硬件設計上的升級,為後續的XeSS 2分辨率超採樣技術得以實現,同時XMX矩陣單元帶來的優勢也是早期Xe-LPG利用的DP4a指令集無法達到的效率。
Xe2中的Xe核心包含8個512bit矢量引擎,相比上一代Xe的16個矢量引擎減少了一半,另一半用來放前面提到的2048bit XMX矩陣引擎來實現更好的運算支持。XMX矩陣引擎包含INT2、INT4、INT8以及FP16、BF16在內精度計算,並對FP64提供支持,從而實現對更豐富的推理模型的兼容。
由於XMX引擎支持Int8 4096 OPS/clock和FP16 2048 OPS/clock算力,遠高於XVE矢量引擎,因此在重負荷AI加速中,Xe2可以承擔更多的AI加速工作。
繼續向下延伸就是構成Xe核心部分之一的渲染切片(Render Slice)。新的渲染切片引入了對於Excute Indirect的支持,原來3D任務需要CPU把指令給到GPU,然後由GPU去運算執行,而在Excute Indirect功能支持下,部分命令可以直接在GPU本地執行,不需要CPU一條條告訴GPU做什麼,而是GPU本身就具備Draw、Dispatch的能力,這些命令可以直接在GPU裡直接完成。此外,幾何單元改進達成頂點獲取(Vertex Fetch)吞吐提升3倍,mesh shading性能提升3倍。
Xe2緩存部分的壓縮率和吞吐量也有了明顯提升,包括提升了L1 Cache的利用率,Sampling吞吐提升2倍,Pixel Color Cache提升1.33倍。因此儘管在Xe核心數量上Arc B580比Arc A750要少,但實際上由於效率的提升,讓性能顯著增加。
英特爾用《要塞英雄》舉例,得益於在已經上對間接執行(Execute Indirect)支持,並通過SIMD16減少光照通道執行時間,以及L1緩存無序訪問視圖(Unordered Access Views,UAVs)寫入,同樣場景下Xe2渲染體積霧的時間減少33%。
順帶一提,Xe2在SIMD16的基礎上,增加了對SIMD32的支持,即一次處理32個數據元素。雖然這個設計是基於SIMD16上獲得而不是原生,但可以確保Intel ARC B580運行更大規模的矩陣乘法,或者處理圖形渲染中更復雜的計算效率。
Xe RTU光線追蹤單元也進行了拓寬,提供三條遍歷通道,18 x Box intersections和2 x Triangle intersections計算,能夠更快速地進行盒子和三角形之間的交叉檢測。其中Box intersections是指單元在光線與盒子或者說包圍體積相交時所能處理的數量,Triangle intersection指代光線與三角形相交時所能處理的數量。
在媒體引擎方面,Intel Arc B系列使用了雙MFX引擎設計,看可以提供8K 10bit HDR 120FPS編碼工作負載,並且從硬件提供包括VP9、AV1等硬件支持。同時Xe媒體引擎還提供HEVC 4:2:2 10bit編解碼,是目前Windows平臺唯一硬件原生支持此格式的GPU。
由於Intel Arc B580已經是完整的BMG-G21,因此包含了5個渲染切片,20個Xe-Core,160個Xe矢量引擎,160個XMX矩陣引擎,20個光線追蹤單元,20個紋理採樣器,並配備了18MB L2緩存以減少內存訪問延遲和帶寬瓶頸問題。此外,Intel Arc B580的核心最高頻率可以達到2850MHz,配備12GB 192-bit GDDR6顯存,顯存帶寬456GB/s。
另外需要注意的是,Intel Arc B580與GeForce RTX 4060一樣,使用的是PCIe 4.0 x8接口,不過在物理設計上仍然沿用x16設計以確保能夠很好的貼合主板最靠近CPU的x16 PCIe槽位。PCIe 4.0規範本身也帶來了對Resizable BAR的支持,即允許CPU直接訪問整個顯存空間,而非傳統BAR僅能訪問256MB,這項技術也能更進一步減少CPU與GPU之間數據交流的瓶頸,現在主流的主板均已經對Resizable BAR提供了支持,但並非所有品牌默認開啟,因此在安裝顯卡後記得在BIOS中觀察Resizable BAR是否有打開。
最後我們用一個表格來展示Intel Arc B580的主要參數。
Limited Edition信仰加持
雖然Intel Arc B580發佈後,主要以第三方AIB廠商的顯卡為主,但筆者仍然建議如果有機會入手英特爾官方信仰加持的Intel Arc B580 Limited Edition無疑是很好的選擇。
英特爾顯卡團隊不僅親自參與了Intel Arc B580 Limited Edition設計,還從Arc A系列上吸取了大量的設計經驗,重新設計了電路佈局和散熱方案,進一步降低了噪音並提升了顯卡能效比。
可以看到Intel Arc B580 Limited Edition使用了暗黑色主題,覆蓋表面處理得非常細膩。顯卡本身使用了雙卡槽小板設計,也就是所有PCB和芯片都集中在顯卡的前半部分,後半部分鏤空處理。這讓後半部分風扇旋轉時,氣體可以更快速的穿過顯卡散熱片,加速帶走熱量。
只有6英寸面積的8層PCB版上配備了6+2相電源,即6相給GPU供電,2相給顯存供電,設計團隊通過調諧和元器件電源優化,將元器件噪音降低了80%。按照英特爾的說法,由於PCB板相對於上一代採用8英寸PCB板的Intel Arc A750 Limited Edition而言,總排氣面積增加了2.4倍。
設計團隊還考慮到了顯卡的可修復性,在關鍵部位移除了粘合劑,背板也使用了可拆卸設計,可獨立拆除。
Intel Arc B580 Limited Edition散熱模組使用了四熱管搭配兩個垂直鰭片設計,並覆蓋整個電路板,以獲得有效的熱量分配。在散熱路徑上,熱量會從電源接口邊緣、PCIe接口邊緣,以及鏤空的背面通風道排出。為了增加散熱效率,GPU和顯存也附著了高質量導熱墊和導熱材料。
另外顯卡的兩個風扇也提升了運行性能和聲學表現,可以相對上一代Limited Edition的風扇增加了30%的氣流,整體噪音降低50%,是目前為止英特爾製造出來最快且最安靜的Arc顯卡。
在實際顯卡壓力測試中,GPU核心溫度為60℃左右,通過紅外線測溫20℃室溫內可以看到出風口溫度最高在42℃左右,供電接口部分溫度在34℃左右,長期壓力狀態使用不會對電源接口造成影響,顯卡整體表面溫度保持相當冷靜的狀態,因此也適合裝入到一些小型化機箱內。
接口部分,Intel Arc B系列提供1個HDMI 2.1a接口,以及3個DisplayPort 2.1接口,其中由上到下第二個DisplayPort 2.1接口最高可支持8K 60Hz或者4K 360Hz輸出,所有接口同時輸出支持4K 120Hz HDR高分辨率輸出。
顯示引擎本身也支持VESA自適應同步標準,支持VRR可變刷新率顯示器,從而實現真輸出延遲、抖動和撕裂的問題。同時Intel Arc B580和Arc B570均通過了HDR10+ GAMING認證,無需遊戲內單獨設置,就能自動獲得HDR效果當然前提是遊戲、顯示器也要同時支持這項技術。
最後是供電部分,供電接口則選擇了傳統的8pin電源接口,Intel ARC B580的供電需求為190W,TDP 233W,對於空間有限的小機箱而言,也可以選擇更小功率的電源給這款顯卡進行供電。
實戰出真知
接下來讓我們進入實戰環節,在測試環節我們使用了兩套平臺進行考量,理論基礎測試部分沿用不拖後腿的原則,採用Core i9-14900K,ROG MAXIMUS Z790 DARK HERO,G.SKILL Trident Z5 DDR5-7200 16GBx2作為參考。
而在遊戲實戰部分,則會考慮實際裝機情況,使用Core i5-13490F作為CPU,模擬定位主流機型的實戰表現。
在3DMark基準進行測試環節,主要使用了3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。這裡直接引入NVIDIA GeForce RTX 4060,Intel Arc A750和AMD Radeon RX 7600進行比較。
從整體來看,Intel Arc B580 Limited Edition表現不錯,相對Intel Arc A750平均性能提升15%左右,相對GeForce RTX 4060領先有25%的差距,同樣,相對AMD Radeon RX 7600領先大概在22%左右。
在1080p分辨率下,我們將畫質調到最高。用Intel Arc A750和Intel Arc B580進行對比,比較中可以發現,Intel Arc B580 Limited Edition相對Arc A750提升在10%到70%之間,平均提升36%,是一個相當明顯的進步。
顯然只用Intel Arc B580 Limited Edition處理1080p畫質未免太過浪費,特別是今年開始2K分辨率顯示器,乃至2K OLED顯示器蓬勃發展都證明了玩家對沉浸遊戲體驗更高的要求。
事實上Intel Arc B580 Limited Edition配備的12GB 192-bit GDDR6就是以此準備的,相對於8GB顯存,12GB可以實現在複雜場景下更高分辨率的流暢運行。這裡同樣引入NVIDIA GeForce RTX 4060,Intel Arc A750和AMD Radeon RX 7600進行對比。
可以看到,Intel Arc B580 Limited Edition表現更猛了,相對Intel Arc A750平均性能提升31%左右,相對GeForce RTX 4060領先有11%,同樣,相對AMD Radeon RX 7600領先從10%到50%不等,部分原因可能是驅動穩定性造成,比如《F1 24》中,AMD Radeon RX 7600性能沒有釋放出來。
Intel Arc B580 Limited Edition給遊戲帶來的高幀率很大程度源自於更多遊戲加入了對XeSS的支持。目前為止,大概有150款左右的遊戲加入了對XeSS的支持,雖然還不及龐大的DLSS遊戲陣營,2年時間內後發到這樣的程度已經很不容易。
以近年來3A大作流行開啟的光線追蹤特效為例,利用XeSS超分辨率(XeSS Super Resolution,XeSS-SR)可以獲得更高的遊戲幀率,在Intel Arc B580 Limited Edition中,也能看到立竿見影的效果。
在Intel Arc B580 Limited Edition發佈的同時,XeSS也升級到了XeSS 2,類似於DLSS 3技術,需要GPU在硬件上的支持,但可以獲得更好的效果。目前可以支持XeSS 2的顯卡包括Intel Arc A系列,以及剛剛發佈的Intel Arc B系列。值得注意的是,Lunar Lake中的核顯同樣也使用了Xe2 Core,因此也支持完整的XeSS 2功能。
XeSS 2有了明顯的進步,它由三個部分組成,包含XeSS超分辨率(XeSS Super Resolution,XeSS-SR),XeSS幀生成(XeSS Frame Generation,XeSS-FG),Xe低延遲(Xe Low Latency,XeLL)。
不同於NVIDIA使用獨立的光流加速器硬件來實現幀生成技術,XeSS FG依賴的是自己的XMX AI引擎來實現,具體做法是渲染出第一幀和第二幀,然後通過插幀技術和AI算法生成這兩幀之間的中間幀。第一幀和第二幀是遊戲引擎原生渲染的結果,而中間幀則是利用AI生成的。在AI生成幀中,英特爾表示一共使用了兩種技術,一種是光流重投影技術,另一種是運動矢量重投影技術。這兩種技術共同作用,以確保插幀的準確性和畫面的流暢性。
因此在工作模式中,會先由XeSS-SR實現遊戲超分,以降低GPU負荷和提升遊戲幀率,然後再通過XeSS-FG實現幀生成。
英特爾表示XeSS 2 API植入非常方便,無需增加遊戲製作太多工作量。不過與DLSS 3以及DLSS 3.5發佈時候類似,實裝到測試多少會需要一些時間,但從現在宣佈支持XeSS 2的10款遊戲而言,含金量是不少的。例如包括育碧的《刺客教條:影》,網易的《漫威爭鋒》,以及《消逝的光芒2:人與仁之戰》。
這裡著重使用已經實裝XeSS 2的《F1 24》進行嘗試。可以看到,在遊戲設置中可以找到開啟XeSS 2的選項,這裡需要注意需要將VRS關閉。
先來看畫質損失,在XeSS 2超高質量下,遊戲畫質與原畫質幾乎沒有任何區別,遠處觀眾席和觀看臺細節可以看的非常清晰。
如果開啟XeSS 2超高性能,遠處觀眾臺畫質會有所降低,但也仍然在可以接受的範圍內。實際遊戲體驗可以根據個人的需求在質量、性能之間進行調整。
這裡我們分別對默認設置,XeSS性能模式+XeSS FG,XeSS質量模式+FG一共五種模式進行嘗試,可以看到XeSS FG配合XeLL,可以給XeSS帶來更高幀率的同時,也能降低顯示響應,幀率最高可以提升3.2倍,顯示延遲降低1.6倍,效果是非常出眾。
即使不依靠XeSS,Intel Arc B580 Limited Edition對於注重競技類的在線遊戲也已經有很好的表現,這裡我們嘗試了《DOTA2》、《反恐精英2》和《APEX》,不管是1% LOW FPS還是延遲表現,這塊GPU已經表現得足夠好。
遊戲領域值得一提的還有英特爾重新設計了控制中心,包括重新設置了界面,加入了針對不同遊戲的獨立設置選項,包括針對DX9和DX11的降低系統延遲選項,圖像銳化等設置。界面非常直觀明瞭。
另外新軟件還加入了對顯卡的檢測,可以看到平均幀率,GPU利用率,功耗,電壓,顯存頻率等選項格調一下子就上來了,另外驅動還加入了對顯卡的超頻設置,和CPU的XTU一樣,給幫助玩家壓榨顯卡更多的價值。
AI創作力猛增
除了遊戲,顯卡的創造力也已經成為衡量的另一項指標,特別是隨著AI應用的不斷普及,GPU對AI的加速表現相當值得關注,Intel Arc B580 Limited Edition同樣如此。這裡我們先用Stable Diffusion作為參考。
Stable Diffusion是2022年推出的深度學習文本到圖像轉變的AICG工具,這套工具由初創公司Stability AI和非營利組織、學術人員共同合作開發,因此它相對需要收費的Midjourney有更好的開放性和擴展性,並提供一系列的插件實現更多功能。目前網上已經提供了對英特爾顯卡的適配版本,當然前提是至少8GB以上的顯存vRAM和AI性能足夠強勁的GPU進行,否則本地體驗不如直接購買雲端服務來的直接。
老規矩,我們利用一段固定的文字描述讓Stable Diffusion創建20張圖片,每張圖片分辨率為512x512,採樣步數設置為50。文字描述參考如下:
beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette
在實際使用中可以看到,Intel Arc B580 Limited Edition輸出圖片效率和質量不錯,通過記錄總共的花費時間,可以推算出每分鐘生成的圖像效率(Images Per Minute)。公式為:
60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute
以此可以對比出Intel Arc B580 Limited Edition在AIGC生成效率上有明顯的提升,無論對比自家的A750還是GeForce RTX 4060,當然其中重要的原因還是因為B580擁有更大容量的顯存,以及高效的XMX引擎作為基礎。
另外一項AI測試則是基於AI提升圖像分辨率的ON1 Resize AI 2022,原理是對低分辨率圖片無損提升至高分辨率圖片,用於巨幅海報輸出,依靠AI性能可以獲得更快的出圖,並計算生成圖片的時間,數值越少意味著效率越高。
實際測試中,同樣五張照片,Intel Arc B580相對GeForce RTX 4060可以節省27%到37%的時間。
有意思的是,Intel也不滿足依靠第三方開源軟件,針對英特爾Arc B系列特性,還專門製作了一個專門版本的Al Playground 2.0 alpha for Intel Arc版本,軟件本身不僅自帶了對Stable Diffusion 1.5和Stable Diffusion SDXL支持,同時也提供圖像增強,圖像優化功能,甚至可以利用本地大語言模型進行本地聊天,AI翻譯,本地文件總結等功能。目前已經提供了酷睿Ultra和Intel Arc的支持。
因此Al Playground 2.0 alpha對Intel Arc B580適配性更好,只需要下載安裝之後,根據引導下載對應的本地模型,不用複雜的設置,軟件即刻就能開始工作。例如筆者描述了一段宇宙飛船穿越賽博龐克都市的畫面,步進為50,完成一張圖花費的時間大概在30秒左右。
同時你也可以與Al Playground 2.0 alpha進行本地聊天,Intel Arc B580對Qwen2-1.5B-Instruct的反應幾乎是瞬間的。
最後渲染和專業軟件檢測,我們也引入了Blender Benchmark和SPECview 2020作為參考,Intel Arc B580相對於A750也有了不同幅度的進步,而且我們相信隨著驅動版本的不斷升級,Intel Arc B580也可以越做越好。
寫在最後:性價比的挑戰者
Intel Arc B580給人的印象很深刻,對於一款2000元檔位性價比挑戰者而言,這款顯卡在遊戲的表現力上已經超過同價位其他顯卡水準,而且得益於全新XeSS 2技術,以及Xe2架構,隨著驅動的不斷升級,Intel Arc B580戰鬥力也會越來越強,就像此前Intel Arc A750那般,在購買之後,通過驅動升級就能獲得很多驚喜。
而作為限定版的Intel Arc B580 Limited Edition也展現出了不凡的戰鬥力,小尺寸設計讓其能夠更輕鬆的裝入更小的機箱,給臺式機小型化提供了更多可能。同時安靜、高效的運行讓Intel Arc B580 Limited Edition可以勝任2K分辨率高畫質遊戲,AI應用加速和創意等多方面的工作,作為目前最強的Arc顯卡,Intel Arc B580 Limited Edition表現得足夠好。
Intel Arc B580無疑是當下消費級GPU領域一個新晉性價比挑戰者,背靠英特爾強大技術實力和研發,以及未來的Celestial(天人)與Druid(德魯伊)的規劃,已然看到英特爾計劃在GPU領域持續深耕的堅持。
如果你著眼於主流遊戲表現和高性價比的PC配置,Intel Arc B580完全可以成為新的選擇參考項,它已經能夠勝任現階段主流3A遊戲和AI應用的任務,同時也給未來軟件升級保留了充足可能性,光憑這兩點,就足以讓人下單買買買了。