在GeForce RTX 30和RTX 40時代,4K分辨率,最高畫質,外加光線追蹤以超過100FPS的效率運行3A級遊戲大作,是旗艦級GPU才能完成的工作。按照GeForce RTX 3070和RTX 4070的定位,4K最高畫質通常只能達到及格線水平,玩家們通常會退而求其次選擇2K分辨率進行遊戲。
有意思的是,4K高刷遊戲顯示器定價不斷下探,2K顯示器與4K顯示器之間的價差已經不大,一款能夠面向中高端主流,能完全開啟4K最高畫質3A遊戲大作的GPU勢在必行,在這個時間節點上,NVIDIA GeForce RTX 5070 Ti就顯得格外重要了。
簡單的說,NVIDIA GeForce RTX 5070 Ti是一款令人印象深刻的顯卡,它首次讓70系GPU在4K最高畫質且開啟光線追蹤的前提下,以輕鬆超過100FPS甚至更高的遊戲幀率進行。不僅如此,GeForce RTX 5070 Ti還配備了2個第九代NVENC視頻編碼器,1個第六代NVDEC視頻解碼器,配合NVIDIA Studio在行業中的影響力,同樣可以很好的勝任內容創作工作。而針對FP4的原生支持,也讓GeForce RTX 5070 Ti在AI創作領域有不錯的戰鬥力。
這款官方定價6299元(MSRP)的GeForce RTX 5070 Ti無疑有很多值得期待的地方,趁著評測解禁,不妨跟著我們一起看看這款GPU的真正實力,GeForce RTX 5070 Ti首發評測就此奉上。由於這個版本GPU目前沒有Founders Edition版本,這裡我們使用影馳 GeForce RTX 5070 Ti刃作為參考。
與RTX 5080同源
GeForce RTX 5070 Ti使用的是與GeForce RTX 5080同源的Blackwell GB203,通過限定GPC(Graphics Processing Clusters,圖形處理集群)和TPC(Texture Processing Clusters,紋理處理集群)數量,來實現定位上的差別。
Blackwell GB203沿用了此前Ampere和Ada Lovelace架構設計理念,包含第五代Tensor Core,第四代RT Core,神經網絡著色器等新硬件,以支持包含DLSS 4,RTX Mega Geometry在內的大量新技術。芯片基於臺積電4NP定製工藝製造,面積378 mm²且包含456億個晶體管。
因此一個Blackwell GB203中包含若干個GPC,每個GPC下面再包含若干個TPC,每個TPC下包含若干個SM(Streaming Multiprocessors,流式多處理器),同時再搭配顯存控制器等周邊電路。
完整的GB203已經用到了GeForce RTX 5080上,核心型號GB203-400-A1。包含了7個GPC,每個GPC包含6個TPC,以及對應的1組光柵引擎(Raster Engine),2組ROP集群(Raster Operations,光柵操作)。
對應的,GeForce RTX 5070 Ti使用的核心型號為GB203-200-A1,採用了6個GPC,35個TPC,意味著其中一個GPC還屏蔽了1個TPC。因此總共包含70個SM,每個SM包含128個CUDA Core,因此總共包含8960個CUDA Core。
此外每個SM包含4個第五代Tensor Core和1個第四代RT Core。GeForce RTX 5070 Ti總共包含280個第五代Tensor Core和70個第四代RT Core,GPU Boost頻率達到2452 MHz。
在顯存上,GeForce RTX 5070 Ti搭配了16GB GDDR7 256-bit顯存,顯存頻率28 Gbps,顯存帶寬896 GB/s,對比RTX 4070 Ti的12GB GDDR6X 192-bit 21Gbps有顯著提升。
因此在整體功耗上,GeForce RTX 5070 Ti可以控制在300W。電源接口則保持使用12VHPWR接口,並提供16pin(12+4)轉接8pin x3電源線,以兼容舊規格電源。
這裡我們慣例列舉一些重要參數作為比較:
影馳GeForce RTX 5070 Ti刃
幫助GB203-400-A1核心散熱需要一套合理的散熱結構設計。影馳GeForce RTX 5070 Ti刃系列引入了神話故事作為靈感,在顯卡裝甲中融入刃式裝甲與符咒元素,配合硬朗的顯卡線條設計,為其增添了不少力量感和神秘感。
影馳GeForce RTX 5070 Ti刃(BLADE)系列一共提供了黑色和白色兩個版本,其中白色稱為影馳GeForce RTX 5070 Ti聖刃。
黑色則為本次評測的版本,稱為影馳GeForce RTX 5070 Ti魔刃。兩款產品都配備了刃式散熱裝甲。並使用3個90mm直徑的霜環風扇,支持靜音啟停。在壓力測試下,影馳GeForce RTX 5070 Ti刃的風噪可以保持在46.6dBA。
散熱裝甲下則使用了鍍鎳熱管、均熱板與散熱片結合,配合優化後的風道設計,確保了GeForce RTX 5070 Ti的散熱性能。同樣在壓力測試下,室溫20℃環境中,表面最高溫度38℃不到,GPU核心溫度63℃。
GALAX Aurora RGB信仰Logo燈效在這一代也沒有落下,並且使用了磁吸設計,可以根據喜好放在顯卡的正上方,或者側方。移動位置的方式非常簡單,在任何時候將其扣下,放到另一邊,靠近後通過磁吸即可固定點亮,非常方便。
影馳GeForce RTX 5070 Ti刃的設計非常緊湊,符合SFF-Ready標準,也使得這張顯卡可以輕鬆放進ITX機箱中。
而在接口方面,影馳GeForce RTX 5070 Ti刃與公版看齊,包括3個DisplayPort 2.1b接口和1個HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技術,最高可以實現480Hz條件下實現4K 12-bit HDR。如果使用並聯兩個DisplayPort 2.1b搭配的形式,則可以達到100Hz條件下8K HDR效果。HDMI 2.1a則同樣支持DSC技術,最高支持165Hz條件下8K 12-bit HDR。
目標:4K最高畫質
現在我們知道CES 2025上,黃仁勳特別強調GeForce RTX 5070性能優於RTX 4090是特指在DLSS 4運行的AI前提下實現。DLSS 4可以一步到位通過人工智能提升幀率,降低延遲,改善遊戲畫質。特別是引入了全新的多幀生成技術(Multi Frame Generation,MFG),提供更快的性能和更低的內存使用,並且由CNN卷積神經網絡模型更換到了Transformer模型,超分辨率(Super Resolution,SR),光線重建(Ray Reconstruction,RR),深度學習抗鋸齒(Deep Learning Anti-Aliasing,DLAA)均獲得了新的進展,圖像質量和穩定性有所提升。
DLSS 4取消DLSS 3上配合的光流加速器,改用第五代Tensor Core與Transformer模型配合判斷遊戲幀的空間、時間關係。同時, NVIDIA雲端AI不斷提供優化。
DLSS 4中能讓GeForce RTX 5070 Ti具備輕鬆超過4K 100FPS表現的技術即是多幀生成(DLSS 4 Multi Frame Generation)。原本在DLSS 3上,幀生成佔據1/8的內容,到了DLSS 4,則硬件渲染實際上只佔據1/16,也就是在DLSS 4遊戲中,每16幀遊戲畫面中,實際上有15幀是由AI加速完成的。這意味著即使硬件性能變化不大的前提下,實際遊戲幀率仍然可以有質的提升。再加上DLSS本身對場景中的陰影、反射和遮擋有了很好的理解,實際生成效果也遠比純靠硬件生成的效果好很多。這意味著,在傳統渲染的基礎上,通過AI在每幀之間多生成三幀的額外幀,並且與其他的DLSS技術套件協同工作。
這裡測試平臺我們使用了Z790搭配Core i9-14900K作為平臺,並配備32GB DDR5-7200,1250W電源作為參考。顯示器使用了4K雙模的ROG XG27UCG。
在UL 3DMark DLSS Feature Test中,可以看到開啟DLSS 4 4X的模式下,GeForce RTX 5070 Ti甚至可以優於RTX 4090 D。
NVIDIA也表示,DLSS 4遊戲和應用將會很快實裝,在近段時間內就會有75款應用和遊戲支持DLSS 4。這裡我們主要與RTX 4070 Ti SUPER進行比較。這裡先用《心靈殺手2》作為對比,開啟DLSS 4 4X之後,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的2倍。
同時遊戲畫面中諸如鐵絲網的細節不再出現迷之抖動,DLSS 4 4X的穩定性比DLSS 3要好很多,甚至比原畫質也好上不少。
同樣,《霍格沃茨之遺》也是在4K分辨率最高畫質下進行,DLSS 4 4X加持下的GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的1.84倍。遊戲場景中的壁畫細節在DLSS 4 4X下會更為清晰。
《電馭叛客2077》已經在正式版中對Transformer模型和DLSS 4提供了支持。在設置中就能找到DLSS Super Resolution的選項。開啟DLSS 4 4X後,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的2.5倍。
這裡不妨讓我們也進行一下畫質對比,風扇在鐵絲網後的旋轉導致的複雜光影,在DLSS 4下表現的更為穩定。
《星球大戰:亡命之徒》開啟DLSS 4 4X後,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的1.91倍。
同樣遊戲中也獲得了更多的陰影細節,例如植物葉片邊緣不再有陰影抖動。
喜聞樂見的DND遊戲《龍騰世紀4:影障守護者》在光影效果呈現上也能得到很好的展示。在開啟DLSS 4 4X之後,遊戲細節獲得了明顯提升,陰影也不再抖動了。開啟DLSS 4 4X後,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的2倍。
《漫威爭鋒》開啟DLSS 4 4X後,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的2.1倍。
順帶一提,目前NVIDIA APP已經可以通過DLSS優設(Override)來調整《漫威爭鋒》和《龍騰世紀4:影障守護者》表現,即在遊戲之外就可以完成對遊戲的畫質與DLSS設置,在很大程度上省略了很多的麻煩。
同時我們也能看到開啟DLSS 4之後,系統延遲並沒有因此會有大幅變化。NVIDIA甚至為了解決多幀生成帶來的不確定性,Blackwell使用了增強版的幀翻轉計量(Flip Metering)作為解決方案,它將幀節奏邏輯轉移到顯示引擎上,讓GPU可以更精確的管理顯示時序。
除了遊戲,諸如D5渲染器這樣的專業應用也已經引入了對DLSS 4的支持。例如在軟件菜單中,可以看到Super Resolution,Ray Reconstruction和Frame Generation選項。
在同一個場景中,GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的3.2倍,同時也是RTX 4090 D的1.8倍,實際使用體驗中非常接近RTX 5080了。
基礎性能進階
RTX 50系列光柵基礎性能也是大夥最關心的測試之一。這裡慣例引用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。
從綜合來看,GeForce RTX 5070 Ti表現可以與RTX 4080打得有來有回。如果對比GeForce RTX 5070 Ti與RTX 4070 Ti SUPER,提升幅度平均在7%到20%之間。
遊戲實戰部分,我們使用2K分辨率最高畫質,且開啟光線追蹤進行。在DLSS 3遊戲中,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升25%到50%,變化還是非常大的。
如果是時間更早的DLSS 2遊戲,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升也有在25%到30%之間。
值得說明《鳴潮》PC版也很快加入對DLSS 3的支持,作為橫跨多端的遊戲,在GeForce RTX 5070 Ti上通過開啟光追、DLSS 3,在4K分辨率下可以輕鬆獲得超過150FPS表現。這裡我們在部分場景中開啟式和關閉光線追蹤進行對比,例如下圖牆壁光影和人物攀爬時候的倒影清晰可見。
開啟光追後,草原景色變得更為生動。
溪流光影也變得更為自然。
AI創作能打
文章開頭我們提到GeForce RTX 5070 Ti配備了2個第九代NVENC編碼器和1個第六代NVDEC解碼器,並且在硬件上提供對YUV 4:2:2支持。YUV 4:2:2是目前獲取更多顏色信息、減少文件大小,滿足帶寬需求的合理選擇。在YUV 4:2:2視頻中,完整的亮度值被保留,同時保留了一半的原始色度信息,YUV 4:2:2壓縮視頻幀僅佔YUV 4:4:4的三分之二,同時提供了YUV 4:2:0兩倍的顏色分辨率。
這裡我們通過DaVinci Resolve 19編輯4:2:2視頻素材進行了嘗試,在輸出選項中,可以看到H265 422 10bit編碼選項,這裡我們輸出一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材。
這裡能夠看到GeForce RTX 5070 Ti只需要花費10秒時間,就能完成一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材。對應的,Core i9-14900K需要56秒才能實現。
在渲染測試中,我們選擇了V-Ray 6 Benchmark和Blender Benchmark 4.3.0。
這裡可以看到GeForce RTX 5070 Ti在V-Ray 6 Benchmark中的表現高於RTX 4080 SUPER。同時GeForce RTX 5070 Ti表現是RTX 4070 Ti SUPER的2.5倍。
Blender Benchmark 4.3.0中,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升5%。
SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。這裡GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升1%到20%不等。
最後是喜聞樂見的AI表現。Blackwell開始從硬件層面引入對FP4數據格式支持,則可以很好的解決這個問題。原因是FP4提供了一種較低的量化方式,類似於文件壓縮,能夠減少模型的大小。
相對大多數模型默認使用的FP16精度相比,FP4所需的內存是FP16的不到一半,並且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,FP4可以通過NVIDIA TensorRT模型優化器的量化方式,確保質量不會有太多損失。
這裡先通過UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA進行測試。FLUX.1是一個基於FP4模型,擁有120億個圖像生成模型參數。可以看到GeForce RTX 5070 Ti表現與GeForce RTX 5080相近,並且由於對FP4的原生支持,GeForce RTX 5070 Ti的速度是RTX 4080 SUPER的3倍,GeForce RTX 4070 Ti SUPER會差的更遠。
UL Procyon 的Stable Diffusion 1.5 FP16以及Stable Diffusion XL FP16的測試中,也可以看到明顯差距。GeForce RTX 5070 Ti表現與RTX 4080 SUPER有來有回,相對RTX 4070 Ti SUPER則是提升幅度明顯。
UL Procyon AI文本生成基準測試包含了多個大語言模型LLMs作為AI性能評估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。也可以看到GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升在20%左右。
最後是由MLCommons聯盟開發的機器學習基準測試MLPerf,MLCommons聯盟來自哈佛大學、斯坦福大學、NVIDIA、谷歌的工程師和研究人員。這裡MLPerf-client使用Meta的Llama2-7B模型進行。GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升在12%到17%之間。
寫在最後:4K遊戲利器
NVIDIA GeForce RTX 5070 Ti給人印象不錯,DLSS 4 4X加持後可以輕鬆讓3A級遊戲在4K最高畫質且開啟最高光追效果的前提下,輕鬆將幀率拉昇至140FPS甚至200FPS以上,放在以前主流級GPU而言是不敢想象的。
重點是DLSS 4的支持速度遠比我們迅速得多,接下來包括《黑神話:悟空》在內的75款遊戲和應用會陸續對DLSS 4提供支持,而未來的3A級遊戲大作,通過DLSS 4獲得4倍的幀率提升,獲得流暢的4K最高畫質遊戲體驗也將成為基本盤。
不僅如此,得益於原生支持FP4以及新一代的編解碼器,GeForce RTX 5070 Ti的AI性能和內容創作實際表現也已經遠超上一代旗艦級顯卡。哪怕是在基礎光柵性能上,GeForce RTX 5070 Ti的表現已經大致上與RTX 4080 SUPER相當,後者定價已經來到近萬元,對比之下,6299元GeForce RTX 5070 Ti得以彰顯。
另外影馳GeForce RTX 5070 Ti刃在實際體驗過程可圈可點,紮實的做工和優秀的散熱表現,讓GeForce RTX 5070 Ti性能得以很好的釋放。對於大多數玩家而言,購買非OC款GPU已經能夠獲得很好的體驗。
如果你是RTX 4070 Ti或者RTX 3070以前的用戶,不要猶豫,在第一時間入手GeForce RTX 5070 Ti,發揮4K高刷顯示器展現出真正的實力,無疑是最酸爽的。