NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce


3樓貓 發佈時間:2025-01-19 06:38:21 作者:愛極物 Language

 

CES 2025期間,NVIDIA在拉斯維加斯邀請了全球範圍內的核心媒體參加時隔已久的NVIDIA Editor’s Day。這也是疫情之後,全球媒體再次相聚。能在忙碌的CES 2025展會期間,讓大多數科技媒體空出寶貴的一天時間,僅針對GeForce RTX 50系列的硬件和技術展開討論,足以見得其重要性。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第0張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第1張

 

這場盛會的主角,自然包括了NVIDIA Blackwell,GeForce RTX 50系列臺式機GPU,乃至GeForce RTX 50系列Laptop GPU,以及圍繞其所構建的一大堆技術,比如DLSS 4,Reflex 2,RTX Neural Shaders神經著色器。而這些新硬件和新技術也帶來了很多問題,GeForce RTX 5090是如何做到最高畫質4K 240FPS的,神經網絡渲染究竟是什麼,未來的遊戲究竟會變成什麼樣子?

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第2張

 

神經網絡渲染:未來十年圖形技術新基石

 

在CES 2025主題演講開篇,黃仁勳就展示了一段名為Zorah的DEMO,整個DEMO由GeForce RTX 5090在後臺通過DLSS 4進行實時運算,同時也昭示著神經網絡渲染登上游戲實時計算的舞臺,將僅由硬件堆疊的粗暴渲染方式送入淘汰進程。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第3張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第4張

 

神經網絡渲染其實很好理解,就是將神經網絡集成到渲染過程中,讓性能、圖像質量、遊戲互動性上獲得質的提升,從而獲得更好的遊戲沉浸感。

 

神經網絡渲染最好的體現之一就是DLSS,通過低分辨率渲染幀輸入給訓練過的神經網絡,然後以全分辨率的圖像輸出。重點是,DLSS不僅能做到生成完整的幀,還能夠理解場景的組成,包括場景中的陰影、反射和遮擋,讓生成的圖像效果足以媲美原生 。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第5張

 

DLSS從2019年正式實裝遊戲至今,也已經發生了質的變化。最初的DLSS 1.0版本需要針對遊戲進行專門的訓練,在經過調整之後可以正式運行在Tensor Core中。從DLSS 3開始增加了光流加速器作為協助,使得GeForce RTX 40系列以後的GPU可以自然的在實際渲染幀之間插入生成幀,也就是大名鼎鼎的DLSS 3 幀生成技術。DLSS 3.5增加了光線重建功能,並開始引入AI模型取代降噪算法,並將訓練量提升至DLSS 3的五倍。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第6張

 

DLSS 4則是在DLSS 3.5的基礎上更進一步,第一次引入多幀生成的技術。在DLSS 3上,幀生成佔據1/8的內容,到了DLSS 4,則硬件渲染實際上只佔據1/16,也就是在DLSS 4遊戲中,每16幀遊戲畫面中,實際上有15幀是由AI加速完成的。這意味著即使硬件性能變化不大的前提下,實際遊戲幀率仍然可以有質的提升。再加上DLSS本身對場景中的陰影、反射和遮擋有了很好的理解,實際生成效果也遠比純靠硬件生成的效果好很多。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第7張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第8張

 

有意思的是,DLSS也僅僅是一個開始。在NVIDIA Blackwell上,工程師將神經網絡集成到可編程著色器中,從而構成了GeForce RTX 50系列神經網絡著色器(RTX Neural Shaders)。同時也可以看到,所有的Blackwell CUDA Core均支持FP32/INT32,不像Ada Lovelace CUDA Core在一個SM中,只有一半CUDA Core支持FP32/INT32,另一半僅支持FP32。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第9張

 

RTX Neural Shaders被認為是未來十年推動圖形技術創新的基石,它可以將紋理壓縮7倍,進而節省出大量的圖形的顯存。RTX Neural Shaders的應用範圍很廣泛,除了處理紋理壓縮(Texture Compression)之外,也能兼顧到輻射緩存 (Radiance Caching),材質 (Materials)和輻射場 (Radiance Fields)的計算。

 

RTX Neural Shaders SDK允許開發者能夠在RTX AI PC上訓練遊戲數據和著色器代碼,並通過Tensor Core加速神經表示和模型權重,在訓練過程中,神經網絡訓練的遊戲數據還會與傳統渲染的遊戲數據進行對比,從而獲得多次迭代進化。開發團隊還可以使用著色語言Slang簡化訓練過程,將大型複雜的函數,拆分成更小、更容易處理的部分。利用RTX Neural Shaders還能創造出高質量的紋理,幫助遊戲場景實現更先進的光照效果。

 

微軟也進而表示,DirectX也將很快對這套技術提供支持,以確保進一步發揮Tensor Core的能力,讓遊戲開發團隊能夠在Windows平臺上更好的使用神經網絡著色器(Neural Shaders)。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第10張

 

因此可以看到RTX Neural Shaders可以專注於三個方向的應用,即:

 

RTX神經網絡紋理壓縮(RTX Neural Texture Compression)

RTX神經網絡材質(RTX Neural Materials)

RTX神經網絡輻射緩存(RTX Neural Radiance Cache,RTX NRC)

 

簡單的展開,可以這麼理解:

 

RTX神經網絡紋理壓縮(RTX Neural Texture Compression):利用AI在不到一分鐘的時間內壓縮成千上萬的紋理,他們的神經網絡表示可是實時存儲、訪問,並且可以直接加載到顯 存中,無需進一步修改。神經壓縮紋理在相同的視覺質量下,可以比傳統塊壓縮紋理節省7倍的顯 存。

 

RTX神經網絡材質(RTX Neural Materials):利用AI壓縮離線材質的複雜著色器代碼,這些材質通常由多個層次構成,比如渲染陶瓷、絲綢的場景。神經網絡材質處理速度相對傳統方式提升了5倍,這讓遊戲級的幀率渲染,擁有電影級畫質成為了可能。要知道,以往好萊塢一幀高質量畫面通常需要數小時甚至更多才能完成。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第11張

 

RTX神經網絡輻射緩存(Neural Radiance Cache,NRC):利用實時遊戲數據訓練的神經網絡,可以更準確高效地估算遊戲場景中的間接光照。NRC通過追蹤1到2條光線,隨後將其存儲在輻射緩存中,並推斷出無線數量的光線和反彈,進而更準確的表達出遊戲場景的間接光照效果。這麼處理,不僅讓路徑追蹤的間接光照效果得到了改善,同時也減少了需要追蹤的光線數量,性能也進一步得到提升。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第12張

 

值得一提,NRC現在已經可以在RTX全局光照SDK中使用,NVIDIA計劃在未來幾個月內通過RTX Remix推出一個全新版本的《Portal with RTX》作為RTX NRC的DEMO供業界參考。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第13張

 

RTX Neural Faces:讓虛擬人更像真人

 

在現場,NVIDIA舉了一個例子,工程師利用RTX Neural Shaders構架一套名為RTX Neural Faces(RTX神經網絡面孔)方案,通過AI生成的方式提升遊戲任務的面部質量。這套方案與傳統的渲染不同,為RTX Neural Faces獲取簡單的光柵化面孔和3D姿勢後,再利用生成式AI模型構建出更為自然的面孔,也進而釋放了GPU的硬件性能。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第14張

 

渲染人類面孔其實是實時圖形中一個非常具有挑戰的任務,因為人類對人類太熟悉了,導致人類可以輕易差距到虛擬人類臉上的細微偏差,如果處理得不好,就會導致陷入恐怖谷效應,作為3D遊戲的老玩家,這一大段長長的記憶一般都深有體會。

 

RTX Neural Faces提供了一種創新的方法,通過生成式AI來改善面部質量。與直接渲染不同,RTX Neural Face只需要簡單的光柵化面孔和3D姿態數據作為基礎,就可以實時通過生成式AI模型推斷出自然的面孔展現。而在此之前,模型已經經過數千張離線數據的學習和訓練,涵蓋不同角度、光照、情感和遮擋條件。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第15張

 

這一訓練流程可以使用真是的照片或者AI圖像完成,並通過擴散模型生成不同的版本。訓練好後的模型也會經過NVIDIA TensorRT優化,從而確保自然的效果。

 

不僅如此,RTX Neural Faces與用於頭髮和皮膚的RTX角色渲染(RTX Character Rendering)SDK相輔相成。因為遊戲角色的頭髮、皮膚如果希望獲得真實的展現,也同樣具有很高的挑戰性。但如果按照傳統方式,即便使用最先進的頭髮技術,也需要每根髮束30個三角形,整個髮型400萬個三角形完成,如果利用光線追蹤的包圍體層次加速結構(BVH,Bounding Volume Hierarchy)解決,代價非常高,速度也非常慢。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第16張

 

這裡GeForce RTX 50系列使用了一套名為線性掃掠球體(Linear-Swept Spheres,LSS)的方式,LSS通過減少渲染髮束的數量,通過球體代替三角形,能夠更為精準的展現頭髮的形狀,也使得在佔用較少顯存的前提下,針對頭髮的光線追蹤成為可能。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第17張

 

針對皮膚也是如此,NVIDIA使用了一套名為次表面散射(Subsurface Scattering,SSS)的方式模擬了光線穿透半透明材料的效果,從而獲得皮膚的柔和、自然感。這裡現場工作人員利用了一個獵頭蟹DEMO作為展示 。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第18張

 

AI驅動光照和RTX Mega Geometry

 

隨著虛幻引擎5 Nanite幾何體系統的推出,開發者可以構建數億個三角形的開放世界,光線追蹤場景的複雜度也是指數級上升,每一幀不同細節層次(LOD)構建層次包圍盒(BVH)的成本也呈指數級增長,按照這麼發展,實時幀率將變得不可能。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第19張

 

對於這個複雜環境下的光照效果挑戰,NVIDIA的做法是提供了一套名為RTX Mega Geometry進行更高效的組織加速結構,讓開發者能夠生成最多100倍的光線追蹤三角形,並藉助NVIDIA Opacity Micro-Maps更好的編碼複雜材質的透明度,進而確保複雜場景中逼近現實的真實光照。

 

複雜結合體通過RTX動態光照獲得了準確的照明效果,並通過最新的ReSTIR路徑追蹤算法,將算力集中在主要的光線路徑上,RTX全局光照則使用AI驅動,從而減少光線追蹤反射所需的計算量。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第20張

 

現在RTX Mega Geometry已經可以智能的通過GPU上批量生成三角形集群,進而減少CPU負擔,提升光線追蹤場景中的性能和圖像質量。NVIDIA也表示RTX Mega Geometry很快也會加入到NvRTX的虛幻引擎分支中,幫助虛幻引擎Nanite幾何體系統更好的完成光線追蹤項目。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第21張

 

DLSS 4:神經網絡圖形進化的新形態

 

NVIDIA DLSS由GeForce RTX Tensor Core所驅動,進階到近期的版本之後已經擴展成為一套相當完整的解決方案,包括提升遊戲幀率,提供更清晰和更高質量的圖像,目前已經有超過700款RTX遊戲和應用對DLSS提供了支持。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第22張

 

DLSS 4最大的變化之一就是帶來了多幀生成技術(Multi Frame Generation),這是GeForce RTX 50系列GPU的專屬功能,意味著未來的一段時間中,只有採用GeForce RTX 50系列的臺式機和筆記本才能獲得對應的功能。NVIDIA表示,在DLSS 4發佈時,會有75款遊戲和應用率先支持DLSS多幀生成技術(DLSS Multi Frame Generation)。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第23張

NVIDIA應用與深度學習研究院副總裁,Bryan Catanzaro

(傳說DLSS性能越強,他的頭髮越長)

 

如前面所說,DLSS多幀生成技術,是在傳統渲染的基礎上,通過AI在每一幀的基礎上多生成三幀的額外幀,並且與其他的DLSS技術套件協同工作。由於DLSS本身就允許遊戲實際渲染以低分辨率進行,再以全分辨率高質量輸出,因此實際獲得的效果是傳統渲染能力的8倍,從而讓GeForce RTX 5090獲得在開啟光線追蹤最高畫質的前提下,以4K 240FPS的極高幀率運行遊戲。

 

在現場,NVIDIA用採用了DLSS 4的《電馭叛客2077》作為參考,幀率比傳統渲染提升了8倍以上,同時PC系統延遲減少了50%,畫質也有了進一步提升。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第24張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第25張

 

DLSS 4同時也是2020年DLSS 2.0發佈以來,最大的AI模型升級,在DLSS 3.5上所構建的DLSS光線重建技術(DLSS Ray Reconstruction),DLSS超分辨率(DLSS Super Resolution),以及DLAA(Deep Learning Anti-Aliasing)深度學習抗鋸齒技術全部引入到實時計算的Transformers模型中,用來代替此前的卷積神經網絡(Convolutional Neural Networks,CNN)。

 

Transformers在商用領域倍廣泛採用,前沿的AI模型,比如ChatGPT、Flux和Gemini均是在Transformers架構下實現的。NVIDIA表示,DLSS Transformers的引入,可以獲得更好的穩定性,更少的鬼影,更高質量的運動細節,圖像質量也因此獲得進一步提升。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第26張

 

讓人高興的是,DLSS Transformers並非GeForce RTX 50系列GPU獨佔,所有支持DLSS光線重建技術(DLSS Ray Reconstruction),DLSS超分辨率(DLSS Super Resolution),以及DLAA的遊戲後續都會轉換到DLSS Transformers架構下,意味著老款GeForce RTX GPU的用戶,在不花錢的前提下也能獲得更好的效果。

 

同時,由於新技術帶來的顯存需求降低,幀生成技術的表現也可以同時在GeForce RTX 50系列和GeForce RTX 40系列上獲得提升。只不過多幀生成技術是最新的GeForce RTX 50系列獨佔。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第27張

 

致勝新法寶:DLSS多幀生成

 

DLSS 3的幀生成技術是通過AI模型,利用遊戲中的數據,比如運動矢量、深度,以及通過GeForce RTX 40系列GPU中的光流加速器硬件生成的光流場來獲得一個額外的幀。這樣的幀生成方式成本是非常高昂的,因為每一個幀生成,都需要光流加速器、AI模型共同協作,意味著GPU要花費額外的開銷,進而也影響輸入幀率。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第28張

 

Transformer模型的好處是,新幀生成通過DLSS Transformer AI模型速度提升了40%,顯存使用減少了30%,並且每個渲染幀只需要運行一次,就可以生成多個幀。比如在《戰錘40K:暗潮》中,利用新模型可以獲得10%的幀率提升,在4K最高畫質的環境下使用DLSS幀生成,能夠進一步減少400MB的顯存佔用。

 

此外,DLSS 4利用DLSS Transformer AI模型代替了原來的硬件光流加速器,加速了光流場的生成,並通過兩個AI模型協作,顯著降低了額外幀生成的計算成本。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第29張

 

即便如此,GPU在渲染每一個遊戲幀的時候,還是需要執行5個以上的AI模型,比如DLSS光線重建技術,DLSS超分辨率這些AI模型都必須在幾毫秒之內完成,否則DLSS多幀生成就會成為性能瓶頸。

 

解決這個問題的首要方案就是提升硬件性能。GeForce RTX 50系列GPU的第五代Tensor Core支持FP4精度,在AI性能上能有高達2.5倍提升。與此同時,為了規避多幀生成導致CPU與GPU之間節奏的不同步,所導致的節奏波動,Blackwell中採用了硬件翻轉計量方式,將幀節奏的控制邏輯轉移到顯示引擎中,確保Blackwell GPU可以更精確的管理顯示時序,同時像素處理能力也獲得增強,以支持更高分辨率和刷新率。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第30張

 

從NVIDIA展示的最終結果來看,DLSS 4帶來的多幀生成、光線重建、超級分辨率,可以讓其幀率相對傳統渲染方式提升8倍,從幀生成到多幀生成可以提升1.7倍。

 

DLSS Transformer模型:突破CNN極限

 

DLSS Transformer之前,DLSS使用的是卷積神經網絡(Convolutional Neural Networks,CNN)局部分析前後幀內容在區域內的連續變換,從而推導生成新的像素。從2019年至今的6年中,NVIDIA發現DLSS CNN架構已經到達極限,DLSS Transformer正是時候。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第31張

 

DLSS Transformer模型主要利用的是視覺Transformer,能夠同時評估整個幀中每個獨立像素相對重要性,並進行跨幀判斷。由於DLSS Transformer模型參數比CNN多一倍,新的模型可以更好的理解場景,進而確保生成像素的穩定性,並獲得更多運動細節,以及平滑的場景邊緣。

 

特別是在高強度的光線追蹤畫面中,依靠DLSS Transformer構建的光線追蹤重建可以更好的提升圖像質量。在現場,NVIDIA通過《心靈殺手2》進行了展示,可以看到使用DLSS Transformer後,鐵絲網表現得更穩定,同時風扇葉片鬼影減少,電線上的閃爍也被消除。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第32張

 

另外一個展示是《地平線:西域禁地》中,DLSS Transformer可以給女主角帶來很好的紋理效果。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第33張

 

由於DLSS Transformer本身以及多幀生成技術與DLSS有很好的兼容性,因此GeForce RTX 50系列上市時候,就能獲得至少75款遊戲和應用的支持,與此同時,所有GeForce RTX用戶也可以在超過50款遊戲中體驗到DLSS Transformer帶來的DLSS光線重建、DLSS超級分辨率和DLAA的提升。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第34張

 

其中,與GeForce RTX 50系列GPU首發支持DLSS 4多幀生成技術的遊戲包括:

 

《心靈殺手2》

《電馭叛客2077》

《奪寶奇兵:古老之圈》

《星球大戰 絕地:倖存者》

《黑神話:悟空》

 

預告支持DLSS 4多幀生成技術的遊戲包括:

 

《永劫無間》

《漫威爭鋒》

《微軟飛行模擬2024》

 

即將推出,且將會原生支持的DLSS 4多幀生成技術的遊戲包括:

 

《黑色國度》

《毀滅戰士:黑色時代》

《沙丘:覺醒》

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第35張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第36張

 

NVIDIA Reflex 2:用Frame Warp實現乾坤大挪移

 

與DLSS 4對應的是NVIDIA Reflex 2,如前面所說,為了應付多幀生成帶來的延遲,以及CPU與GPU之間的節奏問題,Blackwell中採用了硬件翻轉計量,將幀節奏的控制邏輯轉移到顯示引擎中,確保Blackwell GPU可以更精確的管理顯示時序。

 

不僅如此,NVIDIA Reflex 2的低延遲模式還和全新的Frame Warp結合,在渲染的遊戲幀發送到顯示器之前,就將鼠標輸入的關鍵幀提交給最終判定,從而提升關鍵操作的成功率,進一步降低系統延遲。

 

在瞭解Frame Warp和NVIDIA Reflex 2如何實現之前,我們先簡短的回顧遊戲中操控指令的實現方式。在遊戲中,玩家每一個動作都需要通過複雜的渲染管道處理之後,最終呈現在屏幕上。並且每一個步驟都會帶來延遲。能做出關鍵操作的鍵盤和鼠標輸入也需要先經過CPU判斷,然後放在渲染隊列中,最終輸出到顯示器上。整個過程執行通常需要數十毫秒,如果停頓和等待複雜的渲染隊列,延遲還會進一步增加。因此最初、最淳樸的降低系統延遲的方式就是提升GPU性能,提升遊戲幀率。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第37張

 

NVIDIA Reflex的做法是在遊戲引擎SDK中集成對鼠標到顯示器的延遲管道優化,讓Reflex可以更好的控制CPU,防止CPU超前運行,讓關鍵幀以最短的時間到達屏幕,獲得更低的系統響應。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第38張

 

NVIDIA Reflex 2使用了不同的方式降低延遲,並且源自於一項有意思的發現。大約在2021年,NVIDIA的電子競技研究團隊發現,當遊戲幀在渲染後根據更近期的鼠標輸入進行更新時,玩家完成瞄準任務的速度更快,並且可以額外的減少80毫秒延遲,以及提升40%左右的關鍵操作準確率。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第39張

 

舉個例子。當玩家將鼠標移向右側的時候,通常需要等待一段時間系統才會接受到對應的操作指令,並針對新的視角進行渲染。那麼這時候一個大膽的方法來了,如果這時候系統不渲染新畫面,而是對現在的遊戲幀向右移動或者扭曲,是不是可以更快呢?

 

NVIDIA Reflex 2 Frame Warp大致就是這個思路。當GPU正在渲染一個幀的時候,CPU會基於最新的鼠標、鍵盤輸入的關鍵指令獲得下一幀的相對位置,Frame Warp直接從CPU獲得對應的新視角,並將GPU渲染的幀直接扭曲到對應的位置。這個處理過程在渲染管道中儘可能晚進行,從而確保鼠標輸入指令能夠更快的在屏幕上獲得反應。

 

Frame Warp本質就是別急著渲染下一幀,而是節省資源對當前幀進行變化,這意味著實際遊戲圖像中會產生一些未被渲染的空白,如果這些空白太多,會直接影響到遊戲的整體感受。這裡NVIDIA使用了一套延遲優化的預測渲染算法,利用當前幀的相機、顏色、深度數據來彌補這些空白處,從而在體感和操控上獲得一致。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第40張

 

從最終結果來看,NVIDIA Reflex 2可以做到讓PC系統延遲降低75%,在《無畏契約》中可以做到3毫秒的延遲,這個成績是目前全球範圍內所有第一人稱射擊遊戲中最低的。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第41張

 

NVIDIA ACE和數字助手

 

在CES 2025現場,NVIDIA ACE和數字助手也是被重點宣傳的方向。雖然遊戲AI在遊戲世界中已經用了幾十年,但實際上游戲中的NPC都是按照固定的程序套路化和玩家進行交互,NVIDIA ACE出現打破了NPC只有固定說話方式的可能性,提供了一種全新的自主交互方式。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第42張

 

NVIDIA ACE在2023年首次推出,是一套將生成式AI對話應用於遊戲角色的技術。在生成式AI幫助下,NVIDIA ACE塑造的遊戲人物會更有自主互動感,配合本地小語言模型,還可以即時響應玩家文字、音頻甚至視覺互動。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第43張

 

這套技術現在應用到了更廣的範圍,CES 2025現場提供了《絕地求生》、《永劫無間手遊》PC 版的NVIDIA ACE AI隊友試玩,另外現場還展示《MIR5》則是由AI驅動的BOSS,根據對手的動作做出類似人類的判斷。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第44張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第45張

 

有意思的是,《暗影火炬城》的製作團隊也使用NVIDIA ACE打造了一個《動物朋克》的DEMO,通過語音或者文字與NPC進行交互。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第46張

 

Project G-Assist數字助手則是圍繞GeForce RTX PC打造的系統級助手,你可以將它看成NVIDIA app的AI版本,通過語音、文字交互就能實時判斷當前PC的性能、優化設置、效率、遊戲設置等等。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第47張

 

Project G-Assist數字助手本質上也是由NVIDIA ACE構建,並由GeForce RTX GPU進行本地驅動,通過專門調優的本地小語言模型SLM,GeForce RTX PC可以高效的理解自然語言指令,並幫助玩家進行對應的操作。在AI PC概念盛行的當下,NVIDIA ACE加持無疑可以比一些小打小鬧的AI應用助手要靠譜得多。

 

NVIDIA也表示,Project G-Assist數字助手在未來會直接集成到NVIDIA app中,可以通過快捷鍵被直接調用。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第48張

 

好戲還在後頭

 

有意思的是,NVIDIA Editors Day現場內容並不侷限於新硬件和新技術,從Blackwell架構,到生成式AI創作,以及圍繞RTX AI PC構建的生態,都在NVIDIA Editors Day上有所展示。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第49張

 

就在這個月,GeForce RTX 5090、GeForce RTX 5090D評測內容將會解禁,我們還會圍繞評測對Blackwell架構更穩深入的解析,比如在生成式AI創作中,GeForce RTX 5090如何利用FP4的優勢,DLSS 4遊戲和傳統遊戲的實際表現。

 

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第50張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第51張

 

即便如此,我們已經可以窺見到Blackwell和GeForce RTX 50系列GPU所構建出的龐大生態,在AI、遊戲、內容創作等消費端領域全面開花,展現出旗艦級產品應有的姿態,也讓整個市場更加期待RTX 50系GPU的上市。

正如NVIDIA創始人兼首席執行官黃仁勳在Keynote所說:”今天的 AI,其基礎是 GeForce 建立的,是 GeForce 讓 AI 走進千家萬戶,現在,AI 也在迴歸 GeForce。”

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第52張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第53張

NVIDIA Blackwell GPU淺析:AI正在迴歸GeForce-第54張

 


© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com