首頁 >
活動線報 >
每日福利 >
深入解析GeForce RTX 50系列顯卡,看看它到底有多“炸”!
深入解析GeForce RTX 50系列顯卡,看看它到底有多“炸”!
發布時間:2025-01-19 19:14:29來源:
13041198719
隨著科技春晚CES 2025的召開,NVIDIA正式推出了搭載全新的Blackwell GPU架構的GeForce RTX 50系列顯卡,該系列不僅在性能上碾壓前代產品,更是通過AI和神經渲染技術,將游戲畫質和互動體驗提升到一個全新高度。今天,我們就來深入解析一下GeForce RTX 50系列顯卡的那些“黑科技”,看看它到底有多“炸”!
Blackwell架構是本次更新的重點,以大衛·布萊克威爾,受人尊敬的數學家和統計學家。布萊克威爾在博弈論和統計學方面的開創性工作和貢獻在該領域留下了不可磨滅的印記,使他的名字成為數學科學創新和卓越的代名詞。這一致敬反映了新平臺的開創性和先進的計算能力。它可以說是NVIDIA近年來更新幅度最大的GPU架構了,相比起之前的架構來說,劃時代的引入了神經網絡著色器,力圖為游戲開創先進、高效更有逼真的渲染方式,帶給玩家全新的游戲體驗。
據NVIDIA介紹,在設計Blackwell架構時,就對其寄予厚望。完全圍繞新的神經網絡功能和更低的功耗負載進行設計與優化,旨在減少整體的內存占用,提高能源使用效率以及引入新式服務品質功能。
省流總結:Blackwell架構上主要升級了第五代張量核心,它能提供高速FP 4精度的計算能力和高達4000 AI TOPS的性能,另外,還升級了第四代RT(光線追蹤)核心,專為Mega Geometry設計,能夠提供高達360 RT TFLOP的性能。其中Mega Geometry是新一代AI管理處理器,可同時執行AI模型和圖形工作負載。根據NVIDIA的介紹,全新的Blackwell SM具有125 TFLOPS的峰值FP 32計算能力,同時得益于GDDR7顯存的應用,可實現高達30 Gbps的速度傳輸,每一項都是頂級的體驗。
接著我們再細說一下這一代架構的變化,先從核心來看,全新的Blackwell架構相較于RTX 40系的Ada架構還是有不小變化的,Ada架構內的SM內,著色單元(也就是CUDA核心)會拆分成一半專門用于處理FP 32(單精度浮點數),另一半則依需求動態調整去處理FP 32和INT 32(32位整數)。而在Blackwell架構上,著色單元則改成了完全依需求動態處理FP 32和INT 32的形式。
另外還有一個改進是,過往的著色工作負載往往只有CUDA核心處理,而Blackwell架構上引入了神經網絡著色的方式,使得Blackwell架構上的第五代Tensor核心也能共同分擔著色工作,大大提高了著色效率。
這樣改進的好處是,Blackwell架構能夠進一步針對神經網絡著色工作負載進行排序,即把傳統的著色工作分配給CUDA核心,而需要動用神經網絡運算的工作負載則可以給到Tensor核心上,兩種核心同時運用,能夠將整體的重新排序效率提升2倍。
第五代Tensor核心除了能夠加速重新排序,它還支持FP 4精度模型的加速處理,相較于Ada架構上的第四代Tensor核心支持FP 8精度模型,吞吐量整整提升了2倍!如果對比Pascal架構的核心吞吐量的話,提升幅度高達32倍!得益于第五代Tensor核心的引入,這才讓DLSS 4能夠實現逆天的多幀生成功能。
根據NVIDIA的實測,采用FP 4精度去生成同一張圖片時,不僅生成速度更快,同時顯存占用也更少,相較于傳統的FP 16精度,FP 4精度最多可以實現2倍以上的性能提升,以及節省50%的顯存消耗。
第四代RT核心也有進步,相較于第三代RT核心來說,Blackwell架構的第四代RT核心支持原有的Box Intersection Engine和Opacity Micromap Engine,不過把原有的Triangle Intersection Engine擴展成Triangle Cluster Intersection Engine,再加入 Triangle Cluster Decompression Engine 和 Linear Swept Spheres。說人話就是過往的三角形相交引擎升級為三角形簇相交引擎,該引擎針對Mega Geometry進行了優化,可以更有效地處理Mega Geometry和標準幾何體的簇。
同時Mega Geometry引擎還具有新的三角簇壓縮格式,綜合來看,Blackwell架構的光線追蹤多邊形相交效率是上一代Ada架構的2倍,是Turing架構的8倍,同時顯存使用率卻只有Ada架構的75%。
此外,AI必將是未來的重點之一,游戲中應用AI技術的情況越來越多,而如何去分配顯卡內部多樣化工作就成了一個問題。例如過往顯卡在開啟DLSS玩游戲時,其中應用到的語言模型和游戲引擎需要同時與GPU的不同核心交互,生成游戲幀,但是往往很難做到每一幀都有一致的生成時間,亦或者是游戲AI對話的響應不夠及時,這些情況都會造成游戲體驗不友好。
而AI管理處理器(AMP)的出現,就是解決這些問題的關鍵。它能夠實時調度資源,確保在神經渲染、幀生成和 AI 驅動的游戲交互中實現智能化的任務分配。這種設計不僅帶來了更高效的性能輸出,還讓顯卡在游戲渲染和 AI 運算之間實現了絕佳的平衡,確保幀的間隔均勻,對話類型的AI能夠及時響應,玩家的游戲體驗一致性能夠比較好的保障。
顯存方面同樣是更新的重點,前兩代Ampere和Ada架構的GPU均使用的是GDDR6X顯存,其信號采用PAM4編碼,而這一代Blackwell架構的GPU首發最新的GDDR7顯存,并且信號編碼改成了PAM3,這樣可以使雜訊失真比較小,信號品質更清晰,同時也能帶來更高的顯存運行頻率以及更低的電壓,根據NVIDIA的介紹,使用GDDR7顯存后,數據傳輸速率可達GDDR6時的2倍,并且功耗接近GDDR6的一半,經典加量還減價。
對于創作者而言,Blackwell架構也迎來了更全面的視頻規格支持,GeForce RTX 50系列顯卡上將換裝第9代編碼器與第6代解碼器,支持AV1 UHQ(超高畫質 AV1)與MV-HEVC(多視角HEVC)編解碼。
另外Blackwell架構也終于能夠實現4:2:2色度取樣的視頻編解碼,相較于4:2:0來說,它能夠紀錄更多的色彩信息,提升畫面品質。同時顯示輸出引擎也同步升級至 DisplayPort 2.1 UHBR20,單一通道可實現20Gbps的帶寬,單一線材具備4通道即可達80Gbps的能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為“一技網用戶上傳并發布",本平臺僅提供信息存儲服務。