又到換顯卡的時(shí)候了——如果平臺(tái)有貨、你還有腎的話 ……
當(dāng)?shù)貢r(shí)間 9 月 20 日,英偉達(dá)在 GTC 顯卡技術(shù)大會(huì)上,終于發(fā)布了萬(wàn)眾期盼的 RTX 40 系列顯卡。其中 4090 起步價(jià)就高達(dá) 1599 美 元 ( ¥11200+ ) 。

RTX 4090 渲染圖 圖片來(lái)源:英偉達(dá)
這個(gè)價(jià)格,難怪發(fā)布會(huì)后,網(wǎng)友惡搞的圖就紛紛上線 ……

圖片來(lái)源:LTT
除了 40 系列顯卡之外,同場(chǎng)發(fā)布的,還有英偉達(dá)在圖形計(jì)算架構(gòu)、游戲開(kāi)發(fā)、AI 加速、工業(yè)元宇宙、云計(jì)算、量子計(jì)算等方面的新產(chǎn)品、技術(shù)、最新進(jìn)展。
它們包括(并不限于):
全新 GPU 架構(gòu) Ada Lovelace,安培 ( Ampere ) 架構(gòu)的升級(jí)版,也是 40 系列顯卡性能巨大提升的功臣;RTX Remix,一個(gè)游戲 mod 開(kāi)發(fā)工具,能夠?yàn)閹缀跞魏?3D 游戲添加光追效果" 核彈 "H100 AI 加速 GPU,已經(jīng)全面啟動(dòng)生產(chǎn),即將發(fā)貨;" 雷神 " ( Thor ) 超級(jí)計(jì)算機(jī),整合 Grace(CPU)、Ada(GPU)、 Hopper (AI 加速計(jì)算)三大能力,適用汽車、醫(yī)療、工業(yè)等領(lǐng)域。以汽車為例,單機(jī)即可撐起整個(gè)自動(dòng)駕駛系統(tǒng) + 車機(jī) + 車載娛樂(lè)系統(tǒng);
Omniverse Cloud 服務(wù),能夠連接幾乎所有主流大型 3D 工業(yè) / 設(shè)計(jì)應(yīng)用的云端基礎(chǔ)設(shè)施(IaaS),讓元宇宙開(kāi)發(fā)可以在多端任何設(shè)備之間無(wú)縫工作;
Nemo LLM 系列,一個(gè)超大規(guī)模神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)工具,能夠顯著加速大規(guī)模神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練、調(diào)優(yōu)和推理等,包括面向自然語(yǔ)言、生物制藥等多個(gè)場(chǎng)景的子服務(wù)。
其中,最新的 Ada Lovelace 架構(gòu),可以說(shuō)是絕大多數(shù)新產(chǎn)品和技術(shù)突破的背后功臣。這是英偉達(dá)推出的全新 GPU 架構(gòu)。主要特性為第三代 RT Core 光追核心,吞吐量為前代兩倍;第四代 Tensor Core 張量核心,張量矩陣計(jì)算性能為前代兩倍;Ada 架構(gòu)的 CUDA 核心,顯著提高 AI 加速,以及 3D 圖形計(jì)算的性能。

架構(gòu)來(lái)自于 " 史上第一段電腦程序 " 的作者,英國(guó)數(shù)學(xué)家艾達(dá) · 勒芙蕾絲伯爵夫人 圖片來(lái)源:英偉達(dá)
接下來(lái),一起來(lái)看這一屆英偉達(dá) " 春晚 ",都給大家送上了哪些硬菜。
RTX 4090 & 4080
黃仁勛老板手里拿的這張是英偉達(dá)自己的 RTX 4090 Founders Edition(16GB),采用了以往創(chuàng)始人版本基本相同的外殼設(shè)計(jì):

RTX 4090 圖片來(lái)源:英偉達(dá)
目前從華碩、七彩虹等合作伙伴那邊看到的首批 4090 和 4080 顯卡設(shè)計(jì)普遍采用全尺寸、三風(fēng)扇、3-slot 厚度:

ROG Strix RTX 4090 圖片來(lái)源:華碩 ROG

Vulcan RTX 4090 圖片來(lái)源:七彩虹
RTX 40 系列顯卡是:
英偉達(dá)最新推出的 Ada Lovelace 架構(gòu)的第一款顯卡,采用了最新版 DLSS 3 深度學(xué)習(xí)超級(jí)采樣技術(shù)、著色器 Shader 執(zhí)行重新排序 ( SER ) 技術(shù)、Ada 光流加速器、第八代英偉達(dá)雙 AV1 編碼器、24GB GDDR6X 顯存
在游戲性能方面,40 系列最大的性能提升來(lái)自于最新版 DLSS 3 技術(shù)。
DLSS (Deep Learning Super Sampling,深度學(xué)習(xí)超級(jí)采樣)能夠調(diào)取低分辨率的當(dāng)前幀和高分辨率的上一幀,使用卷積神經(jīng)網(wǎng)絡(luò) ( CNN ) 自動(dòng)編碼技術(shù)來(lái)提前預(yù)測(cè)出高分辨率的當(dāng)前幀。
DLSS 3 的最大突破,在于在深度學(xué)習(xí)超分辨率技術(shù)的基礎(chǔ)上,增加了光學(xué)多幀生成能力,并且集成了英偉達(dá)開(kāi)發(fā)的高速低延遲向量計(jì)算技術(shù) Reflex。
DLSS 3 采用的 CNN 自動(dòng)編碼器能夠接受 4 個(gè)輸入:當(dāng)前幀、上一幀、Ada 光流加速器生成的光流場(chǎng)數(shù)據(jù),以及運(yùn)動(dòng)矢量 + 深度等游戲引擎數(shù)據(jù)。
最厲害的地方在于 Ada 光流加速器:它能夠分析兩個(gè)連續(xù)幀,捕捉導(dǎo)粒子、光照、反射、陰影等不包含在游戲運(yùn)動(dòng)矢量引擎計(jì)算當(dāng)中的信息,捕捉這些像素在兩幀之間移動(dòng)的方向和速度,從而獨(dú)立計(jì)算出一個(gè)光流場(chǎng)。

Ada 光流場(chǎng)圖示 圖片來(lái)源:英偉達(dá)
結(jié)果就是,從這些數(shù)據(jù)輸入當(dāng)中,DLSS 3 能夠精確計(jì)算并重建出當(dāng)前幀的四分之三,外加下一幀的全部,總體重建了總顯示像素的八分之七。這樣能夠極大地提高了游戲幀率和圖形質(zhì)量,進(jìn)一步降低傳統(tǒng)渲染方式對(duì) GPU 和 CPU 造成的負(fù)載。

DLSS 3 技術(shù)圖解 圖片來(lái)源:英偉達(dá)
再加上全新的 Shader 執(zhí)行重新排序 ( SER ) 技術(shù),和 CPU 的亂序執(zhí)行一樣,是計(jì)算技術(shù)領(lǐng)域的重大創(chuàng)新,能夠通過(guò)動(dòng)態(tài)重新調(diào)度 shader 負(fù)載,更好地利用 GPU 內(nèi)的各項(xiàng)資源,將光追性能提高三倍,提升 25% 左右的幀率
英偉達(dá)也找到波蘭蠢驢合作開(kāi)發(fā)了一個(gè)《賽博朋克 2077》的光追過(guò)載模式,顯示在 RTX 4090 顯卡上打開(kāi) DLSS 3 之后圖像輸出延遲降低了一半多,幀率提升了四倍,總體性能提升約為 4 倍。這個(gè)模式回頭也會(huì)推送給 PC 版玩家,在 40 系列顯卡上可以打開(kāi)。
視頻來(lái)源:CD Projekt Red、英偉達(dá)
除了《賽博朋克 2077》之外,包括《微軟模擬飛行》、新哈利波特游戲、《黑神話:悟空》等在內(nèi)的 30 多款游戲,也都將原生支持 DLSS 3 技術(shù):

圖片來(lái)源:英偉達(dá)
你的游戲沒(méi)在列表里?沒(méi)關(guān)系。
為了向游戲愛(ài)好者群體里的圖形增強(qiáng) Mod(模組)開(kāi)發(fā)者致敬,英偉達(dá)還推出一個(gè)模組開(kāi)發(fā)平臺(tái),名為 RTX Remix。

RTX Remix 圖示 圖片來(lái)源:英偉達(dá)
一邊玩游戲,一邊打開(kāi)這個(gè)工具,它能夠錄制游戲場(chǎng)景數(shù)據(jù),直接從 GPU 里攔截渲染指令,包括紋理、幾何體、照明數(shù)據(jù)和鏡頭位置等,將它們轉(zhuǎn)換為通用場(chǎng)景描述(Universal Scene Description, USD)。
然后,再運(yùn)用多項(xiàng)技術(shù)對(duì)其自動(dòng)增強(qiáng)紋理,甚至可以讓一些 " 上古 " 時(shí)代、不支持光追的 32 位游戲,實(shí)現(xiàn)光追和 DLSS 3 支持。
最后,RTX Remix 可以把這些增強(qiáng)結(jié)果打包生成為一個(gè)游戲 Mod 文件——結(jié)果就是,也許大家不用成天上 Nexus Mods 下圖形增強(qiáng)模組了,因?yàn)橛辛?RTX Remix,任何人理論上都可以成為模組開(kāi)發(fā)者,自己動(dòng)手增強(qiáng)自己的游戲體驗(yàn)!
為了更直接地展示 RTX Remix 的能力,英偉達(dá)和水管公司合作開(kāi)發(fā)了一個(gè)原版《傳送門》+RTX 強(qiáng)化版 DLC,畫面質(zhì)量和光影效果有了巨大提升(見(jiàn)下圖右)

Portal RTX DLC 圖片來(lái)源:英偉達(dá)、Valve
總體上,RTX 4090 目前已知只有 24GB 顯存一種配置。在開(kāi)啟了 DLSS 3 時(shí),其在光追游戲中的性能比上一代采用 DLSS 2 的 3090 Ti 顯卡快 4 倍,總體游戲性能提升約為 2 倍,并且功耗維持在相同的 450W。
RTX 4080 有 12 和 16GB 顯存兩種配置,總體游戲性能提升為 3080 Ti 的兩倍,在 DLSS 3 開(kāi)啟時(shí)性能足以超過(guò) 3090 Ti。
游戲說(shuō)完,再來(lái)簡(jiǎn)單看一下創(chuàng)作者方面:在 3D 渲染、視頻導(dǎo)出,以及 AI 相關(guān)任務(wù)方面,RTX 4090 的性能比 3090 Ti 快兩倍,4080 16GB 版本則比 3080 Ti 快 1.5 倍。
RTX 4090 起價(jià) 1599 美元,10 月 12 日面市;4080 兩種配置都在今年 11 月上市,起價(jià)分別為 899 和 1199 美元。
不少朋友可能在不久前加密礦難的時(shí)候,才剛剛?cè)胧謨r(jià)格正常的 30 系列顯卡 …… 如果你也是這樣,那么接下來(lái)的消息可能會(huì)讓你些許悲傷:30 系列顯卡的英偉達(dá)指導(dǎo)價(jià)格也有所下調(diào),比目前市價(jià)普遍低了 50 美元左右 ……
圖片來(lái)源:英偉達(dá)
當(dāng)然,新品發(fā)布也少不了吐槽。
華碩板卡的官方圖,Mini-ITX 主板 +4090,已經(jīng)不是顯卡插在主板上了,而是主板插在顯卡上 ……

圖片來(lái)源:華碩
還有網(wǎng)友說(shuō),跟去年這個(gè) " 泄露 " 版 4090 相比,大小似乎沒(méi)差多少 ……

圖片來(lái)源:Captains Workspace
另外值得一提的是,就在上周末,全球最大的板卡廠商之一,曾被稱為英偉達(dá) " 親兒子 " 的 EVGA,突然正式宣布了和英偉達(dá)終止合作關(guān)系。盡管該公司已經(jīng)完成了測(cè)試產(chǎn)品開(kāi)發(fā),量產(chǎn)已經(jīng)做好準(zhǔn)備,卻明確表示將不會(huì)生產(chǎn)和銷售 EVGA 品牌的 40 系列顯卡,30 系列存量?jī)H用于售后服務(wù),并且完全退出顯卡市場(chǎng) ……
至于原因,EVGA 指責(zé)英偉達(dá)拿自己當(dāng)小弟、當(dāng)炮灰,不僅不及時(shí)提供產(chǎn)品技術(shù)和市場(chǎng)相關(guān)信息,還用低價(jià) founders edition 顯卡打擊合作伙伴的銷售,一度逼得 EVGA、華碩等板卡廠商下調(diào)價(jià)格。
毫無(wú)疑問(wèn)的是,英偉達(dá)一邊繼續(xù)在顯卡技術(shù)上做出大跨步式的創(chuàng)新,另一邊由于自己的技術(shù)和市場(chǎng)領(lǐng)袖地位,確實(shí)在板卡合作方那邊顯得傲慢至極——不只是 EVGA 一家,其它廠商都有相同感受,只是沒(méi)有像它這么堅(jiān)決而已。
" 雷神 " 車載超級(jí)計(jì)算機(jī)
大家應(yīng)該知道,隨著近十年來(lái) GPU 技術(shù)驅(qū)動(dòng)的深度學(xué)習(xí)突飛猛進(jìn),英偉達(dá)早已不再是純粹的傳統(tǒng)消費(fèi)顯卡廠商,也已成為了工業(yè)級(jí) AI 加速計(jì)算方面的技術(shù)領(lǐng)導(dǎo)者。
在今天的 GTC 大會(huì)上,英偉發(fā)布了 DRIVE Thor,一臺(tái)只靠單機(jī)架構(gòu),就能夠運(yùn)行自動(dòng)駕駛 + 數(shù)字儀表盤 / 車機(jī) + 車載信息娛樂(lè)一整套系統(tǒng)的車規(guī)超級(jí)計(jì)算機(jī):

DRIVE Thor 圖片來(lái)源:英偉達(dá)
" 雷神 " 超級(jí)計(jì)算機(jī),可以說(shuō)是英偉達(dá)三大 AI 加速計(jì)算架構(gòu)技術(shù)之集大成:Grace CPU、Ada Lovelace 架構(gòu) GPU,以及 Hopper 多實(shí)例 GPU 架構(gòu)。它的總體浮點(diǎn)運(yùn)算性能高達(dá) 2000 萬(wàn)億次 ( TFlops ) ,比前不久剛剛實(shí)現(xiàn)商用的前代平臺(tái) DRIVE Orin ,算力實(shí)現(xiàn)了驚人的八倍提升。
這次升級(jí)的另一大亮點(diǎn),在于英偉達(dá)首次在面向自動(dòng)駕駛場(chǎng)景開(kāi)發(fā)的車載計(jì)算機(jī) DRIVE 平臺(tái)中,增加了 Transformer(一種主流的深度學(xué)習(xí)模型)模型的支持。
Transformer 引擎在 " 雷神 " GPU 單元的 H100 Tensor Core 中運(yùn)行,依靠 FP8(8 位浮點(diǎn))精度,它能夠直接在車載計(jì)算機(jī)上運(yùn)行包括 Transformer 在內(nèi)的更大規(guī)模的機(jī)器學(xué)習(xí)模型,從視頻當(dāng)中截取感知幀,極大提升了車載算力的性能,降低了對(duì)云端服務(wù)器和連通性的要求。
黃仁勛在 GTC 演講中演示了一段視頻,顯示 " 雷神 " 可以只靠自己就運(yùn)行一輛自動(dòng)駕駛汽車完整的運(yùn)行、感知、決策、避讓等操作,以及環(huán)境實(shí)時(shí)掃描和數(shù)據(jù)搜集等任務(wù)。

DRIVE Thor roadmap 圖片來(lái)源:英偉達(dá)
" 雷神 " 的另一個(gè)特性在于具備多域計(jì)算 ( multi-domain computing ) 能力,滿足車規(guī)級(jí)硬件的要求。
在汽車行業(yè),車機(jī)、自動(dòng) / 輔助駕駛系統(tǒng)對(duì)于穩(wěn)定性安全性較高,而車載信息娛樂(lè)系統(tǒng)沒(méi)有那么高。過(guò)去,這些不同類型和安全級(jí)別的功能需要數(shù)十個(gè) ECU(可以理解為獨(dú)立的小電腦)來(lái)控制。
而 " 雷神 " 可以在系統(tǒng)層面對(duì)不同任務(wù)進(jìn)行多域隔離,使得諸如自動(dòng) / 輔助駕駛、車機(jī)儀表、安全氣囊等關(guān)鍵進(jìn)程能夠不間斷的進(jìn)行。
一臺(tái) " 雷神 " 上可以同時(shí)運(yùn)行 QNX(主要用于車規(guī)級(jí)系統(tǒng)和功能)、Linux 和 Android(更多用于信息娛樂(lè)等非關(guān)鍵系統(tǒng))。

圖片來(lái)源:英偉達(dá)
目前,包括小鵬 ( Xpeng ) 、吉利極氪 ( Zeekr ) 、輕舟 ( Qcraft ) 等在內(nèi)的一些國(guó)內(nèi)新能源 / 新造車品牌和自動(dòng)駕駛技術(shù)開(kāi)發(fā)者,已經(jīng)和英偉達(dá)達(dá)成合作關(guān)系,對(duì) " 雷神 " 進(jìn)行早期測(cè)試。
英偉達(dá)估計(jì) " 雷神 " 系統(tǒng)將在 2024 年進(jìn)入量產(chǎn),極氪 CEO 安聰慧透露將在 2025 年生產(chǎn)的下一代智能電動(dòng)汽車當(dāng)中采用該系統(tǒng)。
正如歷年來(lái)英偉達(dá)的產(chǎn)品發(fā)布會(huì)和技術(shù)峰會(huì)一般,本屆 GTC 也是發(fā)布種類繁多、信息量巨大且密集。
除了我們剛剛介紹的 RTX 40 系列顯卡和 " 雷神 " 車載超算之外,英偉達(dá)還推出了依賴最新 Ada Lovelace 架構(gòu) GPU 的云計(jì)算服務(wù)、邊緣計(jì)算平臺(tái)、工業(yè)園元宇宙開(kāi)發(fā)環(huán)境 Omniverse Cloud、面向大語(yǔ)言 / 蛋白質(zhì)折疊模型優(yōu)化的加速計(jì)算工具和服務(wù)等,礙于篇幅限制,在此就不詳述,感興趣的朋友可以訪問(wèn)英偉達(dá)官網(wǎng) newsroom 查看。
* 注:封面圖來(lái)自于英偉達(dá),版權(quán)屬于原作者。
原文地址:http://www.myzaker.com/article/632a611a8e9f09636523f61c
轉(zhuǎn)載請(qǐng)注明:英偉達(dá)“春晚”上菜!RTX 40系顯卡發(fā)布、“雷神”超級(jí)計(jì)算機(jī),再次刷新科技極限 | 快導(dǎo)航網(wǎng)







川公網(wǎng)安備51012402001058號(hào)