您当前的位置: 填充水 >> 填充水优势 >> NVIDIAGeForceRTX3080

NVIDIAGeForceRTX3080

在新一代的显卡战争中,NVIDIAGeForceRTX率先代表NVIDIAAmpere架构进入战场占据高光C位,不过AMD的RDNA2大军凭借RadeonRXXT和RXXT形成了对RTX的前后包夹。擅长“刀法”的老黄显然是胸有成竹,在RTX和RTX之间相当大的参数规格落差内,手起刀落又切出了一款“怒怼”RXXT的产品,这就是GeForceRTXTi。无限接近RTX的游戏性能,市场价格却要亲民得多,而且还限制了挖矿的哈希算力,这一切似乎都显示着RTXTi将成为顶级游戏显卡市场上的新贵,甚至有可能接替RTX,戴上真正的游戏显卡性价比王座之冠?

坦白讲,如果不是过去大半年时间内疯狂的ETH挖矿影响,我们估计这款GeForceRTXTi应该在更早的时间内与玩家见面。其实,早在年NVIDIA全球首发RTX30系显卡时,我们就曾说过,RTX的规格略显曲高和寡,难以成为游戏显卡市场的顶级普及性代表,更多的可能还是在创作市场显威;而RTX虽然在性能表现上足以接班RTXTi,继续扛起游戏市场旗舰级显卡的大旗问题不大,但无论是10GB的GDDR6X显存配置,还是并不算太出色的CUDA核心数配置,都感觉略差了那么一丝戴上皇冠的味道。

后来,随着AMDRadeonRXXT、RXXT的发布,在顶级游戏显卡市场上RTX虽然性能一骑当先,但却背负着沉重的价格压力,而RTX也被RXXT和RXXT两头挤压,颇有些“憋屈”的味道。

很明显,在RTX和RTX的规格参数对比上,近个CUDA核心和14GB显存的巨大差距让NVIDIA有非常大的操作空间,几乎所有人都想到了“RTXSUPER”、“RTXTi”的存在可能性。果不其然,GeForceRTXTi就这样浮出了水面。

一脉相承,NVIDIAAmpere架构加持

近距离接触RTXTi之前,先让我们复习一下RTXTiGPU传承的创新性NVIDIAAmpere架构的相关知识。

以前我们也多次讲过,RTX30系列GPU在架构上最大的变化是改用了全新的NVIDIA安培(Ampere)架构,本次发布的RTXTi自然也不会例外。之前NVIDIA在发布AGPU的时候,无论是GPU本身还是架构设计都更偏向于计算,在面向图形应用时,偏向计算的架构显然是无法适应图形计算的需求的,因此NVIDIA在同为安培架构、面向不同计算场合的芯片设计上,采用了针对性的改进。可以这样理解,目前我们看到的RTX30系列GPU,采用的是面向图形的安培架构,它和面向计算的安培架构有一定的相似之处,但是侧重点完全不同。

▲完整的NVIDIAAmpere架构GA核心包含7个GPC,84组SM模块。

全新的SM模块,CUDA翻倍

SM(StreamingMulti-processer,流式多处理器模块)模块一直是NVIDIAGPU的计算核心,在新的GA核心的安培架构上,由于计算任务的变化,GA的SM模块也有了巨大的变化。

▲面向图形的安培架构的SM模块,可以看到其内部采用了FP32+INT32的设计。

和RTX、RTX等完全一致,RTXTi的SM的计算单元内部,依旧配置了1个warp调度单元和1个派遣单元、×32bit寄存器和后端LD/ST、SFU单元,但是在计算的部分却包含了1组16个可自由执行FP32和INT32计算的双功能计算单元(ALU)——它们既可以完成FP32计算,又可以完成INT32计算,另外还包含了1组16个FP32计算单元和1个新的第三代张量核心。这样,同为4个SM计算单元组成的SM模块,GA10X安培架构拥有等效个CUDA核心(极致情况下),相当于图灵核心的两倍。我们知道,图形和计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。

第二代RTCore光追核心

图灵架构为游戏引入实时光线追踪,轰动一时,为游戏带来了逼真的光照、图像质量、游戏玩法和沉浸感、阴影和特效,并带来超出想象的游戏画质表现。Ampere架构的第二代RTCore的性能提升一倍,带来2倍于Turing第一代RTCore的吞吐量,同时支持光线追踪和着色,使光线追踪性能达到全新高度。换而言之,光线追踪使用率越高,速度提升越大!同时第二代RTCore还引入了动态模糊等重要特性。

NVIDIAAmpere架构的RTCore将光线交汇处理速度提高一倍,同时支持光线追踪与着色。光线三角形吞吐量增加一倍,Ampere架构的RTCore可达39.7RTTFLOPS,Turing架构为23.8RTTFLOPS,提升巨大。

第三代TensorCore张量核心

面向图形的安培架构也加入了第三代张量计算核心,专门为稀疏矩阵优化。RTXTi所配置的TensorCore可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。全新第三代TensorCore加速AI功能,例如用于AI超分辨率的NVIDIADLSS和用于AI增强的声画处理技术NVIDIABroadcast应用。

▲在DLSS的支持下,不但游戏帧率有大幅度提升,在画面细节表现上也没有损耗,甚至画面清晰度更好。

从本质上讲,TensorCore让DLSS能够加快游戏速度,同时带来高画质图像,甚至更细致的图像。借助第三代TensorCores的性能,NVIDIAAmpere架构GPU上的DLSS性能得到进一步增强。当前的NVIDIADLSS已经进化到了2.1版本,支持最高9X的游戏帧速率加速,这对于防止在高分辨率下开启光追效果后的游戏帧率下跌有着非常重要的意义。

支持HDMI2.1与AV1解码

支持HDMI2.1将总带宽从18Gigabits/秒提高到48Gigabits/秒,并增加对高动态范围(HDR)的支持,支持更高对比度的明亮图像和更鲜艳的色彩,以及更好的阴影和高光。而AV1解码与现有的H.、HEVC和VP9等编解码器相比,它能提供更好的压缩和质量,比H.节省50~55%的容量;RTXIO,在DirectStorage加持下,下一代游戏将能够在降低CPU负载的同时,充分利用RTXIO硬件,缩短加载时间,打造更宽阔的开放世界。

支持NVIDIAReflex低延迟电竞技术

▲上图所示测试数据来自NVIDIA官方资料,供参考。我们将在首发评测之后的后续测试中实际体验RTXTi的Reflex性能。

游戏玩家通过鼠标按键触发的效果最终呈现在显示器画面上之前,按键触发的电信号需要先途径CPU进行逻辑运算,得到详实且准确的信息之后再提交给GPU进行渲染,并且将渲染后的数据最终以像素点填充的方式呈现到显示器上。在这个过程中,电信号从触发、传输再到显示的过程所产生的耗时便被称之为系统延迟。

而NVIDIAReflex低延迟电竞技术便是在这个过程中起到至关重要的作用——它能够通过提升GPU的运行频率和动态的降低渲染队列,并由此降低CPU反压,使得系统能够在最后时刻采样外设的输入数据,从而最大化提高系统的响应速度,进一步提升玩家操作的准确度。通俗来讲,就是它能提高玩家从点击鼠标到显示器画面产生对应变化的速度,从而加快玩家的操作速度,带来更符合玩家水准且更为流畅的游戏体验。

另外,为了帮助玩家直观地查看系统延迟的具体情况,NVIDIA还将系统延迟根据鼠标输入信息到显示器过程拆分为鼠标输入延迟以及PC+显示器延迟两个部分。同时,玩家们可以通过最新版的GeForceExperience开启实验性功能,进而在性能覆盖显示的功能界面中获取游戏延迟和帧率等性能指标,查看当前PC的状态。它通过革命性的GeForce和G-SYNC新技术来优化和测量竞技游戏中的系统延迟,从而更快地获取目标,做出反应,并提高瞄准精度。

支持NVIDIABroadcast

NIDIABroadcast这项AI驱动的声画处理技术的基础是NVIDIAEncoder,支持高质量直播。用户可以通过RTX30系显卡和Broadcast将自己的家改造成直播室,通过AI驱动的噪音消除、虚拟背景和自动取景等将直播和视频聊天提升到一个新水平。通过在GeForceRTX显卡上加速AI驱动的TensorCore,AI网络能够保证高质量直播的实时运行。

RTXTi概览,新游戏GPU旗舰

复习完了NVIDIAAmpere架构的核心技术特色,接下来让我们来具体看看GeForceRTXTi这款最最新的NVIDIAAmpere架构GPU的情况。

从GeForceRTXTi的规格参数上可以看出,这完全就是RTX的小简化版。完整的GA核心一共拥有84组SM模块,也就是个CUDA核心、84个RTCore以及个TensorCore。当然真正完整的GA核心目前只用在了专业级显卡的NVIDIARTXA身上,即使如RTX这种庞然大物,也只配置了82组SM单元。

相比RTX,RTXTi仅仅比前者少了2组SM,包括个CUDA核心、8个TensorCore、2个RTCore和8组纹理单元TMUs,因此这也造就了RTXTi高达80组SM模块,即40个CUDA的强悍规格。在显存部分,RTXTi相比RTX则落后较多,几乎是惨遭“腰斩”,不过12GBGDDR6X显存的配置仍然是目前游戏市场上N卡除RTX之外的最高规格配置。而且从我们之前的测试情况来看,RTX的24GBGDDR6X显存即使相对于RTX的10GB同等配置也没能表现出特别明显的强大优势,因此我们完全有理由相信在游戏方面,如果不涉及到8K+的游戏设置,RTXTi的12GB配置也应该完全够用了,相比RTX在4K及以下分辨率游戏中应该不会有太过明显的差距。

与RTX相比,12组SM模块的差异让RTXTi在规格参数上与RTX拉开了不小的差距。在之前测试RTXVs.RTX时,二者之间的性能差距大约在8%~15%之间,因此可以预估RTX与RTXTi的游戏性能差距大概会在5%~10%左右。当然具体差距到底有多大,还需进行进行详细的测试才能见分晓,后文将会为您详细解答。

▲从外观设计上来看,GeForceRTXTi明显是采用了RTX的散热设计方案。

▲RTX首发时就被宣称采用了革命性的直通式散热设计,RTXTi也传承了这一设计特色。

和RTXFE一样,RTXTiFE也将前一代图灵核心产品设计中正面右侧的散热风扇移至背面,并且显卡的内部的风道也和上一代公版显卡大不一样。RTXTiFE正面的散热风扇将冷空气吹进显卡内部,热空气则从显卡的输出面板这一侧流出,这种风道设计和GTX10系列公版显卡有些类似。RTXTiFE背面的散热风扇则是将冷空气从显卡正面吸入,并将热空气从显卡背面吹出。换而言之,如果将RTXTiFE装入机箱内部,背面这个散热风扇的风道就是“下进上出”,这也更符合目前绝大多数机箱内部散热风道的设计思路。

大量散热鳍片采用的是开放式设计,而不是像上一代公版显卡那样将这些散热鳍片封闭在显卡内部,前者的这种散热鳍片设计不仅能在一定程度上提升散热效率,同时也让这款显卡在视觉上的线条感愈加强烈。不仅如此,RTXTiFE正面和背面的两个散热风扇均升级至轴流风扇。这种风扇能够让通过扇叶的气流更加集中,从而提升进风量和风压。不过考虑到RTXTi与RTX在规格上非常接近,而且TGP设计也比RTX高了30W以上,所以采用RTX这套散热系统会不会对RTXTi带来一定的散热压力呢?我们将在后文中详细测试。

▲和RTXTi一样的正反双风扇设计

▲电源接口与RTX相同,为双PCIe8Pin转专用12Pin接口,随卡附带电源转接头。

▲3DP1.4a+1HDMI2.1视频输出接口

RTXTi采用了和RTX一样的“燕尾”异形PCB设计,可以为散热结构腾出更多的可操作空间。二者PCB布局几乎也是完全一样,不过相比RTX,RTXTi减少了两相供电电路设计(应该是减少了两相显存供电电路,毕竟显存容量相对RTX减半),仅为18相供电。而在显存部分仍然是12颗GDD6X闪存颗粒设计,单颗为1GB(RTX使用的是单颗2GB容量的颗粒)。PCB上方并没有NVLink双卡互联接口,也就是说RTXTi是不支持NVLink(SLI)多卡互联的。

NVIDIAGeForceRTXTiFoundersEdition产品资料

GPU架构:NVIDIAAmpere

核心代号:GA--A1

制程工艺:SAMSUNG8nm

SM模组数:80

CUDACores:40

TensorCores:(第3代)

RTCores:80(第2代)

纹理单位:

ROPs:

GPU最高睿频:MHz

显存频率:MHz(19Gbps)

显存容量:12GBGDDR6X

显存位宽:-bit

显存带宽:GB/s

TGP:W

槽位:双槽卡设计

视频输出:DP1.4a×3,HDMI2.1×1

参考价格:元

实测:强击RXXT,直逼RTX

毫无疑问,从规格与产品命名定位上来看,RTXTi应该是性能介于RTX与RTX之间的产品,而且对AMDRadeonRXXT还有较强的竞争针对性。所以,RTXTi能否完成既定的目标任务?面对RXXT与RXXT包围RTX的局面它是否能够顺利破局并反将AMD一军呢?

3DMark理论性能测试

从理论性能的测试结果来看,基本在我们的预料之中。整体测试结果可以看出,RTXTi相对于RTX在3DMark各项测试中的平均领先幅度在10%左右,而和RTX比较的话,由于二者在规格上的差距并不太大,所以实际理论性能测试的平均差距仅有3%~4%,RTXTi只有极小幅度的落后。而在与前一代的旗舰级GPURTXTi对比上,在各项测试中RTXTi的领先幅度均超过了50%,在DXR光追性能上的领先程度更是超过了80%。

面对竞争对手RadeonRXXT和RXXT,在基于DX11的3DMarkFireStrike三项测试中,RTXTi均有小幅度落后,与RXXT的理论性能差距约为9%,与RXXT的理论性能差距约为6%。不过在DX12的3DMarkTimeSpy测试中,RTXTi则实现了反超,性能分别超过RXXT约10%,超过RXXT约13%。

在有关光追性能的两项理论测试成绩上,凭借第二代光追核心的强势表现,RTXTi的表现更为优秀,PortRoyal的测试成绩领先RXXT36%,领先RXXT超过了40%。DXR性能测试中更是相对AMD的两款竞品领先幅度达到了%以上。

游戏性能测试

在游戏性能的评测部分,我们分为了两个竞赛小组,分别是普通非光追环境下的游戏性能测试与光追环境下的游戏性能测试。由于目前少数光追游戏仅支持NVIDIAGPU或仅支持AMDGPU,我们在光追游戏的选择上过滤了这种单一GPU光追支持的游戏,选择的是对NVIDIA和AMDGPU都有良好支持的光追游戏。

非光追游戏测试

《极限竞速:地平线4》

《尘埃5》

《地平线:零之曙光》

《生化危机:村庄》

《杀手3》

在非光追游戏环境下,RTXTi的表现仍然是比较抢眼的。在各款游戏测试中,RTXTi平均性能与RTX相比仅有3%~4%的差距,而相比RTX来看,RTXTi的平均性能领先幅度约在7%左右。相较于上一代的旗舰RTXTi,RTXTi的性能领先幅度仍然在50%以上。

在大部分的非光追游戏环境中,RTXTi的性能表现都持平或略略强过AMDRadeonRXXT,而相对于RXXT来说,RTXTi在大部分非光追游戏中都有10%或更高的性能领先程度。不过比较例外的是《生化危机:村庄》这款游戏,在关闭光追效果后,RadeonRXXT反而领先RTXTi达到10%以上,即使RXXT也领先RTXTi6%左右。或许这款游戏针对AMD显卡的优化相对是比较好的吧!

光追环境游戏性能测试

《地铁:离去增强版》

《我的世界》

《赛博朋克》

《控制》

《看门狗:军团》

《古墓丽影:暗影》

《生化危机:村庄》

在测试中,我们一共选择了包括最新的《生化危机:村庄》在内的7款同时支持NVIDIA和AMD显卡的光追游戏进行了体验。而结果也是一点都不例外,凭借强悍的第二代光追核心,RTXTi除了在4K分辨率下的《看门狗:军团》游戏测试中略略小负于RTXXT之外,在其余所有光追游戏测试中,无论是p分辨率,还是4K分辨率下,都遥遥领先于RXXT,根据不同游戏幅度在10%~80%不等。而相对于RXXT来说,RTXTi相对它在光追游戏下的性能更是平均领先了60%以上,个别游戏中领先程度甚至超过了%。

在与RTX的对比上,RTXTi与之相比仍然存在3%~4%的细微性能差距,而与RTX相比,RTXTi在光追环境下游戏性能平均要强9%~10%。相比上一代RTXTi这款旗舰产品,RTXTi的光追游戏性能更是领先近60%。

DLSS性能测试

DLSS作为NVIDIARTX系列显卡的黑科技,一直都在高分辨率、高画质以及光追游戏中扮演着重要的角色,作为最新推出的RTX30系家族成员,RTXTi自然也是完全支持DLSS的。为此,我们也特意看了看RTXTi及对比产品在DLSS游戏环境下的表现。出于显卡的定位需求,在这部分测试中,我们统一选择了4K分辨率在开启光追的环境下,就开/关DLSS进行了对比测试。

DLSS果然是不愧为NVIDIA的超级游戏黑科技,在同等设置下,开启DLSS之后,RTXTi在4K分辨率/最高画质设置下的平均游戏帧率提升达到了60%以上,在《赛博朋克》游戏中的帧率提升幅度更是达到了%以上的“恐怖”程度。开启DLSS之后,RTXTi更是将RadeonRXXT甩在了很远很远的身后,游戏性能的领先幅度已经达到了平均%以上。

温度及功耗测试

正如我们之前所预料的一样,在核心规格逼近RTX的情况下,RTXTi采用了RTX的散热结构设计,很可能会导致RTXTi的散热表现相对于RTX和RTX都要差一些,而事实上也正是如此,满载76℃的核心温度只能说是中规中矩而并不算特别优秀,相比RTX的满载63℃有较大的差距。不过在能耗比上,RTXTi相对于RXXT仍然优势非常明显,不仅核心温度更低,而且在功耗上也相差无几,但整体性能却要强得多。(由于在进行到这一步测试之前,我们评测用的RXXT显卡出现了一个不可预料的故障而导致无法正常工作,因此在这一测试项中并未加入RXXT的测试成绩)

Studio创作性能测试

在评测的最后,我们选择了几款常用的创作软件或专业应用的Benchmark就Studio性能对RTXTi进行了简单测试(要首先说明的是由于到截稿时StudioDriver尚未更新支持RTXTi,因此本部分测试暂时采用的是测试版GameReadyDriver,结果仅供参考)。测试结果也让人比较满意,就Studio创作性能而言,RTXTi相对于上一代RTXTi表现了几近翻倍的性能提升,即使相对RTX来说也有10%或更高的性能增幅,而且各项测试成绩都非常接近RTX,差距仅在3%~5%左右。

由于在测试Studio性能之前,我们评测用的RXXT显卡发生了故障无法正常运行,因此在这部分测试中作为对比我们仅加入了与RXXT的比较,不过考虑到以前测试的结果,RXXT与RXXT在专业应用性能上的差距不到10%,因此RXXT的对比测试结果还是具有一定的参考性。从测试结果来看,在BlenderCycles、D5渲染器等应用软件中,RTXTi的创作性能远胜RXXT,领先幅度达到了%甚至更高,由此也大致能推断出RTXTi相对于RXXT来说,在BlenderCycles或D5渲染器等软件的创作性能上领先幅度也会达到接近%或更高的程度。

“钛”上降临,RTX定位或将有变?

NVIDIA公布的RTXTi显卡首发指导价格为元起,这也就意味着非公版显卡将从此价位开始起跳。但是考虑到目前显卡市场价格非常混乱的情况,最终非公版RTXTi到底会以何种价位出现在市场上,目前尚不可轻易定论,但不出意外可能会在万元左右或更高,玩家对此需有心理准备。但是从我们测试的情况来看,本次RTXTi的确将ETH挖矿的哈希值算力进行了大幅度的削减,仅有60MH/s的算力加上近期虚拟数字货币市场的“血崩”,或许会在一定程度上减弱矿主们的兴趣从而让RTXTi能够维持一个相对稳定的状态。

而在经过一系列的测试之后,相信大家都已经能够得到针对RTXTi的比较清晰的定位与结论了。首先,RTXTi在各方面的性能表现上非常接近RTX,与RTX有5%~10%的性能差距,很好地填补了RTX和RTX之间的顶级旗舰GPU空缺。这无疑会一举击破RTX被RXXT和RXXT包围的局面,为NVIDIA桌面显卡市场开拓出新的领地,而4K游戏无疑将会是它的主战场。

其次,从竞品定位上来看,RTXTi很明显瞄准的是竞争对手的RXXT,而源自GA的这款衍生产品也再次切中了要害——RTXTi在游戏性能上的综合表现并不逊色于RXXT,甚至犹有过之。尤其是在光追环境下,更是将RXXT甩开了不小的距离。当很多玩家在考虑顶级游戏显卡时常常会因为RTX高昂的价格转而选择RXXT或RTX,但现在RTXTi的出现则给了他们一个或许是非常不错的新选择。

最后来说点个人见解,RTXTi的定位很明显在较大程度上已经与RTX产生了某种重叠,尤其是在游戏性能的表现上更是如此。因此我们估计RTXTi背负的另一个任务很可能就是结束RTX在最顶级的游戏显卡市场上曲高和寡的局面,以非常接近的性能和相对低的价格,将RTXTi打造成顶级游戏显卡市场上的新“王”。而对RTX来说,RTXTi的出现很有可能会逐步蚕食掉它在游戏市场上的份额,从而转型为一款专为Studio创作性能和8K+顶级游戏准备的云端产品,使得RTX成为极少数专注于8K+游戏的玩家的私人珍藏,这是很有可能的。当然,在Studio创作领域内,RTX凭借24GB大显存在超高分辨率渲染上仍然有不可替代的优势,依旧是众多有此需求的创作者的首选。

元起的RTXTi真的来了,哈希算力的限制于无限接近RTX的性能的确让人对其充满了期待。新“钛”上降临,我们只想代表玩家真切地说一句,“不要空气卡,让我们都能买到吧!”



转载请注明地址:http://www.1xbbk.net/jwbys/2088.html


  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7