斑蝥酊斑秃 https://news.39.net/bjzkhbzy/190322/6985742.html年第四季度是显卡市场最忙碌的时间节点,新显卡接踵而至,全新的RTX30系显卡截至目前已经解禁了RTX//三款显卡,今天要给大家带来的则是NVIDIAGeForceRTXTi的评测。对于这款显卡突然出现相信大家和笔者一样,非常迷惑。“60Ti”这个型号自常规系列的GTXTi之后就没有出现过(16系显卡除外),可以说近两年的甜品显卡“Ti”这个后缀非常罕见,而且如果出现Ti作为后缀的情况,按照以往的惯例也应该是先发布旗舰产品,如GeForceRTXTi,所以本文我们也来研究研究这款RTXTi有何过人之处。GeForceRTXTi显卡背板目前这款GeForceRTXTi的售价为元起,与上一代的RTXSUPER售价相同,但性能相差悬殊,这在下面的测试中也会有所体现。作为一款甜品级显卡,以往系列的定位大致在P至2K分辨率之间,也就是说在3A游戏中2K分辨率下基本可以流畅运行,想要体验更高帧率,P分辨率是最好选择。不过采用NVIDIAAmpere架构的30系显卡自然不会如此“平庸”,下面就让我们进入评测正题,先来看看外观。另外播报一则福利,欢迎大家在首测文章下面踊跃评论(不限定评论内容),我们将会在评论中抽取8名小伙伴送出WD_BLACK定制腰包。抽奖方式:本次活动采用楼层抽取的方式,分别为8楼/18楼/28楼/38楼/48楼/58楼/68楼/78楼,中奖用户我们将通过站内私信的方式与您取得联系。同一个ID仅限获奖一次,二次中奖将顺延至下一位同一个ID最多回帖3次,超过3次取消中奖资格,顺延至下一位获奖01GeForceRTXTi外观在外包装上,GeForceRTXTi与前几款发布的显卡相同,NV标识性的极简风格,方方正正的硬纸盒子,主色调以黑色为主,辅以玫瑰金色纹路。GeForceRTXTiGeForceRTXTi显卡外观RTXTi的整体外观相较RTX的差别不大,相比RTX/要小巧不少,长宽比给人非常舒服的感觉。在之前的评测中我们讲过RTX采用了一前一后的风扇散热设计,显卡尾部的风扇主动将热气排至上方再由整体的散热系统排出。而RTXTi与RTX则是采用了传统的双风扇设计。GeForceRTXTiGeForceRTXTi背板散热鳍片相比RTX的推拉式散热,RTXTi采用推式风扇设计,显卡前端的风扇将热空气从机箱背部支架排出;显卡尾部直接由正面导流罩和大量的外露散热鳍片组成,形成中空状态,风扇依旧会将热气通过散热鳍片向上排出。GeForceRTXTi侧边GeForceRTXTi供电转接线除此之外的一些细节部分,侧面的GeForceRTXlogo取消了LED灯,改为喷涂印刷。供电接口还是熟悉的单12pin,不过转接线采用了12pin转单8pin。所以对于大部分玩家来说,意味着可以不用大动干戈换电源,直接升级显卡。另外RTXTi的边框颜色相比RTX颜色更浅,呈现亮银色。GeForceRTXTi视频输出接口在视频输出接口上,RTXTi采用DP1.4*3+HDMI2.1的4接口设计,同样新的HDMI2.1协议可支持单线8K的视频输出。02NVIDIAAmpere架构中的RTXTiNVIDIAGeForceRTXTi采用了NVIDIAAmpere架构,我们首先来看一下RTXTi的提升。第一代RTX架构Turing下的SUPER第二代RTX架构Ampere下的Ti相较于初代的TuringRTX架构,NVIDIAAmpere架构在算力上有着成倍的增长,这一点在RTXTi中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTXTi的着色器性能达到16.2TFLOPS单精度性能,而Turing为7.2TFLOPS。NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RTCore达到31.6RTTFLOPS,而Turing为21.7RTTFLOPS。全新的TensorCore可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达.6TensorTFLOPS,而Turing为57.4TensorTFLOPS。NVIDIAGeForceRTXTi采用GA核心拥有亿个晶体管,平方毫米的面积,基于三星的8nmNVIDIA定制工艺,另外在RTXTi中我们都知道仍然采用了GDDR6显存,不过不同于RTX的Micron,RTXTi采用了三星的GDDR6显存。我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的从1:1变为2:1。RTXTi共有个CUDA,其实它有个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了这个惊人的数字。而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。光追工作原理示意在此次的NVIDIAAmpere架构中,NVIDIA官方宣布为第二代RTCore,它和第一代有什么不同呢。首先要知道RTCore的工作原理是,着色器发出光线追踪的请求,交给RTCore来处理,它将进行两种测试,分别为边界交叉测试(BoxIntersectiontesting)和三角形交叉测试(TriangleIntersectiontesting)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。RTCore的变化在Turing的RTCore中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RTCore里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。运动模糊渲染原理第二代RTCore可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。稀疏深度学习TensorCore可以看作是GeForceRTXGPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIADLSS和用于AI增强的声画处理技术NVIDIABroadcast应用。在本次的NVIDIAAmpere架构的TensorCore也得到了极大地加强,在第三代TensorCore中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高TensorCore的性能。与此次RTX30系显卡一同发布的还有一项新技术——RTXIO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。虽然随着NVMeSSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。传统的数据交换在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTXIO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。RTXIO可以极大解放CPU负担当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTXIO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。同时搭配新增的HDMI2.1接口,可以支持单线8K的视频输出,而上一代HDMI2.0仅支持4K98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。DMARK理论性能测试首先介绍一下测试平台,为了保证此次评测能够发挥RTXTi显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。GPU-Z参数首先看一下GPU-Z的参数,RTXTi目前的核心代号在软件上还未知,不过三星8nm是肯定的了,芯片面积未知,拥有个CUDA,频率为-MHz,采用8GBGDDR6显存,位宽为bit,显存带宽达到了GB/s,光栅单元和纹理单元虽然软件显示为80和,但显然纹理单元的数据有些错误。下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在P、2K、4K的理论性能,取显卡分数实际测试结果如下:3DMARKFS套装测试在针对显卡DX11性能的3DMARKFS套装测试中,我们主要对比RTXTi和RTXSUPER,整体来看新的RTXTi在各项成绩中均小幅领先RTXSUPER;各项成绩差值在1-4%之间。3DMARKTS套装测试而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,RTXTi领先RTXSUPER更多,在TSE成绩中领先10%。3DMARK光追测试PortRoyal是3DMARK中专门针对光追性能的测试项,RTXTi的测试结果要优于RTXSUPER,但幅度不大为3%左右。在理论测试中,RTXTi可以说是RTXSUPER的OC版,但RTXTi的频率为-MHz,对于非公版显卡还有很大的提升空间。04游戏性能测试在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。《古墓丽影:暗影》游戏测试《古墓丽影:暗影》游戏测试由于本次的参测显卡比较多,而古墓丽影分为标准测试和光追DLSS效果的测试,故分为两张表格进行对比,共2组6测。第一组为预设最高画质下,RTXOFF/DLSSOFF;第二组为预设最高画质下,RTX超高/DLSSON。其中不难看出RTX仍然遥遥领先,RTXTi也要小幅领先RTXSUPER的分数,但是差距不大。《德军总部新血脉》游戏测试《德军总部新血脉》的分数也是几经波折,在多次更新驱动后成绩终于正确,并且由于自带两个benchmark,所以我们的数据取跑分均值。其中RTXTi比RTXSUPER在P分辨率下的分数高7%,2K分辨率下高16%;4K分辨率下高4%。《刺客信条:奥德赛》游戏测试接下来是《刺客信条:奥德赛》,其中RTXTi比RTXSUPER在P分辨率下分数高1%;2K分辨率下高6%;4K分辨率下高9%。《孤岛惊魂5》游戏测试《孤岛惊魂5》同样算是优化比较到位的3A大作,RTXTi比RTX在P分辨率下分数高4%;2K分辨率下高15%;4K分辨率下高18%。《光明记忆:无限》游戏测试《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX最高/DLSS质量”模式下进行。《边境》游戏测试《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX最高/DLSS质量”下进行。05温度与功耗测试在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。功耗测试(点击查看大图)功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款甜品级显卡RTXTi的功耗要小得多,在峰值情况下整体平均在W之间。温度对比温度方面,本次的RTXTi温度相对目前的30系显卡有所降低,属于正常工作温度,在官方数据中RTX采用的双轴流式设计空气流量相较于之前的设计增加55%,散热效率提升30%,而RTXTi采用了传统的正面双风扇设计,不过这张卡本身的频率更低,发热量热会相对较小。06部分游戏光追效果展示上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。《堡垒之夜》RTXON(点击查看大图)《堡垒之夜》RTXOFF(点击查看大图)堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。《魔兽世界9.0》RTXON(点击查看大图)《魔兽世界9.0》RTXOFF(点击查看大图)第二组对比来自最新的《魔兽世界9.0》,同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。《控制》RTXON(点击查看大图)《控制》RTXOFF(点击查看大图)第三组对比为《控制》游戏,这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。07软硬兼施铸就Ampere好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家