NVIDIA RTX 3070显卡性能如何(NVIDIA RTX 3070首测)
如果有更好的建议或者想看更多关于生活常识技术大全及相关资讯,可以多多关注茶馆百科网。

NVIDIA的GeForce RTX 30系列显卡已经发布近两个月了。RTX 3080/3090刚刚过了热闹,现在RTX 3070正式到来了。
对于游戏玩家来说,70机型具有如此多的魔力,以至于黄本人在新闻发布会上表示:“无论是970、1070还是2070,70一直是最受欢迎的机型。”
NVIDIA GeForce RTX 3070
NVIDIA GeForce RTX 3070 Founders Edition是NVIDIA GeForce RTX 3070 Founders Edition显卡的首次亮相,它将被NVIDIA安培架构的性能爆炸所掩盖。
nvidia GeForce RTX 3070外部
首先来看一下GeForce RTX 3070显卡的外观,与其他两个兄弟一起发布的显卡相比,RTX 3070要小得多,给出了非常舒适的长宽比。
在外包装上,一直是NV的极简风格,方形纸板箱,主色调以黑色为主,辅之以玫瑰金纹,与RTX 3080相同。
NVIDIA GeForce RTX 3070
RTX 3070的整体外观与RTX 3080相比差异还是比较大的,在之前的评测中我们已经说过,RTX 3080采用了前后风扇散热设计,显卡尾部风扇主动排气到顶部再从整体散热系统。
NVIDIA GeForce RTX 3070背板外露散热片
虽然RTX 3070的正面设计与其前身相同,但背面却有所不同。图形卡仍然采用超高密度PCB板设计。
NVIDIA GeForce RTX 3070
与RTX 3080的推挽式散热方式相比,RTX 3070采用了推挽式散热设计。显卡前面的风扇将热空气从机箱的后支架中抽出。显卡的背面直接由前偏转板和大量外露的鳍片组成,形成中空状态。风扇仍然会通过散热片向上排出热空气。据官方称,RTX 3070流媒体系统比RTX 2070的公开版本提供了16dBA的安静和44%的散热。
NVIDIA GeForce RTX 3070电源接口
NVIDIA GeForce RTX 3070电源适配器电缆
除了一些细节外,侧面的GeForce RTX标志取消了LED灯,取而代之的是喷印。电源接口仍然是我们熟悉的单12pin,但转换电缆略有不同,因为RTX 3070的功耗更小,使用12pin到8pin。所以对于大多数玩家来说,这意味着你可以升级你的显卡而不必更换电源。
NVIDIA GeForce RTX 3070视频输出接口
在视频输出接口上,RTX 3070采用DP1.4a*3 + HDMI 2.1 4接口,也可以支持单线8K视频输出。
NVIDIA GeForce RTX 3070
单从外观上看,我觉得RTX 3070没有RTX 3080好看,但是整体工艺一样精致,只是电力传输电缆还是有些许瑕疵,由于电线比较硬,从“双马尾”变成了“一powerhouse”,但是RTX 3070侧面的logo不发光,所以不太显眼。
RTX 3070在02NVIDIA安培下
NVIDIA GeForce RTX 3070也使用NVIDIA安培架构。让我们首先看看RTX 3070的增强功能。
2070年,第一个RTX架构
安培3070下的第二代RTX架构
NVIDIAAmpere架构比原始的图灵RTX架构的计算能力要高得多,这仍然反映在RTX 3070上,其中每个时钟执行两次着色器操作,与图灵一次相比,RTX 3070在单精度性能上实现了20.3 TFLOPS的着色器性能,而图灵为7.9 TFLOPS。
NVIDIAAmpere架构将射线与三角形相交的吞吐量提高了一倍,RT Core达到39.7 RTTFLOPS,图灵达到23.8 RTTFLOPS。
新的张量核心可以自动识别和去除不太重要的DNNS的权重,它在稀疏网络上的工作速度是图灵的162.6 TensorTFLOPS的两倍,而图灵的60.3 TensorTFLOPS。
NVIDIA GeForce RTX 3070 GPU核心拥有174亿个晶体管,面积392平方毫米,基于三星的8nm NVIDIA定制工艺,在RTX 3070中我们都知道它仍然使用GDDR6显存,然而与RTX 3080上的美光不同,RTX 3070使用的是三星的GDDR6显存。
事实上,nvidia安培的SM已经将基于图灵的FP32单元数量增加了一倍,这使得每个SM的FP32单元数量增加了一倍,吞吐量也增加了一倍。
我们没有计算SM中的所有单元,而是只计算FP32中的单元数量。因此,SM中[FP32: INT32]的数量由1:1变为2:1。
RTX 3070总共有5888个cuda。它只有2944个INT32单元,但加上两倍数量的fp32,最终结果是惊人的5888个。
cuda数量的大幅增加对游戏有何帮助?答案是肯定的,不仅仅是很多,而是很多。一般来说,在游戏中,浮点运算比整数运算更常用。各种计算操作的图形,算法和着色器工作负载通常需要FP32算术指令的混合,FP32加速也有助于光线跟踪噪声降低着色器。
介绍了光学示踪的工作原理
在这种NVIDIAAmpere架构下,NVIDIA正式宣布了第二代RT Core。它与第一代有何不同?关于RT Core如何工作的第一件事是,着色器发送一个光线追踪请求,给RT Core处理,它做两个测试,它们分别是Box Intersectiontesting和Triangle Intersectiontesting。基于BVH算法,如果是平方,则返回缩小范围,继续测试;如果是三角形,它将反馈渲染结果。
然而,最耗时的光线追踪是交点的计算。因此,要提高光线追踪的性能,主要是加速两种相交(BVH/三角形相交)。
RT核心变更
图灵的RT核心能够在每个循环中完成5个BVH遍历,4个BVH相交和一个三角形相交。在第二代RT Core中,NVIDIA增加了一个新的三角形位置插值模块和一个额外的三角形相交模块。目标是提高光线跟踪性能的特殊效果,如运动模糊。
运动模糊渲染原理
第二代RT Core允许同时执行光线跟踪和着色,并且您做的光线跟踪越多,速度越快。根据英伟达自己的测量,它的光线交叉性能提高了一倍,渲染运动模糊图像的速度是图灵的八倍。
稀疏深度学习
除了包含Ampere Core的光线跟踪增强功能外,NVIDIA还为第三张量核心引入了稀疏加速,它可以自动识别并去除不太重要的DNNS(深度神经网络)的权重,同时仍保持良好的准确性。
首先,将原密集矩阵进行训练去除稀疏矩阵,然后对稀疏矩阵进行训练,实现稀疏优化,从而张量核,提高其性能。
RTX 30卡伴随着新技术——RTX IO。目前很多游戏在几十G甚至100 G的安装空间,对于存储空间的负担暂且不说,而是存储在硬盘上的数据,如果显卡要读取,CPU需要从硬盘上读取压缩后的数据,经过解压后再发送到显存。
随着NVMe固态硬盘的引入,其读取速度比机械硬盘快20倍,但由于传统的I/O限制,NVMe高达7GB/s的读写速度对CPU来说是一个巨大的负担。
传统数据交换
在此过程中,会占用多个CPU内核,导致压力急剧增加,内存消耗大量,而GPU处于空闲状态。RTX IO直接从PCIE总线读取压缩后的数据,绕过了从CPU解压和传输数据的过程。RTX IO对来自GPU的压缩数据进行无丢失的解压缩,降低CPU占用率,提高性能。
RTX IO可以极大地减轻CPU的负担
当然,这项技术作为底层系统运行方式的改变,还需要借助微软DirectStorage来实现,对于目前游戏容量而言,RTX IO的提升效果有限,但随着时间的推移等游戏容量达到数百G成为常态,这项技术将发挥巨大的作用。
同时,新增的HDMI2.1接口可支持单根线8K视频输出。上一代HDMI2.0只支持4K 98Hz视频输出。如果你想连接8K电视,你需要更多的电缆支持。
033DMARK理论性能试验
第一,测试平台。为了在本次评测中获得RTX 3070显卡的最佳性能,主板和CPU使用了当前的桌面旗舰配置,详见下文。
在测试结果上,基准测试使用3DMARK,游戏性能测试使用游戏自带基准。同时,为了减小误差,对每个测试结果进行三次测试并取平均值。
GPU-Z参数
首先来看一下GPU-Z的参数,RTX 3070采用GA104内核,三星8nm,芯片面积达到392平方毫米,比RTX 3080 628小236平方毫米,拥有5888个cuda,频率1500-1725MHz,使用8GB GDDR6显卡,位宽256bit,显卡带宽达到448GB/s,栅格单元和纹理单元分别为96和184。
下面一行是用来测量显卡DX11理论性能的3DMARKFS集合:FS、FSE和FSU分别对应于显卡在1080P、2K和4K的理论性能。实际测试结果如下:
3D MARK FS套件测试
在DX11显卡的3DMARK FS套件测试中,RTX 3070和RTX 2080Ti胜出。然而,与RTX 2070相比,改进是显著的,FS得分提高了45%,FSE得分提高了50%,FSU得分提高了56%。然而,RTX 3070和RTX 3080之间的差异相对稳定,在28-29%之间。
3D MARK TS套件测试
在Time Spy和Time Spy Extreme在DX12环境下的测试中,RTX 3070和RTX 2080Ti也获得了胜利。此外,不难发现,在4K分辨率下的测试项目中,RTX 3070都获得了胜利。
RTX 3070的TS得分比RTX 2070高52%,在TSE中高出60%。与RTX 3080相比,差异为31-33%。
3D MARK追光测试
PortRoyal是3DMARK中用于光学追踪性能的特殊测试项目。RTX 3070的测试结果优于RTX 2080Ti。比RTX 2070高53%。
在理论测试中,RTX 3070和RTX 2080Ti可以说是不分上下,让我们进入游戏测试。不幸的是,我们没有RTX 2080Ti的公开版本可供比较测试。在上述理论检验中,我们也使用了以往的检验结果进行比较。
04游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》的基准运行软件,以及国产游戏《刺客信条:奥德赛》和《边境》。
《光明记忆:无限》游戏测试
在《古墓丽影:暗影》中,由于加入了追光和DLSS效果,我们也分为2组,每组6个测试。为了照顾没有DLSS之前的测试成绩,第一组在预设的最高画质下RTX OFF/DLSS OFF。第二组预设为最高质量,RTX超高/DLSS ON。
RTX 3070相对于RTX 2080的分数增长稳定在10%左右。与1080P分辨率的RTX 2070相比,分别提高了36%和37%;2K分辨率分别提高40%和39%;在4K分辨率下,提高了37%到42%,整体提升幅度在30-40%之间;与rtx3070相比,RTX3080提升了约40%,因此作为旗舰卡,RTX3080是相当暴力的。
《古墓丽影:暗影》游戏测试
在《德军总部新血脉》中,有两个基准测试,因此我们的数据取平均运行分数。RTX 3070在1080P分辨率下比RTX 2080高16%,在2K分辨率下比RTX 2080高30%。4K高25%。
《德军总部新血脉》游戏测试
接下来是《刺客信条:奥德赛》,在1080P分辨率下,RTX 3070比RTX 2080高18%;2K分辨率提高19%;4K高23%。
《刺客信条:奥德赛》游戏测试
《孤岛惊魂5》也是一款优化良好的3A大作,在1080P分辨率下,RTX 3070的得分比RTX 2080高14%;2K分辨率提高36%;4K高41%。
《孤岛惊魂5》游戏测试
《光明记忆:无限》是Swift Islands Studios开发的《光明记忆:无限》的新系列。目前还没有游戏可玩,但基准的运行软件已经正式可用,玩家可以在steam上下载。另外,在测试过程中我们无法关闭光学追踪选项,所以所有的测试结果都是在“RTX最高/DLSS质量”模式下进行的。
RTX 3070在1080P分辨率下比RTX 2080高17%,在2K分辨率下高38%,在4K分辨率下高41%。
《光明记忆》游戏测试
《边境》也是柳叶刀工作室的国产3A大作,具体发布日期未知,目前只提供基准运行软件。同样,目前运行的软件不支持关闭光学追踪选项,所以我们在测试时选择了“RTX最高/DLSS质量”。
在1080P分辨率下,RTX 3070的得分比RTX 2080高29%,在2K分辨率下高34%,在4K分辨率下高31%。总体而言,RTX 3070的得分比RTX 2080高30%左右。
温度和功耗测试
在温度功耗测试方面,室温为24,我们不采用全封闭机箱,而是采用测试平台的方法,这样可以最大限度地提高显卡除自身散热外,最大限度地减少风道等外部因素。
电源测试(点击查看大图)
在功耗测试中,选择FurMark软件进行复制测试,仅计算显卡本身的功耗。与旗舰RTX 3080相比,RTX 3070消耗的功率要少得多,在峰值条件下平均在210W到220W之间。
在温度方面,RTX 3070仍然控制在75左右。在官方数据中,RTX 3080的双轴流设计比之前的设计提高了55%,散热效率提高了30%。RTX 3070采用传统的前置双风扇设计,在散热效率上会有一定的差异。但在RTX 3070本身的情况下,热值随着频率的增加而增加。
胡萝卜加大棒产生安培
好的硬件没有软件的支持,就相当于空有长柄没有枪,想要发挥百分之十的威力就必须软硬兼备,反之亦然。随着发布会的推出,下面这些都非常值得大家关注。
NVIDIA Reflex
在过去,我们一直关注延迟,我们在显示器上看到了几毫秒的快速反应,但这只是最终输出。您是否想过从系统内部到实际视图有多少延迟?
NVIDIA Reflex
NVIDIA将发布自己的电子竞技显示器,NVIDIA 360Hz G-SYNC ESPORTS,以及NVIDIA Reflex技术,NVIDIA在20系列显卡中多次提到“Frame-Win”。
测量系统延迟使用需要高速摄像机和定制LED鼠标电路。具有NVIDIA Reflex的显示器将内置精确的延迟分析工具,该工具将优化CPU和GPU的渲染管道,大大减少延迟和整体系统延迟至30ms以下。但要做到这一点,你需要一个支持反射延迟分析的鼠标,如图所示。
NVIDIA Broadcast
NVIDIA Broadcast是一款易于使用的专业直播软件。英伟达广播的强大之处在于,你不需要任何背景。你所需要的只是一个普通的摄像头和一个GeForce RTX系列显卡。
它戳到了我的脸!
这款软件可以让你杂乱的房间立刻变成一个直播室,内置音频降噪、背景模糊、虚拟背景、头部跟踪等功能。NVIDIA广播通过使用人工智能算法使用DGX超级计算机的深度学习来工作。
NVENC代码
同时,RTX 30系列显卡拥有目前最好的硬件解码器。直播过程中打开OBS推送流后,大多数用户计算机的CPU使用率会直接飙升到50%左右,而基于GPU的NVENC解码可以大大降低CPU负担。
NVIDIA Studio
对于内容创作者来说,当你想到软件时,你可能只想到内容创作软件,但NVIDIA的NVIDIA Studio驱动程序是将创作软件连接到显卡的关键。
NVIDIA Studio
NVIDIA Studio驱动程序已经更新和优化,为最新版本的Adobe软件套件提供更稳定的支持,以及更好的创作功能。使用NVIDIA的CUDA技术,gpu加速效果允许更快的实时视频编辑和加速渲染输出,以及对软件编码视频输出的简单硬件支持。人工智能计算的其他优势,包括片段的自动标记、效果跟踪和人脸识别,都要快得多。
GPU渲染耗时14.98秒,CPU渲染耗时11分钟
当然,在NVIDIA Studio加速创作的能力方面,Adobe并不是唯一一家。专业软件,如达芬奇、Keyshot、Blender、D5等,都显示出了很好的效果。它不仅可以提供强大稳定的运行环境,还可以通过GPU加速提高创建效率。
07销售冠军预约
NVIDIA GeForce RTX 3070在性能方面,与RTX 2080Ti不相上下,但价格仅为3899元,以上一代旗舰的价格体验性能,这笔交易不能用讨价还价来形容,而是捡了起来。
NVIDIA GeForce RTX 3070
此外,虽然RTX 3070仍然采用12针接口供电,但它只有6针接口,这意味着非公共显卡可能会使用单个8针接口。在功耗方面,RTX 3070的杂音频率功耗为220W,低于RTX 2080 SUPER。推荐功率为650W,可与大多数有源电源配合使用。这对于想要使用新显卡而不需要更换整个配件的玩家来说是个好消息。
20系列和30系列显卡参数的比较
在游戏表现上,RTX 3070可以说相当惊艳,目前市面上大部分游戏都可以在4K分辨率下获得60FPS的高帧率体验,并且在评测中我们都是以预设最高画质下测试,很多不必要的特效在真正游戏时大可以关掉,来获得更高的帧率。
NVIDIA GeForce RTX 3070
个人认为,如果你想体验全新的30系显卡所带来的性能暴涨,但又不想花上中千的价格,那么RTX 3070是最合适的。尽管在不久的将来还会有入门级的RTX 3060,性能估计也会在RTX 2070之上,但体验到的依然是20系显卡中高端的水准。
总的来说,NVIDIA GeForce RTX 3070做到了性能与价格兼顾,比肩RTX 2080Ti的性能,看齐RTX 2070的价格,1.6倍于RTX 2070的性能让20系显卡,正在以飞快的速度谢幕。如果你想升级显卡,体验4K游戏的超清画质,又不想“大动干戈”,这样一款低功耗高性能的显卡最适合你。
NVIDIA GeForce RTX 3070
目前非公版显卡的解禁时间为2天之后,也就是10月29日21:00,届时各个渠道的售卖也会一同开启,另外有爆料称RTX 3070的供货量将会大很多,是时候去试试手气抢一块了。
本文主要介绍了关于NVIDIA RTX 3070显卡性能如何(NVIDIA RTX 3070首测)的相关养殖或种植技术,生活常识栏目还介绍了该行业生产经营方式及经营管理,关注生活常识发展动向,注重系统性、科学性、实用性和先进性,内容全面新颖、重点突出、通俗易懂,全面给您讲解生活常识技术怎么管理的要点,是您生活常识致富的点金石。
以上文章来自互联网,不代表本人立场,如需删除,请注明该网址:http://23.234.50.4:8411/article/1487868.html