光追性能显著提升,主打高性价,AMD Radeon RX 9070 GRE首发评测
前段时间,我们曾对AMD Radeon RX 9070 XT、AMD Radeon RX 9070这两款采用RDNA 4设计的显卡产品进行详细测试。而基于RDNA 4架构的它们在游戏性能,尤其是光追游戏性能方面有了长足的进步,因此能够很好地应对当下的游戏大作,给我们留下了深刻印象。近期,AMD再度推出基于RDNA 4架构的Radeon RX 9070 GRE显卡,希望能够给予主流玩家更多选择。事实上,型号之后带“GRE”后缀的显卡是AMD推出RX 7900 GRE后延续下来,是作为面向中国玩家市场打造的高性价比定制产品。那么它的表现能否如AMD Radeon RX 9070 XT、AMD Radeon RX 9070一般亮眼呢?我们今天将会通过华硕ATS RX 9070 GRE巨齿鲨一探究竟。
️华硕ATS RX 9070 GRE巨齿鲨产品参数
核心架构:RDNA 4
核心代号:Navi 48 XL
制程工艺:TSMC N4C
CU单元:48个
流处理器:3072个
光追核心:48个
AI核心:96个
Boost频率:2860MHz
显存容量:12GB GDDR6
显存位宽:192bit
显存带宽:432GB/s
输出接口:3DP 2.1b +1 HDMI 2.1b
TBP:230W
参考价格:4199元
️架构升级关键点回顾AMD全新推出的RDNA 4架构GPU采用台积电4nm制程工艺,能效比有所提升。作为该架构首批量产产品,RX 9070系列显卡搭载统一设计的RDNA 4计算单元,其中RX 9070 XT配置64组CU单元,RX 9070配备56组CU单元,面向主流市场的RX 9070 GRE则采用48组CU单元(对应3072个流处理器)。
新一代RDNA 4架构的CU单元在微架构层面实现关键升级,相较前代RDNA 3架构同级产品,RX 9070 XT在1440p分辨率游戏场景中可获得最高40%的性能提升。这种性能跃升主要源于架构优化带来的每瓦特性能提升,而非单纯通过堆叠晶体管数量实现。对于游戏玩家和专业图形工作者而言,该架构在合理功耗范围内提供了更稳定的高帧率输出和更精准的图形渲染能力,有效提升了实际应用场景中的工作效率与视觉体验。
RDNA 4架构引入了先进的显存管理机制,能优化显存资源分配效率。在硬件资源调度层面,RDNA 4采用了动态寄存器分配技术,使GPU能够根据实时负载特征自动调整计算资源分配策略,有效提升任务处理效率。此外,架构扩展了标量指令集,新增的专用指令集为开发者提供了更高效的代码优化空间,有助于释放硬件潜在性能。这些改进共同构成了RDNA 4架构的效能提升基础,在保持功耗可控的前提下,为用户带来更流畅稳定的图形处理体验。
AMD RDNA 4架构针对前代产品在光线追踪性能方面的短板进行了专项优化。在核心硬件层面,新一代架构对光线追踪加速器进行了重构设计,重点强化了其精确度和效率。具体而言,其光线交叉引擎(Ray Intersection Engine)的计算性能实现翻倍提升,通过优化光线投射算法和并行处理效率,显著缩短了复杂光影场景的渲染耗时。另外,RDNA 4架构引入了光线变换引擎(Ray Transformation Engine)和定向包围盒(OBB)技术。前者通过改进空间坐标转换机制,优化了光线在虚拟场景中的传播路径计算;后者则采用改进的几何碰撞检测算法,提升了光线与物体表面的交互精度。这些技术协同作用,在保持能效比的前提下,有效提升了光线追踪的运算效率和画面还原度,为游戏玩家和专业创作者带来更真实的画面表现与更稳定的帧率输出。
AMD RDNA 4架构通过集成第三代光线追踪加速器,实现了对前代RDNA 3架构的针对性优化。根据官方技术白皮书披露,该架构使每个计算单元(CU)的光线追踪运算吞吐量提升至前代产品的两倍以上,这一改进直接作用于光线追踪任务的执行效率,显著缩短了复杂光影场景的渲染周期。对于终端用户而言,搭载RDNA 4架构的AMD Radeon RX 9000系列显卡在运行支持光线追踪的游戏时,可呈现更精细的光照层次、更精确的阴影投射以及更真实的物理反射效果。这些改进通过提升画面细节还原度,有效增强了游戏场景的视觉真实感,为玩家构建了更具沉浸感的虚拟世界。
通过引入第二代AI加速器,RDNA 4架能够更好地应对AI计算——在处理高级AI模型时,能够以更高的效率达到更快的处理速度。此外,RDNA 4的AI加速器还扩展了其功能,支持FP8等新兴数据类型,使其能更好地适应未来AI技术的发展趋势。同时,它还支持结构化稀疏性等先进的推理优化技术,这些技术有效提升了AI模型的推理效率。与上一代RDNA 3产品相比,这些改进显著提高了每个AI加速器(用于稀疏矩阵)每个计算单元的INT8吞吐量,具体而言,性能提升了高达8倍,为RDNA 4显卡在AI计算方面带来了显著的性能飞跃。
在视频编解码层面,该架构加入增强型多媒体引擎,实现了对主流编码格式(H.264/HEVC)与新一代AV1标准的完整支持。硬件级优化使其具备同时处理8K@80FPS视频流的能力,在分辨率与帧率指标上较前代产品实现突破性提升。值得关注的是,其媒体引擎采用无限制任务调度设计,在持续高负载场景下仍可保持稳定的编解码性能输出,有效避免了多路并发任务中的资源竞争问题。
针对后处理流程,RDNA 4架构引入了智能画质增强算法,通过动态调整锐度、对比度及色彩映射参数,在保留原始内容细节的基础上优化最终成像质量。这种软硬件协同的优化方案,使RX 9000系列显卡在直播推流、视频录制及高分辨率影音播放等场景中,能够提供更流畅的传输效率和更精准的画面还原,满足专业创作与消费级应用的多维度需求。
在RX 9070系列显卡发布会上,AMD正式公布了其图像增强技术的迭代成果——基于AI算法优化的AMD FidelityFX Super Resolution 4(FSR 4)。作为超分辨率技术的最新演进版本,FSR 4通过集成机器学习驱动的画质优化模型,实现了对画面细节重建算法的深度改进。该技术将通过AMD Software: Adrenalin Edition软件套件进行部署,但现阶段其完整功能仅限搭载RDNA 4架构的Radeon RX 9000系列显卡启用。这一技术部署策略既体现了硬件与软件协同优化的设计思路,也标志着AMD在实时画质增强领域的技术路径转向深度学习加速方向。
FSR 4的技术升级基于机器学习——AMD利用数据中心级GPU加速器对海量真实游戏场景数据进行深度学习训练,使超分辨率模型能够更精准地识别画面特征并优化重建策略。此外,FSR 4还充分借助了AMD RDNA 4架构所提供的硬件加速功能,尤其是FP8 Wave Matrix Multiply Accumulate(WMMA)技术,这一技术的应用确保了图像升级过程中的卓越质量。与此同时,FSR 4还能显著提升游戏性能,使游戏运行更加流畅,从而进一步优化用户体验。
在画质维度,机器学习模型有效降低了传统超分辨率技术常见的图像重影现象;在性能维度,专用加速指令使FSR 4在相同功耗预算下可处理更多像素数据。实际应用中,该技术组合使RX 9070系列显卡能够在维持画面质量基准的同时,实现更稳定的帧率输出,为玩家提供兼具视觉保真度与系统响应速度的完整体验提升。
视角回到产品本身,基于RDNA 4架构的华硕ATS RX 9070 GRE巨齿鲨除了拥有以上特性之外,其内置有48个CU单元,合计3072个流处理器,并且还拥有48个光追核心和96个AI核心,相比RX 9070 XT配置的64组CU单元,屏蔽了四分之一的GPU内核。显存方面,华硕ATS RX 9070 GRE巨齿鲨配置了12GB GDDR6,其显存位宽为192bit、显存带宽为432GB/s。另外,在核心频率方面,AMD Radeon RX 9070 GRE显卡的默认加速频率为2.79GHz,低于RX 9070 XT的2.97GHz,但是高于RX 9070的2.52GHz。而在华硕的调校下,华硕ATS RX 9070 GRE巨齿鲨的核心加速频率达到了2.86GHz,理论上能够提供优异的实际帧率。
️测试对象介绍️华硕ATS RX 9070 GRE巨齿鲨华硕巨齿鲨系列主要面向主流玩家群体,因此它的气质与AMD Radeon RX 9070 GRE的定位相对贴合。在整体设计上,华硕ATS RX 9070 GRE巨齿鲨采用偏科幻的风格,表面印刻了对称的纹理以作装饰。同时,通体黑色的装甲外壳四角,采用了小小的蓝色梯形装饰条做点缀,从而让整个外观有了一丝灵动的气息,如果这些装饰条还兼具背光的作用,灯光闪烁之间或许会让人更好地联想到深海的巨齿鲨。
▲华硕ATS RX 9070 GRE巨齿鲨采用三风扇设计,且风扇处采用了11片经过特殊处理的扇叶,因此能够为显卡内部带来更明显的进风量。
▲华硕ATS RX 9070 GRE巨齿鲨的右侧采用格栅式装饰,并且此处还印刻了一个Logo暗纹用以表明其身份。
▲显卡的左上方以蓝色三角形与白色的“ASUS”Logo做点缀,加上镂空设计为显卡平添了几分设计感。
▲电源接口方面,华硕ATS RX 9070 GRE巨齿鲨采用2×8pin接口,方便需要升级显卡的玩家平滑过度。
▲视频接口方面,这款显卡采用3×DP+1×HDMI的经典配置,能够满足时下用户的需要。
将显卡翻过身来,华硕ATS RX 9070 GRE巨齿鲨的背面采用了一块合金背板,能够显著增强PCB的刚性,起到保护作用。背板的尾部采用对称式散热格栅,能够辅助机身内部的废热逸散。同时,其设计相对朴实,除了极简的线条以及“AMD RADEON”标识之外,没有其他装饰。
️测试平台一览
显卡:AMD Radeon RX 9070 GRE、NVIDIA GeForce RTX 5070 FE、NVIDIA GeForce RTX 5060 Ti
处理器:AMD锐龙7 9800X3D
主板:七彩虹CVN X870 ARK FROZEN
内存:iGame影DDR5 6400 16GB×2
硬盘:七彩虹CN700 1TB Pro
电源:昆仑MU-850G冰山版
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 24H2
驱动程序:AMD Software Adrenalin Edition 25.5.1、NVIDIA Game Ready Driver 576.28
️GPU理论性能测试在GPU理论性能测试中,华硕ATS RX 9070 GRE巨齿鲨(以下测试简称RX 9070 GRE)表现正好介于NVIDIA GeForce RTX 5070 FE、NVIDIA GeForce RTX 5060 Ti 16GB(以下测试简称 RTX 5070、RTX 5060 Ti)之间——在FireStrike、TimeSpy的测试中,其与RTX 5070的差距相对较小,比如在TimeSpy Extreme中,RTX 5070获得了10744的显卡分数,而RX 9070 GRE获得了10450的显卡分数。
值得肯定的是,由于AMD RDNA 4架构还针对前代产品在光线追踪性能方面的短板进行了专项优化,因此RX 9070 GRE在PortRoyal测试中与RTX 5070的表现接近。不过在面向全局光照测试的SpeedWay测试中,RX 9070 GRE仍旧与RTX 5070有一定差距。当然,就该环节的测试来看,RX 9070 GRE于3DMARK的测试中仍旧有着强势的表现。
️光栅游戏性能测试在光栅游戏实测环节,我们挑选了10款对游戏性能要求不一的游戏,于1440p分辨率下进行测试,测试时开启游戏的最高或超高画质,并关闭垂直同步。根据测试结果,我们可以看到,RX 9070 GRE在多数游戏中均有相对流畅的帧率表现,因此传统的1440p光栅游戏并不会为这款显卡带来太大的压力。另外,对比RTX 5060 Ti 16GB,RX 9070 GRE有30%的帧率领先幅度;而当对比对象替换为RTX 5070时,RX 9070 GRE与其在测试游戏中互有胜负,RTX 5070性能略占优。
️光追游戏性能测试对于不少玩家来说,光追带来的真实感会让游戏更沉浸。因此我们挑选了四款游戏用于该环节的测试。可以看到,当开启光追之后,RTX 5060 Ti 16GB在《黑神话:悟空》以及《光明记忆:无限》中打了翻身仗,但整体而言,RX 9070 GRE的优势较其还是更明显一些,平均领先优势达到了37%。而当对比对象替换为RTX 5070时,RX 9070 GRE仅能在《怪物猎人:荒野》中与之掰掰手腕,其余光追游戏的表现则逊色于RTX 5070。当然,从这部分测试,我们也能看到RX 9070 GRE确实在光追性能方面还是有了不小的进步。
值得一提的是,开启光追效果的游戏大作对于显卡性能的要求颇为严苛,因此RX 9070 GRE在没有开启FSR 3+帧生成时,帧率表现一般,因此我们还在《黑神话:悟空》《赛博朋克2077》《怪物猎人:荒野》测试了其在开启FSR 3@平衡模式+帧生成的实际帧率表现,可以看到在启用该功能之后,RX 9070 GRE能够获得一个颇为流畅的帧率表现,比如在《黑神话:悟空》中,原生帧率仅为16fps,开启开启FSR 3@平衡模式+帧生成之后帧率则提升到了62fps,提升幅度达到了285%,要知道FSR目前还进阶到了FSR 4,后续还有更多游戏会支持该功能。
️FSR 4实测FSR 4通过内置的API集成接口,为已采用FSR 3.1技术的游戏提供了向上兼容的升级路径。该技术架构实现了与现有FSR 3.1帧生成算法及Radeon Anti-Lag 2低延迟技术的深度协同,通过动态调整渲染管线优先级,在保持画面质量的同时优化输入响应周期。
根据AMD官网发布的FSR 4信息,我们可以看到目前支持FSR 4的部分游戏,包括《地平线:西之绝境》《使命召唤:战区》《战神:诸神黄昏》等游戏。
在FSR 4实测阶段,我们选择了《地平线:西之绝境》。需要说明的是,如果玩家需要开启FSR 4,必须在测试游戏之中提前开启FSR 3。
在启动游戏前,我们需要通过按下“Alt+R”呼出AMD Software Adrenalin Edition,然后在游戏界面打开FSR 4的选项,之后再进入游戏。如果状态显示活跃,则表明FSR 4已正常启动。
上图左为开启FSR 3时的画面,右为开启FSR 4时的画面。可以看到,开启FSR 4之后,游戏画面的精细度明显更高,包括人物的毛发以及衣物上的装饰、纹理等等。
上图左为开启FSR 3时的画面,右为开启FSR 4时的画面。由于FSR 4还能更好地抑制图像重影,因此我们可以看到图右繁茂的草地处拥有更清晰的画面呈现,而左侧画面的草地相对模糊一些。
我们通过AMD Software Adrenalin Edition 25.5.1可以随时查看《地平线:西之绝境》的实时帧率。以上游戏帧率分别为原生画质:98fps;开启FSR 3+关闭帧生成:136fps;开启FSR 3+开启帧生成:195fps;开启FSR 4+开启帧生成:204fps。也就是说,当RX 9070 GRE启用FSR 4之后,不仅游戏画面更为清晰,游戏帧率也仍旧能够得到同样的保证。事实上,FSR 4的机器学习模型专门针对RDNA 4架构的AI加速单元进行了运算负载优化。当运行于RX 9070系列显卡时,该技术组合可实现双重性能提升:首先通过智能超分辨率算法减少渲染像素量,其次利用AI驱动的帧生成技术补充中间帧细节。这种分层优化策略使显卡能够在维持画质基准的前提下,显著提升帧率稳定性并优化输入延迟表现,为玩家提供兼具画面精度与操作跟手性的综合体验提升。
另外,玩家还可以利用AMD Software Adrenalin Edition驱动开启AFMF 2.1,其能够帮助游戏进行插帧,从而让画面更为丝滑,对于那些不支持FSR的游戏来说,该功能非常有用。
️AI性能体验测试我们前面有提到AMD RDNA 4架构不仅提升了能效比,同时也进一步加强了其在AI方面的计算能力,再加上搭载了12GB显存,因此RX 9070 GRE能够较好地应对生产力创作与AIGC方面的需要。
在面向图像渲染的V-Ray GPU测试以及Blender Benchmark中,AMD Radeon RX 9070 GRE的表现值得肯定,于前者得到了1199分;于后者的monster项目中得到了1100分。也就是说,AMD Radeon RX 9070 GRE能够应对轻量化生产力创作方面的需要。
在UL Procyon AI TEXT Generation的AI文本推理生成性能测试中,Phi 3.5、Mistral 7B和Llama 3.1 7B模型测试,AMD Radeon RX 9070 GRE的表现也没有让人失望——其于Phi 3.5中,能实现接近超过100 tokens/s的词元输出速度,在MISTRAL 7B大模型测试中也能达到78.1 tokens/s的词元输出速度。对于那些玩腻歪了游戏,又想体验一下AI文本创作的用户而言,AMD Radeon RX 9070 GRE能够满足他们浅尝辄止的需要。
️散热与稳定性测试最后,让我们再来看看RX 9070 GRE在散热与稳定性测试的实际表现。通过Furmrk烤机测试,RX 9070 GRE于25℃的环境温度下,能够将GPU的温度控制在55℃左右,这个散热表现非常出众,即便是我们用手指触碰此时的显卡背板,也不会感到灼热。
另外,我们还记录了RX 9070 GRE的实际功耗表现——其在待机时的功耗为29W,于Furmrk烤机测试时的满载TBP为230W左右、满载TGP为186W左右。也就是说,玩家在选择这款显卡时最好为其配备一款额定电压为650W及其以上的高品质电源。另外,在实际测试过程中,RX 9070 GRE几乎没有带来明显的噪声,能够给予用户舒适的体验环境。
️小结综合测试数据表明,基于RDNA 4架构打造的RX 9070 GRE显卡不仅能够在1440p分辨率下流畅运行传统光栅化渲染游戏,更通过RDNA 4架构的优化设计实现了显著效能提升。特别值得关注的是光线追踪性能表现,实测数据充分印证了RDNA 4架构的实质性突破,这使得RX 9070 GRE在光线追踪游戏测试环节中,相较RTX 5060 Ti 16GB展现出较大的性能优势,并且能够和RTX 5070稍微掰掰手腕,可以说AMD又为我们交出了一份较为令人满意的答卷。同时,RX 9070 GRE显卡还能利用FSR 3、FSR 4对帧率进行拔擢,从而使得它能够游刃有余地应对1440p分辨率下的光追游戏大作。如果你正巧近期有更替显卡的需要,RX 9070 GRE这一RDNA 4架构下的新品会是一个性价比比较不错的选择。
AMD Radeon RX 9070 GRE显卡(以及组装机)将于2025年5月8日上午9时在京东平台准时开售!凡在5月11日23:59前下单,并且完成晒单的用户,可享受单卡返100元E卡(整机返150元)的超值权益,数量有限,先到先得!与此同时,“以旧换新”活动仍在继续,详情请登录活动页面,获取更多优惠信息。
活动链接
APP端:
https://pro.m.jd.com/mall/active/d2wNF3E89uvaUwHSeuu7MQoEGrB/index.html
PC端:
https://pro.jd.com/mall/active/d2wNF3E89uvaUwHSeuu7MQoEGrB/index.html