手机号
验证码

正在加载验证码......

请先拖动验证码到相应位置

密码
确认密码
已有账号, 立即

已发送密码重置邮件到您的注册邮箱,请立即点击密码重置链接修改密码!

验证邮件24小时内有效,请尽快登录您的邮箱点击验证链接完成验证。若未收到邮件请先确认是否在垃圾邮件中。

查看邮箱

找回密码

手机号
验证码
新密码
确认新密码
没有账号? 立即 注册
Follow us on
@EVOLIFE 公众账号
On Wechat
@爱活新鲜播
On Weibo
@EVOLIFE.CN
On Instagram
Nina@evolife.cn
Mail us
@RSS
Follow our feed
Dennis2017/01/06
能否推翻NVIDIA帕斯卡统治?AMD Vega织女星GPU架构浅析

作者:CHO 陈寅初

 

万年老二AMD在本次CES上也没有闲着,除了拿出了代号Zen的Ryzen桌面处理器展示机之外,还出乎意料的公布了下一代图形处理器的不少架构细节。从AMD透露的资料看,代号Vega织女星的GPU图形处理芯片完全重新设计了架构,准备和NVIDIA Pascal GP10x甚至是下一代Volta正面对决。

从消失的格陵兰(Greenland)开始

早在 2014 年年末时,AMD 已经开始在一些内部会议中透露代号名为 Greenland 的新 GPU 微架构,根据当时寥寥数字的介绍,这个 Greenland 采用 14 纳米制程,设计散热功耗是 250 瓦级别,双精度性能耗电比是当时的 Hawaii (Radeon R9 290 系列)两倍以上。

Greenland

随着时间的推移,人们发现这个神秘的 Greenland 并未如期而至,在 2015 年,AMD 卖的依然是 28 纳米制程的重命名 GPU,相较之下,NVIDIA 则是推出了虽然依然是 28 纳米但是在效率更好、基于 Maxwell 微架构的中端 GPU GM204,它被用于 GeForce GTX 960 这片显卡上,针对的是 1000 到 2000 元人民币市场。凭借 Maxwell 良好的性能耗电优势和整体强劲的营销能力,NVIDIA 已经将 AMD 的 GPU 产品线逼到死角。

AMD 在 2015 年年末和 2016 年年中分别推出了基于 HBM1 的 Fiji 和 GDDR5 的 Polaris 微架构 GPU,它们的内部其实都是属于上一代的 Tango 就采用的 GCN 1.2 图形内核,只是 Fiji 方面采用了 HBM1 有高内存带宽、小体积的卖点,但是并未完全摆脱性能耗电一般的问题。

AMDGPURoadmap

所幸的是,AMD 在 GCN 1.x 引入的 ACE 异步计算引擎在进入 DX12 世代后开始显现威力,在 DX12 和 Vulkans 游戏中,Polaris 挽回了不少颜面,这也是 AMD 得以在 16 年份额开始回升的重要因素。

当前,AMD GPU 存在的问题其实大家都很清楚,这里列举几个常见同时也是我们认为比较致命的问题:

性能耗电比较低:基于14纳米制程 Polaris GPU并没有完全体现出制程进步带来的功耗降低优势。除去格罗方德(GF)14纳米制程本身问题外,Polaris微架构效率同样不尽人意。

部分指标存在明显短板:基于 Polaris 的 RX480,像素填充率是 35.8GPixl/s,而 NVIDIA 基于 Pascal 的 GTX 1060 是 72.3GPix/s,像素填充率这个指标涉及到多样本输出性能,MSAA 等效果的性能都和像素填充率相关。由于理论性能存在巨大差异,直接导致了Polaris在实际测试项目中存在明显性能短板。

缺乏可以和 NVIDIA 抗衡的高端产品:高端产品能显著提升市场的话语权,消费者看性能测试图表的时候,是很难无视排名第一的产品,谁是第一,谁就是最强,选择强者在任何情况下都是最简单最可靠的选择。真指望每个消费者都根据媒体的引导来分析 DX12 之类的优势吗?

Raj

没有什么事情是时间解决不了的,如果有,就花两倍时间。去年从 AMD 分离出来由前苹果首席视觉设计师拉加·库德里(Raja Koduri)领导的RTG(Radeon Technologies Group)部门已完全掌控 GPU 的发展战略,在经历了 Fiji、和 Polaris 的回血后,RTG 在本届 CES 上首次公布了代号 Vega GPU 的下一代微架构部分资料,我们得以藉此对让人期待的Vega GPU GPU管中规豹。

1
文章来自:爱活网
了解更多

匿名进行回复 取消回复

全部评论 23条
  1. 匿名:

    AMD GCN放弃了矢量之后,基本上越来越像CUDA。那么问题来了,要和NV性能一致,AMD GPU的规模也将一致。唯一优势就是HBM了,问题是GP100也有HBM。

    1. 匿名:

      说的好像1080有HBM一样,呵呵

      1. 匿名:

        说得好像有了HBM就能干掉1080一样,呵呵

        1. 匿名:

          Fury X在Vulkcan和DX12下难道打不死1080?呵呵

  2. AMD的GCN放弃矢量之后越来越像CUDA了,这样搞最终结果就是,如果性能和NV一样,那GPU die规模也一样。

    1. 匿名:

      那就是证明NV不行咯?一样规模NV连HBM都没

  3. CHO 陈寅初 好久不见啊,当年再GZEASY经常看你的文章啊

  4. 匿名:

    我现在都怀疑石村是不是来自爱活了

  5. 匿名:

    HSR隐面消除在所有GPU内都有,AMD这个单独拿出来形成管线有意思。

  6. 匿名:

    但是最终输出的画面其实只有 0.02 亿个多边形需要着色处理,明确哪些多边形需要被渲染将能够显著降低渲染负荷。 这些都是NV玩剩地。

  7. 匿名:

    桌面gpu一般是立即渲染模式的,imr,vega的dsbr那个图是和power vr的tbdr分块延时渲染一样的?

    1. 匿名:

      gpu已经不全是立即渲染了吧?

  8. 匿名:

    无论这个NCU和普通CU有什么线性流程上面的改进。最多改进的内部线程排列合理程度。改进渲染,缩减冗余多余计算。这样的做法或许可能让更大的核心面积容纳更少的SP更性能不会有太大提高。这个说白了就是中端200-300mmGPU处理器到了500-600mm的其中本身改进。

    1. 匿名:

      我反对这样的看法。vega的HMC实际上有机会解决统一寻址的问题。radeon pro ssg挂载ssd,连同vram统一寻址就很有意思,如果换成hbm2,后面挂载gddr5x呢?5x后面再挂载ssd呢?

      1. 匿名:

        统一寻址有用,但是延迟怎么解决?从cpu到pcie到gpu到hmc到hbm最后到ssd,你逗我么?

        1. 匿名:

          这样也比不能统一强,你能找个1tb的RAM系统我看看么?

          1. 匿名:

            你有什么数据有1TB?纹理?

  9. 匿名:

    预感引擎底层程序员对Vega的优化又得捣鼓一阵了

评论
从现在知道的信息来看,应该还是ARM架构,除了ARM也没什么适合移动端的新架构。
还是arm架构吗,听说弄了新架构
EVO_1438 2023/05/25
能把我拍的好看点吗
EVO_1438 2023/05/25
今年realme的声音小了很多啊
EVO_1438 2023/05/25
版权 © 2017 爱活网 Evolife.cn 科技进化生活 [沪ICP备2021031998号]
版权 © 2017 爱活网 Evolife.cn 科技进化生活
[沪ICP备2021031998号]