能否推翻NVIDIA帕斯卡统治？AMD Vega织女星GPU架构浅析

更灵活的几何体渲染

目前的 RADEON GPU 在前端还保留了固定功能单元实现的几何处理硬件，不过 AMD 表示他们已经注意到了越来越多的开发人员使用计算着色器来进行几何处理。

上面两张图都是 PC 游戏《杀出重围：人类分裂》中巨像之城（Golem City）的场景图，下面的则是它的线框图。按照 AMD 的说法，上面这个场景有 2.2 亿个多边形，但是最终输出的画面其实只有 0.02 亿个多边形需要着色处理，明确哪些多边形需要被渲染将能够显著降低渲染负荷。

AMD 为此在 Vega GPU 的几何流水线上引入了名为 Primitive Shader（图元着色器）的全新工位，开发人员可以透过图元着色器，实现高效的几何着色处理。AMD 认为这个新着色器可以让无效图元以极高的比值被舍弃掉，最终将会彻底替换掉现有的固定几何处理功能单元。

为了实现更高效的几何处理性能，AMD 引入了名为 Intelligent Workgroup Dostributor 的工作组分发器，可以支持更多的着色器引擎（NVIDIA 对应的层级单元被称作 GPC，AMD 目前的 GCN 架构最多只有 4 个着色器引擎），实现更灵活的载荷分配。

按照 AMD 的说法，Vega GPU 现在可以在四个几何引擎的情况下每个周期处理多达 11 个多边形，达到两倍于现有产品的几何处理能力。

发表评论取消回复

要发表评论，您必须先登录。

全部评论 23条

匿名:

2017年2月19日上午7:16

sss

登录以回复
匿名:

2017年1月8日下午3:22

AMD GCN放弃了矢量之后，基本上越来越像CUDA。那么问题来了，要和NV性能一致，AMD GPU的规模也将一致。唯一优势就是HBM了，问题是GP100也有HBM。

登录以回复
1. Dennis:
  
  2017年1月8日下午5:43
  
  说的好像你的1080是HBM一样
  
  登录以回复
2. 匿名:
  
  2017年1月8日下午5:46
  
  说的好像1080有HBM一样，呵呵
  
  登录以回复
  1. 匿名:
    
    2017年1月9日下午2:51
    
    说得好像有了HBM就能干掉1080一样，呵呵
    
    登录以回复
    1. Dennis:
      
      2017年1月9日下午5:31
      
      Vulkan和DX12下Fury X难道干不过1080？呵呵
      
      登录以回复
    2. 匿名:
      
      2017年1月9日下午5:33
      
      Fury X在Vulkcan和DX12下难道打不死1080？呵呵
      
      登录以回复
Dennis:

2017年1月8日下午3:19

AMD的GCN放弃矢量之后越来越像CUDA了，这样搞最终结果就是，如果性能和NV一样，那GPU die规模也一样。

登录以回复
1. 匿名:
  
  2017年1月9日下午5:37
  
  那就是证明NV不行咯？一样规模NV连HBM都没
  
  登录以回复
EVO_300:

2017年1月8日上午7:17

CHO 陈寅初好久不见啊，当年再GZEASY经常看你的文章啊

登录以回复
匿名:

2017年1月7日下午1:23

我现在都怀疑石村是不是来自爱活了

登录以回复
1. 匿名:
  
  2017年1月7日下午3:17
  
  石村是谁？
  
  登录以回复
  1. 匿名:
    
    2017年1月12日下午3:10
    
    沙壁一只
    
    登录以回复
匿名:

2017年1月7日下午1:19

HSR隐面消除在所有GPU内都有，AMD这个单独拿出来形成管线有意思。

登录以回复
匿名:

2017年1月7日下午12:07

但是最终输出的画面其实只有 0.02 亿个多边形需要着色处理，明确哪些多边形需要被渲染将能够显著降低渲染负荷。这些都是NV玩剩地。

登录以回复
匿名:

2017年1月7日上午11:35

桌面gpu一般是立即渲染模式的，imr，vega的dsbr那个图是和power vr的tbdr分块延时渲染一样的？

登录以回复
1. 匿名:
  
  2017年1月7日下午10:42
  
  gpu已经不全是立即渲染了吧？
  
  登录以回复
匿名:

2017年1月7日上午10:22

无论这个NCU和普通CU有什么线性流程上面的改进。最多改进的内部线程排列合理程度。改进渲染，缩减冗余多余计算。这样的做法或许可能让更大的核心面积容纳更少的SP更性能不会有太大提高。这个说白了就是中端200-300mmGPU处理器到了500-600mm的其中本身改进。

登录以回复
1. 匿名:
  
  2017年1月7日下午10:55
  
  我反对这样的看法。vega的HMC实际上有机会解决统一寻址的问题。radeon pro ssg挂载ssd，连同vram统一寻址就很有意思，如果换成hbm2，后面挂载gddr5x呢？5x后面再挂载ssd呢？
  
  登录以回复
  1. 匿名:
    
    2017年1月7日下午11:00
    
    统一寻址有用，但是延迟怎么解决？从cpu到pcie到gpu到hmc到hbm最后到ssd，你逗我么？
    
    登录以回复
    1. 匿名:
      
      2017年2月9日下午1:43
      
      这样也比不能统一强，你能找个1tb的RAM系统我看看么？
      
      登录以回复
      1. 匿名:
        
        2017年2月9日下午2:23
        
        你有什么数据有1TB？纹理？
匿名:

2017年1月6日下午11:16

预感引擎底层程序员对Vega的优化又得捣鼓一阵了

登录以回复

找回密码

更灵活的几何体渲染

发表评论 取消回复

发表评论取消回复