X
日期:2015-09-07 18:19:41作者:ANNT来源:爱活网

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

SoC的性能争夺之战打从Android开始跑分之时已经悄然展开,但实际应用其实与枯燥的数值之间没有太多关系,骁龙810正式发布时隔半年后,骁龙820已经摆出了蓄势待发的架势,一场蓄谋已久的大招从Adreno 530、Hexagon 680 DSP的相继提出后逐渐变得清晰,随着Kryo CPU的到来,我们才发现高通骁龙820这次的组合拳变得有些厉害,从骁龙810到骁龙820的转变,不仅仅是数字增加了10那么简单。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

让Kyro顶大梁

公版的ARM标准微架构“Cortex-A”虽然能带来稳定、成熟、节约研发时间的好处,用来追赶时间节点可以,但要在性能和能耗上碾压对手就没这么容易了,Cortex-A57性能强大,但功耗也居高不下,单个A53核心TDP(设计热功耗)约300mW左右,而工作单个A57核心TDP高达3W,ARM给出的big.little大小核结构方案让A53和A57混着用,只有在复杂任务的时候所有核心才会全力以赴,但两者之间的指令吞吐和缓存是互相独立的,单个APP如果要在A53和A57之间切换运行需要毫秒级的响应时间,并且一旦控制不好,SoC的散热和能耗也无从保证。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

不难发现,历届出于高通之手的架构总比标准ARM Cortex-A架构要来的彪悍,从Scorpion微架构的MSM8250,再到骁龙800、骁龙801上的Krait,无一不在展示着高通的过硬实力。对骁龙810能耗不满意的同学,现在可以坐等骁龙820的Kyro发大招了,它首先解决的是A53、A57之间功耗和性能的矛盾,不仅性能要向A57看齐,能耗也要逼近A53,同时确保统一的核心让APP不必来回切换、高效运行。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

Kyro使用了类似于A57的乱序执行结构(Out of order),同时融入自家的动态电压调整和动态频率调整控制技术,力争在每一毫瓦电力上压榨出更多性能,它采用了4个核心,每核支持最高达2.2GHz的处理速度,14nm FinFET工艺,按照官方的说法,Kyro是骁龙800上Krait的延续,它的研发耗费了高通工程师的大量设计时间,以至于跳过了骁龙810而直接运用于骁龙820上,并带来相对于骁龙810两倍的性能和功效提升,再次拉开与竞争对手的距离。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

拉低功耗全靠Hexagon 680 DSP

只有CPU节能远远不够,在骁龙SoC上CPU、GPU、DSP的异构计算已经成为拉动性能、降低能耗的三驾马车,Hexagon 680 DSP是在Adreno 530发布之后第二个被公布技术细节的部分。相比CPU,Hexagon 680 DSP擅长在低功耗下以更高效处理来自摄像头、传感器和信号处理的任务,它的工作就是处理那些超大规模、并行的数据。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

Hexagon 680 DSP为了分担处理任务,首次支持计算向量扩展(HVX),让DSP通过一个指令处理大量的数据流,大量数据流通常出现在虚拟现实、增强现实、图像处理、视频处理、计算视觉运算情境中,仅仅依靠GPU和CPU分担效率远没有DSP来的高效,高通正在做的就是将Hexagon向量扩展(HVX)和Spectra ISP结合,获取更多差异化性能,比如将视频暗部调亮处理速度能比上一代快上3倍,而功耗之前此前的10%,这个过程也并非等待CPU分配任务,而是主动实现,Hexagon 680 DSP知道自己要在数据流中如何抓去有用信息,让协作关系变得更为明朗。

大招来了谁也挡不住 高通骁龙820拿出了要干掉对手的气势

为了节省能耗,Hexagon 680 DSP引入了名为低功率岛(Low Power Island)的概念,低功率岛DSP取代的是之前的传感器中心,让Hexagon 680 DSP分配芯片每一部分的能耗,在传感器能够持续工作的前提下,完全关闭芯片的其他部分,将能耗降到最低,并且包括了完整的传感器软件框架和算法,支持目前的Android L,也意味着即使没有类似A8上的协处理器,骁龙SoC也能在低功耗的前提下运行计步器或活动计数器以及传感器辅助定位等组件,让省电变得更为彻底。

高通产品管理高级总监Rick Maule曾经表态,智能手机对多核处理器需求并没有人们想象中那么高,Kyro CPU四核早已完全足够,甚至人们不该关心CPU到底有多少核心,因为手机上的很多功能最后都是托付给DSP来完成,Hexagon虽然是一种单核的计算架构,但在运行时可以最多实现四线程的计算,每一个线程背后都有支持的硬件,线程之间的协作无须再花费过多的功耗,就能实现快速的切换。这时候单核心效率要远比之前的双核心乃至三核心完成音频、视频计算变得更有效率。

正在加载评论...