820上的Kryo是高通第一个全自主设计的64位CPU,这个独特的构架在浮点的IPC性能很强(爱搞机:IPC全称Instruction Per Clock cycle,指每周期可处理的指令数,可以笼统理解性能=IPC*频率),但整数I...
视频
试用
产品
海淘

骁龙820是高通SoC版图上的一个里程碑,其无论绝对性能还是能效比,对比骁龙808/810都有大幅度提升,而且商业上也非常成功。而更重要的是,这背后是高通对移动计算平台的看法和布局--异构计算:
经过大幅增强的Hexagon 680 DSP(digital signal processor数字信号处理器)有了自己的独立介绍,后者支持Hexagon矢量扩展(Hexagon Vector Extensions/HVX),负责图像处理应用中的计算负载(以往在CPU/GPU上相对更费电的虚拟现实、增强现实、图像处理、视频处理、计算视觉等任务可交给DSP去更高效率地处理);
上面有高通第一个自主构架的64位CPU核心--Kryo,其重点提升了浮点运算性能;
加入了升级后的 Adreno GPU ,更强的ALU(逻辑运算单单元)除了提升体验外,还让人工智能、机器学习(物体识别)、照片和视频中的成像优化和AR/VR体验提升等成为可能。

在这个理念的基础上,骁龙835现在是高通移动平台的一部分,这个拥有超过30亿个晶体管的SoC(然而苹果16年9月推出的A10处理器已经有33亿个晶体管了)是首个使用三星10nm工艺的产品,最终让封装面积对比骁龙820减少了35%。新的CPU构架和X16 LTE基带是当中最重要的改变,其基带已经可以提供最高1Gbps的下载速度(Cat.16),SoC里的其他部分也得到了一些相应的小升级。

高通从骁龙800那一代开始就有请媒体到高通加州圣地亚哥总部,以进行功能演示和有限测试的习惯,当然,是通过高通自己的原型机(MDP移动开发平台),后者是用于进行软硬件测试,具备完整功能的手机或平板,只是它们的体型会比手机要大一圈。当年的骁龙810被放在了平板测试机上,而820的测试机是一部有6.2英寸巨屏的手机,到了835这一代,测试原型机继续变小,变成了5.5英寸2K分辨率屏幕,搭载6G内存和2850mAh电池的手机。

原型机变小是个好趋势,因为机器越小,可以用来吸收和分散热量的面积就越小,这侧面说明了骁龙835的功耗会进一步缩小。当然,这需要精确的功率测试才能确认。因为测试时间有限,所以我们专注于CPU/GPU和内存性能测试。注意,我们这里测试的是原型机和非正式版的系统,所以结果仅供参考。量产版很有可能会有比一定的出入。
CPU部分
820上的Kryo是高通第一个全自主设计的64位CPU,这个独特的构架在浮点的IPC性能很强(爱搞机:IPC全称Instruction Per Clock cycle,指每周期可处理的指令数,可以笼统理解性能=IPC*频率),但整数IPC性能还不如ARM之前的A57构架,而且能效比也要低一点。比起使用修改820的4核Kryo构架,高通在835走了一条完全不同的道路。
新的Kryo280构架,除了名字,和原来的Kryo构架没有任何的传承关系。骁龙835上采用了8核心大小核构架,由4个负责极限性能输出的大核,和4个追求"能效比"的小核组成。而这个构架最特殊的地方,其实是它是首个对ARM新构架进行改进的产品。BoC许可让厂商可以根据需求对构架进行调整,特别是对指令预取区和发射队列上的修改,但构架里某些部分不在许可范围内。包括解码器和执行管线都是动不了的,毕竟改动他们的工程太大了。高通没有公开它是基于ARM那个构架修改的,但高通表示大小核CPU都是半自主设计的构架,而内存控制器也是高通自己设计的。
骁龙835的 Kryo 280 CPU在整数运算IPC性能(每周期可处理的指令数)对比820/821有明显的提升,这是我们没预料到的,毕竟Kryo核心的长处不是整数运算。虽然大部分测试中都有大增长,但JPEG,Canny和Camera等部分测试出现了倒退,这个特征和我们在Kirin 960上的A73表现很像。这些整数测试的成绩和L1/L2缓存的行为,都和A73独特的表现很类似,Kryo 280可能就是基于ARM最新的A73构架改的。

具体分数可以戳我们爱搞机之前骁龙835亚洲首秀的文章《20万分不是梦 骁龙835亚洲首秀》,这里我们简单对比一下骁龙835和Kirin 960在Geekbench 4的整数测试成绩,它们的子项目成绩的类似程度,可不是频率和正常的测试变量可以造成的。它们的测试成绩里,只有极少数特殊的项目有差异,范围在-5%-9%之间。这再次说明了,在BoC许可内做小修改后的半自主构架,其成绩其实也是可以预测的。

把频率考虑进去之后(上表)得出每Mhz获得的分数(意义接近同频性能),这会更加容易比较不同构架之间的IPC性能。Kryo 280这种半自主设计的构架,成绩和Kirin960上的A73并没有很大分别,只是比A72高了6%,比A57高了14%,比起前代的骁龙820/821高了整整22%(因为Kryo核心本身在LLVM和HTML5 DOM上的表现不佳,拖低了820/821的分数)。骁龙835的成绩无法横扫其他旗舰产品,和Kirin 960上的A73一样,小项目测试的结果和前代对比也是互有高低的。

骁龙835的Kryo 280在820本来强项的浮点测试中的分数出现了明显的倒退,甚至还输给了A72。结果依旧和 Kirin 960的A73很像,连小项目的测试分数也很接近。
A73相对A72小幅倒退的部分,也是Kyro 280倒退的部分,这有点出乎我们的预料。因为他们的NEON执行单元和A72几乎没有变化。如果硬要说区别的话,A72在前端延迟、指令预取区和内存系统上会占优一些,但幅度不大。A73在指令解码上的劣势会影响成绩,但不会对全局造成大的影响。对比A72,Kirin 960的A73和骁龙835D Kryo 280 都出现了 L2缓存读/写带宽下降,L1缓存写入带宽下降的问题,这同样对成绩造成了影响。
Kryo 280、A73、A72和A57都有2个AGU地址生成单元。但A72/A57将载入和存储操作分开由不同AGU处理,而Kryo 280和A73 里的AGU都可以执行存取操作。在Kirin 960上,这个改变带来了比950更加低的内存延迟和并提升了内存带宽。
835在内存延迟控制和带宽上,甚至比960还要强,抛除频率差的因素后,提升依旧达到11%,对比820/821提升巨大。但在两代Kryo的带宽提升幅度,不如Kirin从A72升级A73构架时那么大,因为上一代Kryo的2个AGU就已经能执行载入和存储两种操作了,只是前代在某些场景的延迟会更高。
系统性能表现
到现在为止,我们对骁龙835上的Kryo280的印象是,其是对A53和A73构架进行修改后的产物,无论整数还是浮点运算的IPC每周期性能,都和Kirin960很相似。像PCMark这些系统层面的测试,可以根据真实生产环境,使用安卓API对CPU/GPU/内存/NAND存储进行测试,但除了CPU的IPC性能和内存延迟等影响外,还会受厂商对系统软件优化的影响,后者可以控制程序优先级和DVFS动态电压频率调整策略,以求得性能和续航之间的平衡。
在网页浏览测试中,骁龙835原型机表现优异,但只是比Mate 9高10%。在这个主要考核整数运算的测试中,其比820/821高了34%。值得注意的是,整数运算本来就吃力的820/821,排在了所有A72和A73构架的机器之后,甚至连骁龙650都打不赢。
为了看看软件层面造成的影响会有多大,我们使用高通内部测试的浏览器(专门为了骁龙SoC优化过)进行测试,结果Kraken测试值提升到了2305ms, 但JetStream提升24%到了87分(但这两个项目还是落后iPhone很多),WebXPRT 2015 测试更是暴涨82%达到280分(终于打赢并抛离了iPhone)。
GPU部分
骁龙835上的 Adreno 540 和820上的 Adreno 530用的是同样的构架,但做了小优化避免以前的瓶颈,并对对ALU和寄存器进行了优化。通过改进depth rejection(深度过滤器)减轻了每个像素点的计算负载,以提升性能表现并降低能耗。
高通宣称在3D渲染上对比820的Adreno 530有25%的提升。虽然官方没有说明,但很明显,这里面一大半的提升来源于10nm制程的优势,后者让GPU频率可以提高到710MHz,单单这里已经比820提升14%了。
在3DMark Sling Shot的第一个图形测试中,毕竟构架变化不大,Adreno 540并没有像以前Adreno 530那样,在几何运算里表现出现大跃进式的提升。 而面对一向在几何运算任务重表现出色的ARM Mali系列GPU,Adreno 540仍然要强11%左右。
在注重着色器性能的第二个图形测试,Adreno 540就发飙了,对比S7上的Adreno 530提升34% ,比Mate 9的Mali-G71高50%,高通在ALU和寄存器上的修改,在这个测试里的效果非常明显。物理测试是在CPU上跑的,而且受SoC的内存控制器的随机存取表现直接影响。虽然CPU表现相似,但骁龙835原型机比Mate9提升14%,主因或许是835的内存控制器,在延迟控制和带宽都比Kirin960强。
在 Basemark ES 3.1的工作场景下,ARM的Mali系列GPU会更占优,离屏测试, Exynos 8890的 Mali-T880MP12比820上的Adreno 530快15%,Kirin 960上的 Mali-G71MP8 要比骁龙835的Adreno 530快25%。这个测试中,骁龙835原型机比起Pixel XL的涨幅达到了40%,比其他测试里的25%要高一截。
能耗、相机、虹膜识别功能展示
总结
移动SoC包括了:CPU、GPU、高性能的DSP(运算用途)、低功耗DSP(协处理器)、基带SDP(信号处理)、ISP(照片处理)、固定的功能模块(视频与音频)等。所有这些部分都会影响用户体验,但当中很多都无法量化。
via:anandtech
有关于手机购买,手机维修,手机评测等问题咨询,可以通过爱搞机业务部的微信号:igao7-shouji 来联系我们。
更多精品专业评测,更多好玩有趣视频,欢迎关注微信公众号《爱搞机》和《搞机啦》。关注爱搞机,分享美好数字生活
爱搞机微信
搞机啦微信