【芝能智芯——AMD的Phoenix SoC的CPU部分】
●CPU方面
Phoenix拥有8个Zen 4核心的集群,Phoenix采用了不同的高速缓存设置,只有16MB的L3缓存(而不是通常的32MB)。AMD可能将L3切片缩小到每个核心2MB,以减少芯片面积的使用。
根据测试,延迟与台式机上的Zen 4相同。实际的延迟可能会稍微差一些,因为台式机上的Zen 4频率更高。例如,Ryzen 9 7950X3D的非VCache芯片在16MB的测试大小下延迟为8.85纳秒。而Ryzen 7 7840HS在10MB的测试大小下延迟为10.92纳秒。部分差距是因为HP坚持将时钟速度限制在4.5 GHz,尽管7840HS应该能够提升至5.1 GHz。
Phoenix的内存控制器支持DDR5和LPDDR5。对于功耗至关重要的手持设备来说,LPDDR5尤其有用。与LPDDR5一起的内存延迟更高,为119.81纳秒。然而,与Van Gogh相比,AMD已经大幅改进了LPDDR5的延迟,Van Gogh在CPU核心访问DRAM时延迟很高。
Infinity Fabric 带宽
CPU集群通过每个时钟周期32字节的Infinity Fabric链路与系统的其余部分进行通信。与台式机设计不同,其中写路径是宽度的一半,CPU到Fabric的写路径也可以处理每个周期32字节。这在实际工作负载中几乎不太可能影响性能,因为我没有看到任何单个核心需要超过30 GB/s的写入带宽的工作负载。多线程的工作负载可能需要更多的带宽,但也可以分配到不同的CCX。
AMD已经实现了写入优化,以减少Infinity Fabric的流量。通过使用CLZERO清零缓存行时,单个7950X3D CCD的写入带宽可以超过68 GB/s。清零内存是相当常见的,因为程序将初始化内存以确保新分配的内存处于已知状态。操作系统通常也会这样做。如果应用程序使用已识别的方法清零内存,可以看到比通用测试所建议的更高的有效写入带宽。
Infinity Fabric 优化
Infinity Fabric是AMD的一种一致性互连。在功耗方面,它至关重要,因为互连功耗可能占芯片功耗的相当大一部分,特别是在不是完全推动计算的工作负载中。AMD对各种工作负载进行了分析,并根据工作负载是否受到计算限制、IO限制或具有非常特定的特征(如视频会议)来设置Phoenix的Infinity Fabric,使其进入不同的操作模式。
这些优化避免了Van Gogh的问题,因为它在CPU侧带宽上限制在约25 GB/s,这要归功于一个在有限的功耗预算内高度优化用于游戏的Infinity Fabric实现。在Cheese的HP笔记本上,根据工作负载不同,Infinity Fabric时钟也会有所变化:
AMD在GPU拉取大量带宽时使用低速Fabric时钟以提高能效。GPU具有四个32B/周期的端口与Fabric相连,即使在低速Fabric时钟下,也可以获得足够的内存带宽。由于客户程序通常对延迟比带宽更敏感,因此CPU工作负载获得了更高的Fabric时钟,从而改善了延迟。与Renoir不同,Phoenix的可变Infinity Fabric时钟与生成内存流量的组件无关时都会降至1.6 GHz。
为了进一步节省功耗,AMD积极追求功耗和时钟门控的机会。新的Z8睡眠状态允许在短暂的闲置期间进行功耗和时钟门控,例如在按键之间,而不会感知到唤醒时间。在视频播放期间,Phoenix可以实现较高的Z8状态停留,这表明媒体引擎的缓冲区和高速缓存足够大,可以允许它进行短暂的内存访问。
来自优化各种物理接口也带来了额外的节能。内存控制器可以根据需要动态更改时钟和电压状态。多年来一直在使用的USB 2.0接口竟然具有许多功耗优化机会,因此AMD也进行了调整。
#芝能日报##芝能智芯##新能源大牛说#
●CPU方面
Phoenix拥有8个Zen 4核心的集群,Phoenix采用了不同的高速缓存设置,只有16MB的L3缓存(而不是通常的32MB)。AMD可能将L3切片缩小到每个核心2MB,以减少芯片面积的使用。
根据测试,延迟与台式机上的Zen 4相同。实际的延迟可能会稍微差一些,因为台式机上的Zen 4频率更高。例如,Ryzen 9 7950X3D的非VCache芯片在16MB的测试大小下延迟为8.85纳秒。而Ryzen 7 7840HS在10MB的测试大小下延迟为10.92纳秒。部分差距是因为HP坚持将时钟速度限制在4.5 GHz,尽管7840HS应该能够提升至5.1 GHz。
Phoenix的内存控制器支持DDR5和LPDDR5。对于功耗至关重要的手持设备来说,LPDDR5尤其有用。与LPDDR5一起的内存延迟更高,为119.81纳秒。然而,与Van Gogh相比,AMD已经大幅改进了LPDDR5的延迟,Van Gogh在CPU核心访问DRAM时延迟很高。
Infinity Fabric 带宽
CPU集群通过每个时钟周期32字节的Infinity Fabric链路与系统的其余部分进行通信。与台式机设计不同,其中写路径是宽度的一半,CPU到Fabric的写路径也可以处理每个周期32字节。这在实际工作负载中几乎不太可能影响性能,因为我没有看到任何单个核心需要超过30 GB/s的写入带宽的工作负载。多线程的工作负载可能需要更多的带宽,但也可以分配到不同的CCX。
AMD已经实现了写入优化,以减少Infinity Fabric的流量。通过使用CLZERO清零缓存行时,单个7950X3D CCD的写入带宽可以超过68 GB/s。清零内存是相当常见的,因为程序将初始化内存以确保新分配的内存处于已知状态。操作系统通常也会这样做。如果应用程序使用已识别的方法清零内存,可以看到比通用测试所建议的更高的有效写入带宽。
Infinity Fabric 优化
Infinity Fabric是AMD的一种一致性互连。在功耗方面,它至关重要,因为互连功耗可能占芯片功耗的相当大一部分,特别是在不是完全推动计算的工作负载中。AMD对各种工作负载进行了分析,并根据工作负载是否受到计算限制、IO限制或具有非常特定的特征(如视频会议)来设置Phoenix的Infinity Fabric,使其进入不同的操作模式。
这些优化避免了Van Gogh的问题,因为它在CPU侧带宽上限制在约25 GB/s,这要归功于一个在有限的功耗预算内高度优化用于游戏的Infinity Fabric实现。在Cheese的HP笔记本上,根据工作负载不同,Infinity Fabric时钟也会有所变化:
AMD在GPU拉取大量带宽时使用低速Fabric时钟以提高能效。GPU具有四个32B/周期的端口与Fabric相连,即使在低速Fabric时钟下,也可以获得足够的内存带宽。由于客户程序通常对延迟比带宽更敏感,因此CPU工作负载获得了更高的Fabric时钟,从而改善了延迟。与Renoir不同,Phoenix的可变Infinity Fabric时钟与生成内存流量的组件无关时都会降至1.6 GHz。
为了进一步节省功耗,AMD积极追求功耗和时钟门控的机会。新的Z8睡眠状态允许在短暂的闲置期间进行功耗和时钟门控,例如在按键之间,而不会感知到唤醒时间。在视频播放期间,Phoenix可以实现较高的Z8状态停留,这表明媒体引擎的缓冲区和高速缓存足够大,可以允许它进行短暂的内存访问。
来自优化各种物理接口也带来了额外的节能。内存控制器可以根据需要动态更改时钟和电压状态。多年来一直在使用的USB 2.0接口竟然具有许多功耗优化机会,因此AMD也进行了调整。
#芝能日报##芝能智芯##新能源大牛说#
#邓佳鑫[超话]# #和邓佳鑫一起秋日出行# #邓佳鑫 三代第一vocal#
双节快乐们!!搞一个小c j ,插一个小
铺铺Magic D周边这么好看大家都不心动吗
10月5日前周边总x l超过929(中秋节)
随机抽3名p l多和2名z f多的宝宝分别赠送all in周边一份;同时我拔5份all in ,另一位妈咪拔5份all in,共计15份。
c j要求:1.三代邓唯/邓一推
2.m过火焰/不顾邓款
双节快乐们!!搞一个小c j ,插一个小
铺铺Magic D周边这么好看大家都不心动吗
10月5日前周边总x l超过929(中秋节)
随机抽3名p l多和2名z f多的宝宝分别赠送all in周边一份;同时我拔5份all in ,另一位妈咪拔5份all in,共计15份。
c j要求:1.三代邓唯/邓一推
2.m过火焰/不顾邓款
中关村在线手机频道横向对比了当下主流的五款竖向折叠屏手机,包括:OPPO Find N3 Flip、华为Pocket S、三星Galaxy Z Flip5、vivo X Flip以及moto razr40 Ultra。过程不多讲,直接上结论:
1、三星Galaxy Z Flip5外屏支持应用最为丰富,摩托罗拉Razr40Ultra其次;
2、OPPO Find N3 Flip竖向外屏,更符合操作逻辑;
3、OPPO Find N3 Flip与vivo X Flip人像表现最好;
4、OPPO Find N3 lFlip续航和信号发挥出色。
PS:总结时他们没有提华为Pocket S。
1、三星Galaxy Z Flip5外屏支持应用最为丰富,摩托罗拉Razr40Ultra其次;
2、OPPO Find N3 Flip竖向外屏,更符合操作逻辑;
3、OPPO Find N3 Flip与vivo X Flip人像表现最好;
4、OPPO Find N3 lFlip续航和信号发挥出色。
PS:总结时他们没有提华为Pocket S。
✋热门推荐