3月6号,高通发布了一份白皮书,名为《通过NPU和异构计算开启终端侧生成式AI》,借这个会,阿通还开了一个小范围的沟通会,让高通技术公司产品管理高级副总裁 Ziad Asghar来讲解了一下。Ziad是我们的老朋友,也是骁龙开发团队现在的头儿。
整份白皮书的专业度还是一如既往的高,通篇看了一下,其实没有什么新的内容,主要就是将高通自2015年第一代AI Engine发布以来到现在,自家骁龙芯片AI性能发展做了回顾,同时面向现在生成式AI潮流,芯片能力所做的强力适配布局做了讲解。
但我觉得最重要的是,阿通终于找到一个好机会,对自家AI Engine为什么要从一开始就做异构计算架构的选择做了非常详细的解释——还记得几年前的NPU之争么?所以,这条微博我就通过自己的理解,简单解读一下这份白皮书,就当是知识吧。
Ziad说,之所以从一开始做AI Engine(骁龙820)就采用异构计算方案,就是考虑到不同的处理器的特性不同。当前,高通AI Engine中包含应对不同AI运算任务的组件,包括CPU、GPU、NPU(神经网络处理器)以及高通传感器中枢(Sensing Hub)等。
不同的处理模块在任务处理时所擅长的方向不同。
---------
CPU擅长顺序控制和即时性,非常适用于需要低时延的应用场景,因此阿通会在对时延要求非常高的用例使用CPU来运算。同时C,PU也适用于相对较小的传统模型,如卷积神经网络模型(CNN),或一些特定的大语言模型(LLM)。
GPU主要擅长面向高精度格式的并行处理,32/16位浮点,8位整数等,比如对画质要求非常高的图像以及视频处理。
NPU擅长标量(Scalar)、向量(Vector)和张量(Tensor)计算,这三种加速器都集成在骁龙Hexagon DSP当中,而这其中对应AI计算的主要就是Tensor加速器。
值得一提的是,Tensor加速器是2018年推出的骁龙855上才加入Hexagon 690的,那个时候正是NPU有无争论最激烈的时候,此时再回看,这一变化的确也是因为AI用例变化带来的。
放在现在最热门的生成式AI用例上,NPU,或者说张量加速器,能够以低功耗实现持续稳定的高峰值性能,特别是面对LLM和LVM这些大模型的时候。
Sensing Hub是2019年阿通在骁龙865上新加入的模块,它的主要作用就是以极低功耗实现长时间稳定的低AI能力,从而让设备拥有情境感知的能力,比如待机状态下注视亮屏,只不过刚出来的时候,它的功耗表现并不好,骁龙旗舰有这样功能的机型并不多。
---------
说完这些处理器模块,再来看一些具体技术细节的变化。
2020年推出的骁龙888虽然口碑不咋地,但在AI运算方面却有非常重大的变化,在它上边,Hexagon DSP将过往分离的向量、标量和张量加速器做了融合,更名为Hexagon NPU,还针对加速器设计了专用共享内存——AI计算对内存速度是有很高要求的。
2022年的骁龙8Gen2处理器又做了非常重要的一个升级,为AI计算部分做了专属供电,不需要唤醒其他SoC模块而可以单独运行,于是,Sensing Hub“以极低功耗实现长时间稳定的低AI能力”终于实现,这也带来旗舰旗舰在感知方面的变化。
2023年的骁龙8Gen3在这个基础上进一步升级供电机制,给Hexagon NPU给设计了单独的供电电路,跑AI用例时能耗更低,同时共享内存带宽也增加了一倍,所以我们能看到这代骁龙旗舰比上代在推理AI计算时性能几乎翻倍,但能效却提升了40%。
Sensing Hub也得到了升级,双核架构,性能比上代提升3.5倍,内存增加30%,全天候情境感知能力更强,
只不过,跑现在的LLM和LVM,只有NPU的共享内存跑得快是不够的,我在这篇文章:https://t.cn/A6jjXs1z 中提到过,看起来很先进的LLM在运行时的机制其实很“简单粗暴”:把整个参数库载入内存跑就是了,所以,骁龙8Gen3也支持当前最快的LPDDR5X内存。
---------
白皮书最后,阿通还提到了高通AI软件栈强大的支持能力,这一点我在前文中提前的长文中有所提及,在这里就不多说了。
在白皮书中,还多次提到了阿通非常骄傲的Oryon CPU,根据CPU在AI计算中所体现的能力,它在高通AI Engine异构计算中也会发挥重要的作用。
目前看,搭载骁龙X Elite的AI PC终端要在年中陆续问世,到时候它能驱动端侧AI有何等应用是很值得期待的,另外就是骁龙8Gen3用上了Oryon CPU,整个SoC的AI能力又会有何等提升呢?
整份白皮书的专业度还是一如既往的高,通篇看了一下,其实没有什么新的内容,主要就是将高通自2015年第一代AI Engine发布以来到现在,自家骁龙芯片AI性能发展做了回顾,同时面向现在生成式AI潮流,芯片能力所做的强力适配布局做了讲解。
但我觉得最重要的是,阿通终于找到一个好机会,对自家AI Engine为什么要从一开始就做异构计算架构的选择做了非常详细的解释——还记得几年前的NPU之争么?所以,这条微博我就通过自己的理解,简单解读一下这份白皮书,就当是知识吧。
Ziad说,之所以从一开始做AI Engine(骁龙820)就采用异构计算方案,就是考虑到不同的处理器的特性不同。当前,高通AI Engine中包含应对不同AI运算任务的组件,包括CPU、GPU、NPU(神经网络处理器)以及高通传感器中枢(Sensing Hub)等。
不同的处理模块在任务处理时所擅长的方向不同。
---------
CPU擅长顺序控制和即时性,非常适用于需要低时延的应用场景,因此阿通会在对时延要求非常高的用例使用CPU来运算。同时C,PU也适用于相对较小的传统模型,如卷积神经网络模型(CNN),或一些特定的大语言模型(LLM)。
GPU主要擅长面向高精度格式的并行处理,32/16位浮点,8位整数等,比如对画质要求非常高的图像以及视频处理。
NPU擅长标量(Scalar)、向量(Vector)和张量(Tensor)计算,这三种加速器都集成在骁龙Hexagon DSP当中,而这其中对应AI计算的主要就是Tensor加速器。
值得一提的是,Tensor加速器是2018年推出的骁龙855上才加入Hexagon 690的,那个时候正是NPU有无争论最激烈的时候,此时再回看,这一变化的确也是因为AI用例变化带来的。
放在现在最热门的生成式AI用例上,NPU,或者说张量加速器,能够以低功耗实现持续稳定的高峰值性能,特别是面对LLM和LVM这些大模型的时候。
Sensing Hub是2019年阿通在骁龙865上新加入的模块,它的主要作用就是以极低功耗实现长时间稳定的低AI能力,从而让设备拥有情境感知的能力,比如待机状态下注视亮屏,只不过刚出来的时候,它的功耗表现并不好,骁龙旗舰有这样功能的机型并不多。
---------
说完这些处理器模块,再来看一些具体技术细节的变化。
2020年推出的骁龙888虽然口碑不咋地,但在AI运算方面却有非常重大的变化,在它上边,Hexagon DSP将过往分离的向量、标量和张量加速器做了融合,更名为Hexagon NPU,还针对加速器设计了专用共享内存——AI计算对内存速度是有很高要求的。
2022年的骁龙8Gen2处理器又做了非常重要的一个升级,为AI计算部分做了专属供电,不需要唤醒其他SoC模块而可以单独运行,于是,Sensing Hub“以极低功耗实现长时间稳定的低AI能力”终于实现,这也带来旗舰旗舰在感知方面的变化。
2023年的骁龙8Gen3在这个基础上进一步升级供电机制,给Hexagon NPU给设计了单独的供电电路,跑AI用例时能耗更低,同时共享内存带宽也增加了一倍,所以我们能看到这代骁龙旗舰比上代在推理AI计算时性能几乎翻倍,但能效却提升了40%。
Sensing Hub也得到了升级,双核架构,性能比上代提升3.5倍,内存增加30%,全天候情境感知能力更强,
只不过,跑现在的LLM和LVM,只有NPU的共享内存跑得快是不够的,我在这篇文章:https://t.cn/A6jjXs1z 中提到过,看起来很先进的LLM在运行时的机制其实很“简单粗暴”:把整个参数库载入内存跑就是了,所以,骁龙8Gen3也支持当前最快的LPDDR5X内存。
---------
白皮书最后,阿通还提到了高通AI软件栈强大的支持能力,这一点我在前文中提前的长文中有所提及,在这里就不多说了。
在白皮书中,还多次提到了阿通非常骄傲的Oryon CPU,根据CPU在AI计算中所体现的能力,它在高通AI Engine异构计算中也会发挥重要的作用。
目前看,搭载骁龙X Elite的AI PC终端要在年中陆续问世,到时候它能驱动端侧AI有何等应用是很值得期待的,另外就是骁龙8Gen3用上了Oryon CPU,整个SoC的AI能力又会有何等提升呢?
#小逸看新片# |#特技狂人确认引进#《芭比》男主X《奥本海默》女主新片来了[哇],瑞恩·高斯林和艾米丽·布朗特主演的动作惊悚片《特技狂人》宣布确认引进中国内地。具体档期待定,北美为5.3上映[鼓掌]。《疾速追杀》《死侍2》导演大卫·雷奇执导,亚伦·泰勒-约翰逊、许玮伦、温斯顿·杜克、汉娜·沃丁厄姆、泰莉莎·帕尔默等也出演。
在选车、购车过程中了,在框定了、认准了零跑C10之后,零居不免对于车型的选择陷入迷茫,不知道哪一款更为适合自己。
有这方面困扰的零居,不妨看过来!
首先,我们来看看零跑C10全系标配的配置:
全新C11所有版型在机械基础性配置上是全系标配的,比如电子电气四叶草架构,高通骁龙8295P芯片、算力领先同级车型7倍 ;2.5K超高清悬浮矩阵式三屏、中央14.6英寸悬浮大屏 ,清晰度高于现有手机平板绝大多数机型;标配豪车级前双叉臂后五连杆独立悬架,纯电更有FSD可变阻尼减振,彻底解决底盘感觉众口难调问题;音响方面,标配12扬声器+专业级数字DSP功放,即使发烧友也能满足;在智驾方面,也给到了标ACC全速自适应巡航 ,LCC车道居中辅助 ,自动泊车可以说入门即智能。
从零跑C11的配置来看,零跑特意给予了其豪华属性,入门款配置给得也毫不小气,真是入门即豪华!
下面来看看尊享版独有的配置
主要增加了座椅加热、通风,前排双层静音玻璃、后排隐私玻璃、电动后尾门等舒适和隐私性配置。
智驾版
当然是给到了智驾的完全体,增加了激光雷达和Orin X超级计算平台,可以体验到NAP等高阶智驾功能,搭载30个智能驾驶核心硬件,可实现24项智驾功能,比前两个版本多9个硬件、6项智能化功能。
另外,还有尊享版和智驾版的四驱版本,对于动力有特别要求的零居可以选择,特别是应对冬季雨雪天气很有效。
最后,
全新C11针对不同需求的零居给到了差异化配置,每个版本性价比在20以内价格都是天花板的存在,真正是物超所值。
总的来说,
预算有限,追求极致性价比的零居,可以选择尊享版,给到了23款零跑C11所有配置,并且在中控屏、可变阻尼底盘、高通芯片等关键配置进行了升级。
如果在意座椅通风加热和静音隐私方面,可以上尊享版,毕竟也没多多少钱,如果后期加装的话,花费要多很多!
如果想要体验未来L3级别的辅助驾驶,让自己不就遗憾,就上智驾版本,未来各种OTA都能体验到完整形态!
四驱和增程与纯电的选择,就不赘述了,相信大家都有自己的判断,选择起来不那么困难。
有这方面困扰的零居,不妨看过来!
首先,我们来看看零跑C10全系标配的配置:
全新C11所有版型在机械基础性配置上是全系标配的,比如电子电气四叶草架构,高通骁龙8295P芯片、算力领先同级车型7倍 ;2.5K超高清悬浮矩阵式三屏、中央14.6英寸悬浮大屏 ,清晰度高于现有手机平板绝大多数机型;标配豪车级前双叉臂后五连杆独立悬架,纯电更有FSD可变阻尼减振,彻底解决底盘感觉众口难调问题;音响方面,标配12扬声器+专业级数字DSP功放,即使发烧友也能满足;在智驾方面,也给到了标ACC全速自适应巡航 ,LCC车道居中辅助 ,自动泊车可以说入门即智能。
从零跑C11的配置来看,零跑特意给予了其豪华属性,入门款配置给得也毫不小气,真是入门即豪华!
下面来看看尊享版独有的配置
主要增加了座椅加热、通风,前排双层静音玻璃、后排隐私玻璃、电动后尾门等舒适和隐私性配置。
智驾版
当然是给到了智驾的完全体,增加了激光雷达和Orin X超级计算平台,可以体验到NAP等高阶智驾功能,搭载30个智能驾驶核心硬件,可实现24项智驾功能,比前两个版本多9个硬件、6项智能化功能。
另外,还有尊享版和智驾版的四驱版本,对于动力有特别要求的零居可以选择,特别是应对冬季雨雪天气很有效。
最后,
全新C11针对不同需求的零居给到了差异化配置,每个版本性价比在20以内价格都是天花板的存在,真正是物超所值。
总的来说,
预算有限,追求极致性价比的零居,可以选择尊享版,给到了23款零跑C11所有配置,并且在中控屏、可变阻尼底盘、高通芯片等关键配置进行了升级。
如果在意座椅通风加热和静音隐私方面,可以上尊享版,毕竟也没多多少钱,如果后期加装的话,花费要多很多!
如果想要体验未来L3级别的辅助驾驶,让自己不就遗憾,就上智驾版本,未来各种OTA都能体验到完整形态!
四驱和增程与纯电的选择,就不赘述了,相信大家都有自己的判断,选择起来不那么困难。
✋热门推荐