#香山调试直播# 香山芯片调试目标完成!

记录一些流水账:

2021年6月22日,香山在RISC-V中国峰会上第一次亮相,这是当时公开的国际上性能最高的开源RISC-V处理器核设计,受到国内外的很多关注,如今在GitHub上已有近2500个Star,250多个Fork。虽然我们的报告是中文的,但却有不少英文报道,甚至还有来自俄罗斯的关注。可以说,香山成为国际上最受关注的开源芯片项目之一。

2021年7月15日,第一代香山“雁栖湖”流片。但接下来由于受到全球芯片产能影响,我们不得不经历漫长的等待期。因为许久没有回片后的消息,有一些关注香山的朋友发来小心翼翼的询问:“香山是不是流片失败了?”流片失败,就是指香山无法点亮,也就意味着它就是一块石头。

2022年1月20日,等待了整整半年,香山终于回片了。硬件调试存在很大不确定性,很可能1个bug就会需要耗上1-2个月才能解决。而硬件问题解决不了,软件调试就会受到影响。尽早发现硬件问题,此时的香山就如同刚从医院拿回来的一份尚未打开的检查报告——面对它心中充满忐忑,不知道结果是好是坏。如果要等春节假期结束后才能看报告,这个年我们会过得心里很不踏实。另外,还存在一个不确定性,就是疫情防控。前段时间北京出现疫情,导致不少同学无法回家。但另一方面,由于冬奥会、两会等一系列活动,如果其他地方出现疫情,也可能导致离京后一段时间内甚至整个2月不能返京,那就会再空耗一个月。

我们希望能尽早消除一些不确定性,否则过年心里也不踏实。时间,对于香山调试非常宝贵。于是,香山团队的多位小伙伴(徐易难、李作骏、王诲喆、勾凌睿、张紫飞、蔺嘉炜、李乾若、甄好)决定留在北京攻关调试,加上唐丹和我,组成了一支攻关调试小分队。其中有几位是因为老家疫情而留在了北京,也有本来就是北京人,除了这些这些线下的小伙伴,还有全国各地的老师和同学一起在线参与。

1月26日开始,采用香山枫叶红底色的主板陆续从深圳寄到北京。此前,1月22-24日,深圳团队的蔡晔老师、刘彤、何伟等已经在深圳焊好主板,完成了初步的调试,包括系统时钟、串口、Flash等,验证IO通路正确。

1月29日,调试攻坚战正式打响了。调试过程一开始出乎意料地顺利,虽然有些小曲折,但都很快解决。到1月30日,我们取得了不错的战果:
•CPU频率从24MHz切到1GHz;
•DDR4-2400初始化成功,并稳定运行;
•Linux正常启动进入Shell;
•CoreMark成功运行,5.3分,与仿真完全一致。

1月30日晚上,收到了中国科学院大学公共管理学院刘继安老师的消息,是她和博士后徐艳茹希望观摩香山调试。晚上9点,徐博士先来到了调试现场,拍了几张照片,然后便跟我们说,她春节也不能回去过年,希望能全程观摩香山的调试过程。我们觉得应该很快就可以结束调试了,便欣然答应。但任何事情都不要高兴太早!

1月31日,大年夜。就在我们认为可以“牛年事、牛年毕”,可以在牛年就能跑出SPEC CPU2006分值、初步完成调目标时,现实狠狠地打了我们的脸——在运行SPEC CPU2006时,DDR4-2400稳定性存在问题,会导致返回数据出现随机错误。DDR是芯片调试过程最麻烦的问题,看来我们终究还是要面对。

我们分头吃年夜饭。下午2点,唐丹老师回家和家人一起吃了顿年夜饭;下午4:30,唐老师又过来和我们一起吃了一顿年夜饭,然后回到调试作战室放松:春晚,PS5,瓜子……晚上7点,我再回家和家人又吃了一顿年夜饭。一个难忘的大年夜!

大年初一到初三,大家休息了三天。

初四,重新整装上阵。内存专家李作骏全力攻占DDR稳定性问题,其他人全力配合。全志D1-H项目负责人孙彦邦提到当时在全志时DDR调试也是难点,他推荐了在Linux下的memtester来测试内存。

初五,徐易难很快便在Linux下编译好memtester,并开始测试。初步测试访存确实不稳定,内存在作Bit Flipping时会出现8KB数据不正确。于是开始尝试修改CPU频率,1GHz提高到1.1GHz,1.26GHz,但都不稳定;那就给CPU降频,降到800MHz、600MHz,似乎访存稳定性好一些,但还是会随机出错。

唐丹老师查看DDR PHY手册,发现PHY和DIMM的VRef配置不同步,修改后稳定性得到改善,但memtester还是会出现随机访存出错,只是出现概率降低了。但是,哪怕概率再低,也不可接受——对于理论上1GHz频率下每秒可运行60亿条指令的香山来说,哪怕是亿分之一的随机出错概率,也意味着每秒会出现几十次访存数据错误,这是不可接受的。我们必须要把访存调稳定。

初六,大家继续尝试——修改DDR Trainimg参数,修改Linux启动时内存容量,改变DDR供电电压……始终无法消除DDR访存的随机出错问题。我们怀疑DDR信号完整性问题,希望看一下DDR信号的眼图。开始一通打电话借设备,我们借到了一台DDR逻辑分析仪。这这台设备和HMTT很像,也是插在DIMM槽,但它内部提供高频采样时钟,可以直接抓DDR访存数据信号。我们花了半天的时间研究如何使用,当搞清楚后,发现在DDR-2400配置下采不到预想的信号。晚上9点多,打电话给设备代理商,被告知这台设备采购时没有选支持2400的模块,现在还支持DDR-1600。燃起的希望又熄灭了。

初七,唐丹老师又开始打一轮电话,又向郝沁汾老师借来一台示波器。有人建议看一下电源是否稳定,波动幅度是否太大,可以换一下精密电源。唐老师、徐易难立刻开始测试电源稳定性,发现真的会出现上下60-80mV的波动。那时,看到这个几十毫伏的波动,似乎大家心里涌出一丝欣喜,希望这就是DDR访存不稳定的问题所在。唐丹马不停蹄地区采购精密电源,不幸的是在换电源后,我们使用最多、相对最稳定的一块板卡“牺牲”了——烧了!来不及难过,立刻又切换到另一块板卡开始测试起来。结果有点沮丧,换了精密电源后依然无法消除访存随机性问题。

李作骏通过对DDR信号进行仿真,发现DDR DQS信号的ODT参数设置存在问题,同时把所有的访存性能相关的参数调到最保守设置。大家又寄希望于这次DDR参数修改。

此时,于是另一条调试网卡的战线开始启动,由王诲喆担任主攻手:测试网卡时钟信号、调整GMAC频率,设置设备树,修改驱动——网卡很快就被识别出来了,能看到网卡能收包了,但是问题是不能发包。

初八,跑了一个晚上的memtester,连续运行了12个小时,只有一个访存出错。这次稳定性得到了极大的提高,但还没有彻底解决,运行SPEC CPU依然出错。这时,大家决定尝试一下将DDR降频到1600。DDR-1600配置下,李作骏又对DDR Training做了优化,调高了Refresh Burst数量,激动人心的时刻发生了——之前跑不过的SPEC CPU应用都能跑完了!DDR访存稳定性问题终于解决了!

从初八开始,勾凌睿便开始用SPEC CPU2006程序烤机,香山频率设置为1GHz,DDR设置为1600,连续几十个小时的运行,再也没有出现过错误了。当然,这并不是最终目标,我们知道DDR访存性能对整个香山芯片的性能至关重要,接下来我们还继续优化DDR性能。

另一条战线,王诲喆仍然在调试网卡。在香山上用tcpdump能看到从另一台机器发过来的网络包,对比发送端的wireshark,内容正确。但是发送始终存在问题,ping依然不通。

初九,跑了一天的SPEC CPU,再也没有出错了,大家开始期待香山的SPEC CPU 2006分值了。网卡调试那边,手动修改了mac地址后,香山能收到ping,但是发送依然有问题。

初十,在修复了一个串口驱动小问题后,终于得到SPEC CPU 2006分值了,香山在1GHz频率、DDR-1600配置下,分值为5.97。这个数字对于香山来说,是一个里程碑。但我们知道,这并不是香山的真实性能,因为这是把DDR-2400降频为DDR-1600后得到的结果,从数据来看,很多访存密集型应用性能受到了很大的影响。如果把DDR进一步优化,香山性能还将进一步提升。我们根据Roofline模型推演访存性能优化目标。

正月十二,王诲喆也终于将网卡调通,香山功能基本完备。有了网络,大家就可以远程访问香山了。

正月十五,李作骏对DDR-1600时序进行了初步优化,之前受DDR访存的应用性能得到了大幅提升,比如bzip2-liberty的运行时间从483s降到了265s。这也意味着SPEC CPU2006分值即使在DDR降频的情况下还可以有很大的提升。

至此,历时近3个星期的香山攻关调试取得了圆满成功。香山调试直播完毕。

衷心感谢所有关注和支持香山的朋友!后续我们仍然会向大家介绍香山后续的性能优化进展。

—————

图1:调试攻关任务清单完成!
图2:与DDR访存稳定性战斗
图3:稳定运行SPEC CPU2006程序
图4:网卡正常工作
图5:SPECCPU 2006分值与对应配置
图6:Roofline模型推演访存性能优化目标
图7-9:香山调试现场

骁龙8Gen1还会翻车吗?对不起,答案可能让你失望了!#v派狂欢##骁龙8gen1#

骁龙8 Gen 1还会不会翻车?

为什么数码圈都认为,骁龙888是翻车的一代?这个问题,估计很多人都没弄明白。

如果不能充分理解骁龙888,就无法预测骁龙8 Gen 1这颗芯片存在的意义。所以,说清楚骁龙888的优缺点,还是很有必要的。骁龙888的综合表现,可以总结成2点。

首先,只有性能降到比骁龙865还低的时候,功耗才有5nm芯片的水平。从图里可以发现,当骁龙888的FPS只有172.67时,代表能效的数字是63.74,毫无疑问达到了A14的水平。

但是当频率提高时,骁龙888的功耗就会以指数级提升,妥妥的一代火龙。在同等性能的情况下,骁龙888的能效,远不如超频后的骁龙865。

重点是,智能手机和电脑不一样,它讲究的是便携小巧,机身内部空间相当狭小,而且没有外置散热设备,所以对芯片功耗非常敏感。骁龙888的这两个特性,正是它被认为是“翻车”的关键依据。

骁龙888的高频功耗翻车问题,大部分原因都是三星5nm工艺不够先进造成的。那么,继续采用三星4nm工艺(5nm增强版)的骁龙 8 Gen 1,还会翻车吗?这个问题,也正是数码发烧友关心的重点。

目前,手机厂商已经拿到了骁龙8 Gen 1的测试样片,首批测试结果已经提前出炉,带来了1个好消息,2个坏消息,大概率要让你失望了。

2,GPU性能提升30%

好消息是,骁龙8 Gen 1采用了全新的GPU架构,以至于在三星4nm工艺下还有不错的提升。按照官方说法,相对骁龙888,骁龙8 Gen 1的GPU性能提升了30%,或者能效比提升25%。不过需要注意一点,这两点不是同时实现的,而是“二选一”。

换句话来说,和骁龙888对比,骁龙8 Gen 1就算达到了更高的GPU性能,但是功耗很可能会继续提高。原因很简单,能效的提升,没有盖过性能的提升。考虑到骁龙888的现状,我认为骁龙8 Gen 1机型很可能也要适当降低功耗,来保护消费者体验。

2,GPU能效接近骁龙870

坏消息是,根据数码博主肥威较为隐晦的说法,骁龙8 Gen 1的GPU能效提升“巨大”,甚至比骁龙870还要高,但是还达不到骁龙865的水平。从这个角度来看,骁龙8 Gen 1不像骁龙888不一样,连超频后的骁龙865都打不过。

说实话,骁龙8 Gen 1取得这样的成绩并不意外。根据公开资料的数据,这一次三星4nm工艺的密度理论上只有145.8MTr/mm2,相对之前的三星5nm工艺提升非常有限,只是比台积电7nm高一点。而台积电的第一代5nm工艺,密度是171.3MTr/mm2,差距相对很明显。

3,可能会被天玑9000取代

还有一个最大的坏消息:在高端市场,骁龙8 Gen 1很可能会被天玑9000取代。数码闲聊站已经透露,2022年的“真机皇”很可能会首次搭载天玑9000。原因很简单:在业内来看,天玑9000的综合实力要比骁龙8 Gen 1强。

毕竟一个是三星4nm,一个是台积电4nm,安兔兔跑分都差不多。大家都在用脚投票。不仅如此,我还扒了一下两颗芯片的细节差异,结果让我感到很意外。天玑9000比骁龙8 Gen 1强的点,不光是工艺制程,在堆料上也明显更有诚意。我特地把天玑9000领先的方面,列为表格。

可以看出,天玑9000的堆料更猛,CPU大核心频率更高(台积电4nm红利),系统缓存、L3缓存也更高。甚至内存规格还实现了弯道超车,天玑1200只支持LPDDR4X,但是天玑9000直接升级到了支持LPDDR5X,反观骁龙8 Gen 1还在原地踏步。

最后的总结

总而言之,从这3个消息来看,骁龙8 Gen 1要让你失望了,它大概率会被天玑9000取而代之。真正值得期待的,是2022年下半年才量产的台积电4nm版本。

个人建议,如果你有机会在天玑9000和骁龙8 Gen 1之间二选一,更推荐选择天玑9000。等到高通重新拥抱台积电,再入手骁龙8系旗舰芯片也不迟。骁龙870虽然过时了,但是再撑个一年半载的不是问题。对此你怎么看,欢迎一起讨论。

#林志炫披荆斩棘的哥哥#舞台越来越差,非常赞同。实际上这节目最好看的就是0公(初次见面演唱会),和浪姐一样,证明了这些成熟的艺人有自己的特色,火起来有原因,就不适合搞团,自己独自美丽最好。浪姐二太糊没印象了,浪姐一,最好看的舞台热度最高的,就是开始个人秀考核和复活抢位战1v1v1,都是solo。

然后披哥其实,一二公还是不错的,总体质量可以还有几个精品舞台。当然我个人觉得某种方面证明某团雾实力很能打,他走了以后那个团队没再有过精品,但其实也不能完全说因为他。最主要还是因为二公,开始淘汰了!

一公虽然名义上有淘汰的可能但就像海泉说的这个阶段,又是这种名为比赛实质一有剧本的真人秀节目大家都是成名的艺人怎么都不会让人走,总要做点什么表现下义气之类的。但二公结束就有人真的离开了。当然这不是因为真的在乎什么最终成团位,都第三次了谁还不知道成团即解散这个梗,切。但大家还是尽量想留下的因为留下来才能有更多表现,不管舞台表现还是真人秀综艺part表现人设混脸熟,总之要留下来才能尽可能吃到节目红利才能有曝光率关注度(哪怕是被骂也比没有关注度好,黑红也是红)。

当然有些人气高的哥哥也许不在乎,反正知道自己再拉也不会淘汰,还有少部分人也许是真的不大care输赢淘汰,但是也得被迫一起卷,因为这是政治正确。因为如果团队分数不够总有人要淘汰,你不淘汰也会有队友淘汰,甭管这分数规则和不合理变来变去评分的人有没有专业度反正,观众都盯着的节目,你总得起码装的在乎输赢,起码得表现出基本的我不想我们任何一个人走所以一定要赢!的基本人设吧。从这个角度来看林志炫是真的很real了,他其实从头到尾就想做出自己觉得艺术性最好的舞台。我得划重点我说的是他自己觉得的,他的审美不一定就是最好的,我其实是觉得还行但有点单一,但是这就是他的个人风格。但起码他出发点就是想做高质量的舞台,不管他实际上有没有达到目标。我的意思是大多数人二公以后的目标已经变成了我要做最能让现场观众给我投票的舞台了。

在这种情况下大家练是练得越来越多越拼命了,但是最终舞台质量却越来越下滑。一个是你不能很纯粹的就想做一纯粹艺术考量的作品而是要想方设法讨好现场打分的观众,要炸,要卖情怀,作品设计围绕着如何得分而不是如何做得质量更好的目的。其次因为大家都想要有点表现,一个你没表现就不会得到观众个人投票一个是你哪怕马上要淘汰也得在淘汰前有点表现才不亏对吧那么大家都得分猪肉分part 要平均。哪怕心里想着自己想要多点part但这知道观众放大镜看着的镜头下也得尽量平均分才不至于招骂。

实际上最终这种分法如果大家实力不均衡或者风格不协调又没有一个巧妙的编曲编排,最终成品支离破碎充满割裂感违和感,即使有几个惊艳的个人part,但整体还是个怎么说,呃上等山珍海味食材丢一锅乱炖还做糊了的菜,食之无味弃之可惜。有些曲目比如经典的see you again 还得多加一条,不但成员互相之间风格不契合,成员们和曲目本身就不契合,因为为了赢战略性以选代ban不让对面拿他们会出彩的歌。不能说他们错吧毕竟按照规则来的他们就想要赢,但是反正作为观众一想到明明可以用作成两盘八十分的菜结果两个厨子各自做了自己不擅长的菜系结果做成了两盘勉强可以扒拉几口的四不像,实在是难受如鲠在喉。

二公之前的舞台基本上没那么割裂感严重的,而几个至今记得的舞台基本都出自一二公,而他们一个特点就是作品完整性非常好,比如yellow,悟空,你要如何我就如何还有大湾区大多数的舞台基本上都不差,因为本质上大湾区这群人就是风格接近大家也很熟合作起来也很舒适,连团队磨合过程都直接省了。雾那个初始团队也很默契因为3/4专业音乐人大家属性一致想法容易沟通协调,虽然风格还是有点差异。那时最差的团队是欧阳靖的队伍他们组其实实力都不算差的,虽然人气不行,但你人气不行舞台质量可以的话电视观众还会给你抱不平不是挺好的舞台嘛现场观众小龙虾。但他们几个人风格差距较大队长欧阳靖也没什么协调能力和舞台编排能力,直接就老天自有安排,这就没办法了。

Anyway跑远了,三公开始基本上舞台就开始质量下滑严重,因为想要赢怕淘汰,考虑什么能炸比考虑什么才是好作品更重要。再一个是五公小组继续合并越来越大人越来越多,一个简单的逻辑:人越多越难协调,分猪肉(bushi) 哦分part也越来越要考虑平均,整体性越容易割裂,虽然当然会给你三个曲目安排人但要把每个人都安排妥当去合适的曲目和风格接近的人合作并不容易。所以五公和成团夜比三四公整体更下滑(当然也有个别还不错的表演,说的是整体,而且比如你说电影人出彩他是建立在把顶配最适合人放在这个曲目牺牲另两个曲目适配人员尤其see you again 就摆明了选剩下的不适合另两个曲目的自动踢过去)。#披荆斩棘的哥哥#


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 震惊 | 还敢吃吗!2块钱一根的烤肠,里面竟是这种肉?
  • 利好丨不只是国内长途漫游费,近期这些收费都要取消
  • 印度制造溃不成军!小米或超三星成印度第一大品牌
  • 南非世界杯球场发生踩踏事故,导致两人死亡数人受伤
  • 19人身亡案宣判,只因一句话脑升邪念疯狂残杀父母及村民,被当庭判死!
  • 建军90周年阅兵,军工板块迎事件催化
  • 比抄家还狠!以房养老骗局!700万的房子被1000元贱卖…
  • 贴吧女团出道带你突破次元壁,献礼ChinaJoy15周年《小次元》MV曝光
  • 骑车忘锁欠两千万!!!“有图有真相”
  • 惊!日警方在旅馆发现中国失踪女教师告别信!
  • 台山仔懵盛盛做水鱼还作执到宝,恶抵你
  • 关注别人的前半生,不如过好自己的后半生
  • 一只紫色河马被谋杀,室友汪星人被指控嫌疑最大!
  • 这就是马斯克想造的那辆车:特斯拉Model 3最详细试驾体验
  • 属羊的人真的命苦吗?
  • 人人网原负责人被捕!“天才少年”为何变成赌博“校长”?
  • 趋势丨多地明确“租房可落户”!你还会抢着买房吗?
  • 阅兵马上开始!今日阅兵,为何选择朱日和?
  • 卖拍黄瓜被罚1万!
  • 楼市欠下巨款,老赖整容成"少女"躲债,法警都惊呆了...