春游野山火锅约会⛰,‍♂️身边是梯田零星树与小溪和放牛,太阳下有伞有椅子吹着风☀️⛱,柴火鸡美食与酒,最重要是有麗兒一起分享这一瞬间,放松甜蜜开心ヾ(●゜ⅴ゜)ノ
(p.s:从乡道上乱停车走到这也要7、8分钟⌚,居然把夜宵大伞和铁锅柴火扛到这一独小片草原上,正宗柴火鸡,太好吃啦✨,我和麗兒已经吃啦两碗凉糕凉粉凉面,上来又吃啦两碗柴火鸡先行配料小圆洋芋,等主角柴火鸡上啦我们已经很饱感觉吃不下啦,结果尝了一小口实在太好吃啦根本停不下来又一人撑了一碗✨….太好吃啦光顾着吃都没拍吃的)

每晚上只有娃睡了后的时间才是属于自己的,然后开心玩个半个小时一个小时。娃就又要吃奶了[允悲][允悲]每天睡眠都不够,又不想睡,就想放松放松。每天都是一边崩溃一边治愈。今天出月子,第一件事就是让小尹带我出去消费,然后衣服尺码成功从S升级为L,然后整个人感觉都很壮实[裂开][裂开]这就很老母亲啦

#香山调试直播# 香山芯片调试目标完成!

记录一些流水账:

2021年6月22日,香山在RISC-V中国峰会上第一次亮相,这是当时公开的国际上性能最高的开源RISC-V处理器核设计,受到国内外的很多关注,如今在GitHub上已有近2500个Star,250多个Fork。虽然我们的报告是中文的,但却有不少英文报道,甚至还有来自俄罗斯的关注。可以说,香山成为国际上最受关注的开源芯片项目之一。

2021年7月15日,第一代香山“雁栖湖”流片。但接下来由于受到全球芯片产能影响,我们不得不经历漫长的等待期。因为许久没有回片后的消息,有一些关注香山的朋友发来小心翼翼的询问:“香山是不是流片失败了?”流片失败,就是指香山无法点亮,也就意味着它就是一块石头。

2022年1月20日,等待了整整半年,香山终于回片了。硬件调试存在很大不确定性,很可能1个bug就会需要耗上1-2个月才能解决。而硬件问题解决不了,软件调试就会受到影响。尽早发现硬件问题,此时的香山就如同刚从医院拿回来的一份尚未打开的检查报告——面对它心中充满忐忑,不知道结果是好是坏。如果要等春节假期结束后才能看报告,这个年我们会过得心里很不踏实。另外,还存在一个不确定性,就是疫情防控。前段时间北京出现疫情,导致不少同学无法回家。但另一方面,由于冬奥会、两会等一系列活动,如果其他地方出现疫情,也可能导致离京后一段时间内甚至整个2月不能返京,那就会再空耗一个月。

我们希望能尽早消除一些不确定性,否则过年心里也不踏实。时间,对于香山调试非常宝贵。于是,香山团队的多位小伙伴(徐易难、李作骏、王诲喆、勾凌睿、张紫飞、蔺嘉炜、李乾若、甄好)决定留在北京攻关调试,加上唐丹和我,组成了一支攻关调试小分队。其中有几位是因为老家疫情而留在了北京,也有本来就是北京人,除了这些这些线下的小伙伴,还有全国各地的老师和同学一起在线参与。

1月26日开始,采用香山枫叶红底色的主板陆续从深圳寄到北京。此前,1月22-24日,深圳团队的蔡晔老师、刘彤、何伟等已经在深圳焊好主板,完成了初步的调试,包括系统时钟、串口、Flash等,验证IO通路正确。

1月29日,调试攻坚战正式打响了。调试过程一开始出乎意料地顺利,虽然有些小曲折,但都很快解决。到1月30日,我们取得了不错的战果:
•CPU频率从24MHz切到1GHz;
•DDR4-2400初始化成功,并稳定运行;
•Linux正常启动进入Shell;
•CoreMark成功运行,5.3分,与仿真完全一致。

1月30日晚上,收到了中国科学院大学公共管理学院刘继安老师的消息,是她和博士后徐艳茹希望观摩香山调试。晚上9点,徐博士先来到了调试现场,拍了几张照片,然后便跟我们说,她春节也不能回去过年,希望能全程观摩香山的调试过程。我们觉得应该很快就可以结束调试了,便欣然答应。但任何事情都不要高兴太早!

1月31日,大年夜。就在我们认为可以“牛年事、牛年毕”,可以在牛年就能跑出SPEC CPU2006分值、初步完成调目标时,现实狠狠地打了我们的脸——在运行SPEC CPU2006时,DDR4-2400稳定性存在问题,会导致返回数据出现随机错误。DDR是芯片调试过程最麻烦的问题,看来我们终究还是要面对。

我们分头吃年夜饭。下午2点,唐丹老师回家和家人一起吃了顿年夜饭;下午4:30,唐老师又过来和我们一起吃了一顿年夜饭,然后回到调试作战室放松:春晚,PS5,瓜子……晚上7点,我再回家和家人又吃了一顿年夜饭。一个难忘的大年夜!

大年初一到初三,大家休息了三天。

初四,重新整装上阵。内存专家李作骏全力攻占DDR稳定性问题,其他人全力配合。全志D1-H项目负责人孙彦邦提到当时在全志时DDR调试也是难点,他推荐了在Linux下的memtester来测试内存。

初五,徐易难很快便在Linux下编译好memtester,并开始测试。初步测试访存确实不稳定,内存在作Bit Flipping时会出现8KB数据不正确。于是开始尝试修改CPU频率,1GHz提高到1.1GHz,1.26GHz,但都不稳定;那就给CPU降频,降到800MHz、600MHz,似乎访存稳定性好一些,但还是会随机出错。

唐丹老师查看DDR PHY手册,发现PHY和DIMM的VRef配置不同步,修改后稳定性得到改善,但memtester还是会出现随机访存出错,只是出现概率降低了。但是,哪怕概率再低,也不可接受——对于理论上1GHz频率下每秒可运行60亿条指令的香山来说,哪怕是亿分之一的随机出错概率,也意味着每秒会出现几十次访存数据错误,这是不可接受的。我们必须要把访存调稳定。

初六,大家继续尝试——修改DDR Trainimg参数,修改Linux启动时内存容量,改变DDR供电电压……始终无法消除DDR访存的随机出错问题。我们怀疑DDR信号完整性问题,希望看一下DDR信号的眼图。开始一通打电话借设备,我们借到了一台DDR逻辑分析仪。这这台设备和HMTT很像,也是插在DIMM槽,但它内部提供高频采样时钟,可以直接抓DDR访存数据信号。我们花了半天的时间研究如何使用,当搞清楚后,发现在DDR-2400配置下采不到预想的信号。晚上9点多,打电话给设备代理商,被告知这台设备采购时没有选支持2400的模块,现在还支持DDR-1600。燃起的希望又熄灭了。

初七,唐丹老师又开始打一轮电话,又向郝沁汾老师借来一台示波器。有人建议看一下电源是否稳定,波动幅度是否太大,可以换一下精密电源。唐老师、徐易难立刻开始测试电源稳定性,发现真的会出现上下60-80mV的波动。那时,看到这个几十毫伏的波动,似乎大家心里涌出一丝欣喜,希望这就是DDR访存不稳定的问题所在。唐丹马不停蹄地区采购精密电源,不幸的是在换电源后,我们使用最多、相对最稳定的一块板卡“牺牲”了——烧了!来不及难过,立刻又切换到另一块板卡开始测试起来。结果有点沮丧,换了精密电源后依然无法消除访存随机性问题。

李作骏通过对DDR信号进行仿真,发现DDR DQS信号的ODT参数设置存在问题,同时把所有的访存性能相关的参数调到最保守设置。大家又寄希望于这次DDR参数修改。

此时,于是另一条调试网卡的战线开始启动,由王诲喆担任主攻手:测试网卡时钟信号、调整GMAC频率,设置设备树,修改驱动——网卡很快就被识别出来了,能看到网卡能收包了,但是问题是不能发包。

初八,跑了一个晚上的memtester,连续运行了12个小时,只有一个访存出错。这次稳定性得到了极大的提高,但还没有彻底解决,运行SPEC CPU依然出错。这时,大家决定尝试一下将DDR降频到1600。DDR-1600配置下,李作骏又对DDR Training做了优化,调高了Refresh Burst数量,激动人心的时刻发生了——之前跑不过的SPEC CPU应用都能跑完了!DDR访存稳定性问题终于解决了!

从初八开始,勾凌睿便开始用SPEC CPU2006程序烤机,香山频率设置为1GHz,DDR设置为1600,连续几十个小时的运行,再也没有出现过错误了。当然,这并不是最终目标,我们知道DDR访存性能对整个香山芯片的性能至关重要,接下来我们还继续优化DDR性能。

另一条战线,王诲喆仍然在调试网卡。在香山上用tcpdump能看到从另一台机器发过来的网络包,对比发送端的wireshark,内容正确。但是发送始终存在问题,ping依然不通。

初九,跑了一天的SPEC CPU,再也没有出错了,大家开始期待香山的SPEC CPU 2006分值了。网卡调试那边,手动修改了mac地址后,香山能收到ping,但是发送依然有问题。

初十,在修复了一个串口驱动小问题后,终于得到SPEC CPU 2006分值了,香山在1GHz频率、DDR-1600配置下,分值为5.97。这个数字对于香山来说,是一个里程碑。但我们知道,这并不是香山的真实性能,因为这是把DDR-2400降频为DDR-1600后得到的结果,从数据来看,很多访存密集型应用性能受到了很大的影响。如果把DDR进一步优化,香山性能还将进一步提升。我们根据Roofline模型推演访存性能优化目标。

正月十二,王诲喆也终于将网卡调通,香山功能基本完备。有了网络,大家就可以远程访问香山了。

正月十五,李作骏对DDR-1600时序进行了初步优化,之前受DDR访存的应用性能得到了大幅提升,比如bzip2-liberty的运行时间从483s降到了265s。这也意味着SPEC CPU2006分值即使在DDR降频的情况下还可以有很大的提升。

至此,历时近3个星期的香山攻关调试取得了圆满成功。香山调试直播完毕。

衷心感谢所有关注和支持香山的朋友!后续我们仍然会向大家介绍香山后续的性能优化进展。

—————

图1:调试攻关任务清单完成!
图2:与DDR访存稳定性战斗
图3:稳定运行SPEC CPU2006程序
图4:网卡正常工作
图5:SPECCPU 2006分值与对应配置
图6:Roofline模型推演访存性能优化目标
图7-9:香山调试现场


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 【森林旅游益处多多,绿色巨伞撑起大市场】炎炎夏日,森林公园、湿地公园、自然保护区成为中外游客休闲避暑、养生度假的目的地。#爱旅行爱摄影##爱生活爱搞笑#uuu8
  • 其实,真正被喜欢的时候,可以不用那么漂亮的,那双眼睛湿润又明亮,好像世上最小的海洋,互相分享日常这件事太美好了,时间的拉扯,总是不想分开,若能一起经历就更好了,
  •  就连孔子听闻孙叔敖这件事后,也不禁感慨: “若然者,其神经乎大山而无介,入乎渊泉而不濡,处卑细而不惫,充满天地,既以与人己愈有。 面对人生的宠辱局,选择随便,
  • 低调,并快乐着[心]人可以真實的活著,但是不要很多事物不是我們所想的那麼美好,時間空間決定不了的,在真實生活裡經歷酸甜苦辣很多意想不到的事情,這人啊,活著最大的
  • 每时每刻每一个人都有选择的自由而每一个选择都决定了生活的方向选择活在三维矩阵之中关注/转发/评判/批判外界的一切新闻、军事、娱乐、政治等活在矩阵幻象之中无法自拔
  • 从技术面上来看,美吉姆(002621)该股在板块的带动下,连续五日上涨!从技术面上来看,美吉姆(002621)该股在板块的带动下,连续五日上涨!
  • 拙,用于对别人称自己的东西:拙笔:谦称自己的文字或书画;拙著、拙作:谦称自己的文章;拙见:谦称自己的见解;拙荆、贱内、内人:称自己的妻子。用于谦称自己或与自己有
  • 这个时候你就不能再去高位股,要远离高位情绪纯筹码情绪博弈上去的股了,同时,看到这个情况,你要想到高低切换,做补涨,那么一个高位龙头的大跌或者某个板块的调整大跌后
  • 白壳2450 2️⃣0️⃣2️⃣1️⃣〈最高品质版本〉欧米茄蝶飞系列,新款上市⌚,为每位男士量身打造,你值得拥有❤️,全自动日☀月星⭐辰,无论是经典隽永的表盘设
  • 午後3時半までに所定の場所に並んで観覧パンダ舎は、抽選なしで観覧ができるようになった初日、大勢の人でにぎわいました。安倍元総理大臣に対する追悼演説をめぐって、自
  •   假如他的为人没有问题,失败只是对他的磨练而已!七个比喻,说透人生(太经典了!人,其实比狼可怕多了,不懂感恩的人,一次次索取,不懂珍惜的人,一次次冷落。
  • 近年来,榆林市深入贯彻落实黄河流域生态保护和高质量发展战略,强力推进黄土高原生态文明示范区建设,山水林田湖草沙系统治理协同发力,“林长制”“河长制”全面推开,入
  • 最后被夸不错了[哇]真的好开心啊!我当时真的超级开心,觉得老师可能觉得词写的太好了!
  • 好吃极了~~下午没目的瞎转悠去几个实体店看了中古,被医森打击得不行,“差这几万块吗我宁愿你去专Gui买得放心”“全店没有一个款好看”。我好想王一博啊, 姐姐想给
  • 其行动轨迹主要涉及以下风险点位:10月28日18:00—20:30,广阳区万达广场三层米村拌饭、一层东更道点心行。开发区防控办联系电话:0316-6070097
  • 被我无视三次之后,终于回应了她,小能豆完整的说出了她准备良久的土味情话——老师这个橘子好甜,可是没有你甜。 闹了一天,疯了一天,也是没作业的一天,她们开心极了
  • 新华制药的基本面可以打0分,在这一点上没有任何对股价的推动作用。新华制药的基本面可以打0分,在这一点上没有任何对股价的推动作用。
  • 詳参:[发烧李专栏] 小心中招 《极致原音V0L.7》另,今天突發異想:將剛作完快篩的試劑瓶蓋(洗淨後)做了再利用,尺寸剛好,或可提供音响朋友作参考。#文文福利
  • 之前办摄影艺术展让人惊叹他的才艺和内涵,还不忘做公益,更让人心生暖流!之前办摄影艺术展让人惊叹他的才艺和内涵,还不忘做公益,更让人心生暖流!
  • 记者在会上了解到,由市政府主办,市人社局、市创促办、市财政局、市科技局、市公安局等部门承办的“第十五届大连市创业就业博览会”将于2月25日至26日在大连世界博览