1953年,美国中情局特工在驻苏联大使馆内意外地发现了一枚窃听器,华盛顿方面惊出一身冷汗,大骂克格勃无耻:“我们竟然被监听了8年之久!”
从美苏建交开始,苏联就一直想方设法地去了解美国驻苏联大使馆的内情。为了获得更多的美国核心机密,斯大林更是责令克格勃要不惜一切代价,动用一切手段进行窃听。
1943年,克格勃不负众望,成功研制出了一种专门针对美国使馆的窃听装置,取名“金唇”。
这种窃听器像一只小蝌蚪一般非常小巧,极易隐藏,既不需要电池,也不需要外来的电流。在工作时一般的反窃听设备根本捕捉不到它的任何信号。
相反,“金唇”则可以接收到300米范围内大耗电量振荡器所发出的微波脉冲,其工作寿命也可以无限延长。从各方面来看,“金唇”都代表了当时世界窃听器的顶尖水平。
但如何将窃听器送进美国大使馆呢?
克格勃首先将微波震荡器以及蓄电池安装在了美国使馆对面的一处居民楼内,然后将那里的居民全部换成了自己人。每逢周末,这些居民楼内的“家庭主妇们”都会在阳台上晾晒地毯和被褥。
就这样,那些依附在被褥上的“蝌蚪”就如同灰尘一般被轻而易举地抖落到了美国使馆的大院内。
虽然窃听器成功地进入了美国使馆,但却只能对部分地方进行监听,根本触摸不到重要信息。
于是,克格勃又生一计,派出了大量的“燕子”(女间谍),她们装扮成苏联芭蕾舞剧院的演员,凭着姣好的容貌轻而易举的便征服了美国外交官。与此同时,负责守卫使馆大楼的士兵也被换成了苏联女兵。
最终,通过汇总“燕子”们在枕边打探到的消息,克格勃探明了一个重要情报:美国大使馆的要害之处位于大楼顶层,包括会议室、武官处、密报室以及大使办公室全部都设在这一层。
美国大使的办公室自然成为了这次窃听计划的首选目标,克格勃头目贝利亚和一众高参们开始绞尽脑汁思考怎样才能将窃听装置送进去。
他们先是精心设计了一场火灾,企图利用灭火让伪装成消防员的特工人员混进美国大使的办公室里。但当火灾警报响起后,那些平日里看似自由散漫的美国人,突然变得高度警惕起来,美国大使更是站在办公室门口“一夫当关”,拒绝任何人进入自己的办公室。
几番周折之后,克格勃又想出了一个将窃听器藏在礼品中送给美国大使的计划。贝利亚专门请来两位苏联的窃听器方面的专家,共同讨论筛选礼品,并对其进行检验。
考虑到电话机和纸篓等办公室常用物品一般都会是反窃听专家的重点检查目标,他们根据“金唇”的特殊性能,最终将这份礼物定为了一枚美国国徽。
木制品十分方便安放窃听器,又不会影响窃听效果,如果不出意外木质的国徽很有可能会一直挂在大使的办公室中。
很快,这枚由技艺精湛的工匠操刀、选用名贵木材的美国国徽就被抬到了贝利亚的面前。但怎么才能找到合适的时机将它送进美国大使的办公室呢?
1945年2月,苏联少先队向在雅尔塔的罗斯福和丘吉尔发出了邀请,希望他们能参加全苏联少先队健身营的开营典礼。
此时,罗斯福和丘吉尔的关注点都在战后利益的分配上,哪有时间去参加这种活动。但面对苏联少先队的邀请,却又不好直接拒绝,委派一般的官员代表自己去参加有些不太合适,事情最终落到了两国大使的身上。
一切都在克格勃的算计之中,这正是他们制定的引诱计划。
典礼是在对美、英大使的致谢声中拉开帷幕的,但随后的活动却让英国大使十分的尴尬,他怀疑苏联人是故意针对自己。开幕式后,苏联少先队员竟然用英语唱起了美国国歌,看着美国同行在孩子们稚嫩的歌声中笑得合不拢嘴,英国大使心中暗自诽腹:“该死的美国佬似乎忘了我们才同属一个阵营!”
更令他忿忿不平的是:歌声结束后,4名苏联少先队员抬着一枚精美绝伦的巨大木质美国国徽走了出来,他们将这枚用名贵紫檀木、黄杨木、红衫木等木材拼装而成的国徽送给了美国大使,却将自己冷落在了一边。
而且美国人还故意发出一声惊呼:“天哪!我简直不敢相信自己的眼睛,我把它放哪儿最合适呢?”一边说还一边得意地瞄着英国大使。英国大使看着美国人那一脸得意的表情,哪里还听不明白这其中的炫耀之意。
一旁陪同的斯大林翻译瓦列里·博列日科夫将这一切都看在了眼里,不失时机地凑在美国大使耳边说:“你把它挂在自己的办公室里,英国人肯定要嫉妒的发疯。”
美国大使在英国人羡慕的目光中接受了礼物,并将它带回了大使馆,果真悬挂在了办公室最醒目的位置。
这枚国徽在美国大使的办公室中一挂就是8年。这期间,办公室先后换了4次主人,但令人惊奇的是,每一位新上任的美国大使都会把办公室里大到壁炉小到墨水瓶的所有物品全部更换一新,但谁也没有动过这枚国徽,直到1953年……
此后的几十年内,美国特工曾多次试图破解“金唇”的技术秘密,想要仿制出同样的窃听器,但却都是不了了之。
最后只能将这枚国徽陈列在中情局的博物馆内,用这段耻辱的历史来警醒自己的特工人员,因为美国中情局在这次事件中完败于苏联克格勃!
#新星v计划#
从美苏建交开始,苏联就一直想方设法地去了解美国驻苏联大使馆的内情。为了获得更多的美国核心机密,斯大林更是责令克格勃要不惜一切代价,动用一切手段进行窃听。
1943年,克格勃不负众望,成功研制出了一种专门针对美国使馆的窃听装置,取名“金唇”。
这种窃听器像一只小蝌蚪一般非常小巧,极易隐藏,既不需要电池,也不需要外来的电流。在工作时一般的反窃听设备根本捕捉不到它的任何信号。
相反,“金唇”则可以接收到300米范围内大耗电量振荡器所发出的微波脉冲,其工作寿命也可以无限延长。从各方面来看,“金唇”都代表了当时世界窃听器的顶尖水平。
但如何将窃听器送进美国大使馆呢?
克格勃首先将微波震荡器以及蓄电池安装在了美国使馆对面的一处居民楼内,然后将那里的居民全部换成了自己人。每逢周末,这些居民楼内的“家庭主妇们”都会在阳台上晾晒地毯和被褥。
就这样,那些依附在被褥上的“蝌蚪”就如同灰尘一般被轻而易举地抖落到了美国使馆的大院内。
虽然窃听器成功地进入了美国使馆,但却只能对部分地方进行监听,根本触摸不到重要信息。
于是,克格勃又生一计,派出了大量的“燕子”(女间谍),她们装扮成苏联芭蕾舞剧院的演员,凭着姣好的容貌轻而易举的便征服了美国外交官。与此同时,负责守卫使馆大楼的士兵也被换成了苏联女兵。
最终,通过汇总“燕子”们在枕边打探到的消息,克格勃探明了一个重要情报:美国大使馆的要害之处位于大楼顶层,包括会议室、武官处、密报室以及大使办公室全部都设在这一层。
美国大使的办公室自然成为了这次窃听计划的首选目标,克格勃头目贝利亚和一众高参们开始绞尽脑汁思考怎样才能将窃听装置送进去。
他们先是精心设计了一场火灾,企图利用灭火让伪装成消防员的特工人员混进美国大使的办公室里。但当火灾警报响起后,那些平日里看似自由散漫的美国人,突然变得高度警惕起来,美国大使更是站在办公室门口“一夫当关”,拒绝任何人进入自己的办公室。
几番周折之后,克格勃又想出了一个将窃听器藏在礼品中送给美国大使的计划。贝利亚专门请来两位苏联的窃听器方面的专家,共同讨论筛选礼品,并对其进行检验。
考虑到电话机和纸篓等办公室常用物品一般都会是反窃听专家的重点检查目标,他们根据“金唇”的特殊性能,最终将这份礼物定为了一枚美国国徽。
木制品十分方便安放窃听器,又不会影响窃听效果,如果不出意外木质的国徽很有可能会一直挂在大使的办公室中。
很快,这枚由技艺精湛的工匠操刀、选用名贵木材的美国国徽就被抬到了贝利亚的面前。但怎么才能找到合适的时机将它送进美国大使的办公室呢?
1945年2月,苏联少先队向在雅尔塔的罗斯福和丘吉尔发出了邀请,希望他们能参加全苏联少先队健身营的开营典礼。
此时,罗斯福和丘吉尔的关注点都在战后利益的分配上,哪有时间去参加这种活动。但面对苏联少先队的邀请,却又不好直接拒绝,委派一般的官员代表自己去参加有些不太合适,事情最终落到了两国大使的身上。
一切都在克格勃的算计之中,这正是他们制定的引诱计划。
典礼是在对美、英大使的致谢声中拉开帷幕的,但随后的活动却让英国大使十分的尴尬,他怀疑苏联人是故意针对自己。开幕式后,苏联少先队员竟然用英语唱起了美国国歌,看着美国同行在孩子们稚嫩的歌声中笑得合不拢嘴,英国大使心中暗自诽腹:“该死的美国佬似乎忘了我们才同属一个阵营!”
更令他忿忿不平的是:歌声结束后,4名苏联少先队员抬着一枚精美绝伦的巨大木质美国国徽走了出来,他们将这枚用名贵紫檀木、黄杨木、红衫木等木材拼装而成的国徽送给了美国大使,却将自己冷落在了一边。
而且美国人还故意发出一声惊呼:“天哪!我简直不敢相信自己的眼睛,我把它放哪儿最合适呢?”一边说还一边得意地瞄着英国大使。英国大使看着美国人那一脸得意的表情,哪里还听不明白这其中的炫耀之意。
一旁陪同的斯大林翻译瓦列里·博列日科夫将这一切都看在了眼里,不失时机地凑在美国大使耳边说:“你把它挂在自己的办公室里,英国人肯定要嫉妒的发疯。”
美国大使在英国人羡慕的目光中接受了礼物,并将它带回了大使馆,果真悬挂在了办公室最醒目的位置。
这枚国徽在美国大使的办公室中一挂就是8年。这期间,办公室先后换了4次主人,但令人惊奇的是,每一位新上任的美国大使都会把办公室里大到壁炉小到墨水瓶的所有物品全部更换一新,但谁也没有动过这枚国徽,直到1953年……
此后的几十年内,美国特工曾多次试图破解“金唇”的技术秘密,想要仿制出同样的窃听器,但却都是不了了之。
最后只能将这枚国徽陈列在中情局的博物馆内,用这段耻辱的历史来警醒自己的特工人员,因为美国中情局在这次事件中完败于苏联克格勃!
#新星v计划#
#香山调试直播# 香山芯片调试目标完成!
记录一些流水账:
2021年6月22日,香山在RISC-V中国峰会上第一次亮相,这是当时公开的国际上性能最高的开源RISC-V处理器核设计,受到国内外的很多关注,如今在GitHub上已有近2500个Star,250多个Fork。虽然我们的报告是中文的,但却有不少英文报道,甚至还有来自俄罗斯的关注。可以说,香山成为国际上最受关注的开源芯片项目之一。
2021年7月15日,第一代香山“雁栖湖”流片。但接下来由于受到全球芯片产能影响,我们不得不经历漫长的等待期。因为许久没有回片后的消息,有一些关注香山的朋友发来小心翼翼的询问:“香山是不是流片失败了?”流片失败,就是指香山无法点亮,也就意味着它就是一块石头。
2022年1月20日,等待了整整半年,香山终于回片了。硬件调试存在很大不确定性,很可能1个bug就会需要耗上1-2个月才能解决。而硬件问题解决不了,软件调试就会受到影响。尽早发现硬件问题,此时的香山就如同刚从医院拿回来的一份尚未打开的检查报告——面对它心中充满忐忑,不知道结果是好是坏。如果要等春节假期结束后才能看报告,这个年我们会过得心里很不踏实。另外,还存在一个不确定性,就是疫情防控。前段时间北京出现疫情,导致不少同学无法回家。但另一方面,由于冬奥会、两会等一系列活动,如果其他地方出现疫情,也可能导致离京后一段时间内甚至整个2月不能返京,那就会再空耗一个月。
我们希望能尽早消除一些不确定性,否则过年心里也不踏实。时间,对于香山调试非常宝贵。于是,香山团队的多位小伙伴(徐易难、李作骏、王诲喆、勾凌睿、张紫飞、蔺嘉炜、李乾若、甄好)决定留在北京攻关调试,加上唐丹和我,组成了一支攻关调试小分队。其中有几位是因为老家疫情而留在了北京,也有本来就是北京人,除了这些这些线下的小伙伴,还有全国各地的老师和同学一起在线参与。
1月26日开始,采用香山枫叶红底色的主板陆续从深圳寄到北京。此前,1月22-24日,深圳团队的蔡晔老师、刘彤、何伟等已经在深圳焊好主板,完成了初步的调试,包括系统时钟、串口、Flash等,验证IO通路正确。
1月29日,调试攻坚战正式打响了。调试过程一开始出乎意料地顺利,虽然有些小曲折,但都很快解决。到1月30日,我们取得了不错的战果:
•CPU频率从24MHz切到1GHz;
•DDR4-2400初始化成功,并稳定运行;
•Linux正常启动进入Shell;
•CoreMark成功运行,5.3分,与仿真完全一致。
1月30日晚上,收到了中国科学院大学公共管理学院刘继安老师的消息,是她和博士后徐艳茹希望观摩香山调试。晚上9点,徐博士先来到了调试现场,拍了几张照片,然后便跟我们说,她春节也不能回去过年,希望能全程观摩香山的调试过程。我们觉得应该很快就可以结束调试了,便欣然答应。但任何事情都不要高兴太早!
1月31日,大年夜。就在我们认为可以“牛年事、牛年毕”,可以在牛年就能跑出SPEC CPU2006分值、初步完成调目标时,现实狠狠地打了我们的脸——在运行SPEC CPU2006时,DDR4-2400稳定性存在问题,会导致返回数据出现随机错误。DDR是芯片调试过程最麻烦的问题,看来我们终究还是要面对。
我们分头吃年夜饭。下午2点,唐丹老师回家和家人一起吃了顿年夜饭;下午4:30,唐老师又过来和我们一起吃了一顿年夜饭,然后回到调试作战室放松:春晚,PS5,瓜子……晚上7点,我再回家和家人又吃了一顿年夜饭。一个难忘的大年夜!
大年初一到初三,大家休息了三天。
初四,重新整装上阵。内存专家李作骏全力攻占DDR稳定性问题,其他人全力配合。全志D1-H项目负责人孙彦邦提到当时在全志时DDR调试也是难点,他推荐了在Linux下的memtester来测试内存。
初五,徐易难很快便在Linux下编译好memtester,并开始测试。初步测试访存确实不稳定,内存在作Bit Flipping时会出现8KB数据不正确。于是开始尝试修改CPU频率,1GHz提高到1.1GHz,1.26GHz,但都不稳定;那就给CPU降频,降到800MHz、600MHz,似乎访存稳定性好一些,但还是会随机出错。
唐丹老师查看DDR PHY手册,发现PHY和DIMM的VRef配置不同步,修改后稳定性得到改善,但memtester还是会出现随机访存出错,只是出现概率降低了。但是,哪怕概率再低,也不可接受——对于理论上1GHz频率下每秒可运行60亿条指令的香山来说,哪怕是亿分之一的随机出错概率,也意味着每秒会出现几十次访存数据错误,这是不可接受的。我们必须要把访存调稳定。
初六,大家继续尝试——修改DDR Trainimg参数,修改Linux启动时内存容量,改变DDR供电电压……始终无法消除DDR访存的随机出错问题。我们怀疑DDR信号完整性问题,希望看一下DDR信号的眼图。开始一通打电话借设备,我们借到了一台DDR逻辑分析仪。这这台设备和HMTT很像,也是插在DIMM槽,但它内部提供高频采样时钟,可以直接抓DDR访存数据信号。我们花了半天的时间研究如何使用,当搞清楚后,发现在DDR-2400配置下采不到预想的信号。晚上9点多,打电话给设备代理商,被告知这台设备采购时没有选支持2400的模块,现在还支持DDR-1600。燃起的希望又熄灭了。
初七,唐丹老师又开始打一轮电话,又向郝沁汾老师借来一台示波器。有人建议看一下电源是否稳定,波动幅度是否太大,可以换一下精密电源。唐老师、徐易难立刻开始测试电源稳定性,发现真的会出现上下60-80mV的波动。那时,看到这个几十毫伏的波动,似乎大家心里涌出一丝欣喜,希望这就是DDR访存不稳定的问题所在。唐丹马不停蹄地区采购精密电源,不幸的是在换电源后,我们使用最多、相对最稳定的一块板卡“牺牲”了——烧了!来不及难过,立刻又切换到另一块板卡开始测试起来。结果有点沮丧,换了精密电源后依然无法消除访存随机性问题。
李作骏通过对DDR信号进行仿真,发现DDR DQS信号的ODT参数设置存在问题,同时把所有的访存性能相关的参数调到最保守设置。大家又寄希望于这次DDR参数修改。
此时,于是另一条调试网卡的战线开始启动,由王诲喆担任主攻手:测试网卡时钟信号、调整GMAC频率,设置设备树,修改驱动——网卡很快就被识别出来了,能看到网卡能收包了,但是问题是不能发包。
初八,跑了一个晚上的memtester,连续运行了12个小时,只有一个访存出错。这次稳定性得到了极大的提高,但还没有彻底解决,运行SPEC CPU依然出错。这时,大家决定尝试一下将DDR降频到1600。DDR-1600配置下,李作骏又对DDR Training做了优化,调高了Refresh Burst数量,激动人心的时刻发生了——之前跑不过的SPEC CPU应用都能跑完了!DDR访存稳定性问题终于解决了!
从初八开始,勾凌睿便开始用SPEC CPU2006程序烤机,香山频率设置为1GHz,DDR设置为1600,连续几十个小时的运行,再也没有出现过错误了。当然,这并不是最终目标,我们知道DDR访存性能对整个香山芯片的性能至关重要,接下来我们还继续优化DDR性能。
另一条战线,王诲喆仍然在调试网卡。在香山上用tcpdump能看到从另一台机器发过来的网络包,对比发送端的wireshark,内容正确。但是发送始终存在问题,ping依然不通。
初九,跑了一天的SPEC CPU,再也没有出错了,大家开始期待香山的SPEC CPU 2006分值了。网卡调试那边,手动修改了mac地址后,香山能收到ping,但是发送依然有问题。
初十,在修复了一个串口驱动小问题后,终于得到SPEC CPU 2006分值了,香山在1GHz频率、DDR-1600配置下,分值为5.97。这个数字对于香山来说,是一个里程碑。但我们知道,这并不是香山的真实性能,因为这是把DDR-2400降频为DDR-1600后得到的结果,从数据来看,很多访存密集型应用性能受到了很大的影响。如果把DDR进一步优化,香山性能还将进一步提升。我们根据Roofline模型推演访存性能优化目标。
正月十二,王诲喆也终于将网卡调通,香山功能基本完备。有了网络,大家就可以远程访问香山了。
正月十五,李作骏对DDR-1600时序进行了初步优化,之前受DDR访存的应用性能得到了大幅提升,比如bzip2-liberty的运行时间从483s降到了265s。这也意味着SPEC CPU2006分值即使在DDR降频的情况下还可以有很大的提升。
至此,历时近3个星期的香山攻关调试取得了圆满成功。香山调试直播完毕。
衷心感谢所有关注和支持香山的朋友!后续我们仍然会向大家介绍香山后续的性能优化进展。
—————
图1:调试攻关任务清单完成!
图2:与DDR访存稳定性战斗
图3:稳定运行SPEC CPU2006程序
图4:网卡正常工作
图5:SPECCPU 2006分值与对应配置
图6:Roofline模型推演访存性能优化目标
图7-9:香山调试现场
记录一些流水账:
2021年6月22日,香山在RISC-V中国峰会上第一次亮相,这是当时公开的国际上性能最高的开源RISC-V处理器核设计,受到国内外的很多关注,如今在GitHub上已有近2500个Star,250多个Fork。虽然我们的报告是中文的,但却有不少英文报道,甚至还有来自俄罗斯的关注。可以说,香山成为国际上最受关注的开源芯片项目之一。
2021年7月15日,第一代香山“雁栖湖”流片。但接下来由于受到全球芯片产能影响,我们不得不经历漫长的等待期。因为许久没有回片后的消息,有一些关注香山的朋友发来小心翼翼的询问:“香山是不是流片失败了?”流片失败,就是指香山无法点亮,也就意味着它就是一块石头。
2022年1月20日,等待了整整半年,香山终于回片了。硬件调试存在很大不确定性,很可能1个bug就会需要耗上1-2个月才能解决。而硬件问题解决不了,软件调试就会受到影响。尽早发现硬件问题,此时的香山就如同刚从医院拿回来的一份尚未打开的检查报告——面对它心中充满忐忑,不知道结果是好是坏。如果要等春节假期结束后才能看报告,这个年我们会过得心里很不踏实。另外,还存在一个不确定性,就是疫情防控。前段时间北京出现疫情,导致不少同学无法回家。但另一方面,由于冬奥会、两会等一系列活动,如果其他地方出现疫情,也可能导致离京后一段时间内甚至整个2月不能返京,那就会再空耗一个月。
我们希望能尽早消除一些不确定性,否则过年心里也不踏实。时间,对于香山调试非常宝贵。于是,香山团队的多位小伙伴(徐易难、李作骏、王诲喆、勾凌睿、张紫飞、蔺嘉炜、李乾若、甄好)决定留在北京攻关调试,加上唐丹和我,组成了一支攻关调试小分队。其中有几位是因为老家疫情而留在了北京,也有本来就是北京人,除了这些这些线下的小伙伴,还有全国各地的老师和同学一起在线参与。
1月26日开始,采用香山枫叶红底色的主板陆续从深圳寄到北京。此前,1月22-24日,深圳团队的蔡晔老师、刘彤、何伟等已经在深圳焊好主板,完成了初步的调试,包括系统时钟、串口、Flash等,验证IO通路正确。
1月29日,调试攻坚战正式打响了。调试过程一开始出乎意料地顺利,虽然有些小曲折,但都很快解决。到1月30日,我们取得了不错的战果:
•CPU频率从24MHz切到1GHz;
•DDR4-2400初始化成功,并稳定运行;
•Linux正常启动进入Shell;
•CoreMark成功运行,5.3分,与仿真完全一致。
1月30日晚上,收到了中国科学院大学公共管理学院刘继安老师的消息,是她和博士后徐艳茹希望观摩香山调试。晚上9点,徐博士先来到了调试现场,拍了几张照片,然后便跟我们说,她春节也不能回去过年,希望能全程观摩香山的调试过程。我们觉得应该很快就可以结束调试了,便欣然答应。但任何事情都不要高兴太早!
1月31日,大年夜。就在我们认为可以“牛年事、牛年毕”,可以在牛年就能跑出SPEC CPU2006分值、初步完成调目标时,现实狠狠地打了我们的脸——在运行SPEC CPU2006时,DDR4-2400稳定性存在问题,会导致返回数据出现随机错误。DDR是芯片调试过程最麻烦的问题,看来我们终究还是要面对。
我们分头吃年夜饭。下午2点,唐丹老师回家和家人一起吃了顿年夜饭;下午4:30,唐老师又过来和我们一起吃了一顿年夜饭,然后回到调试作战室放松:春晚,PS5,瓜子……晚上7点,我再回家和家人又吃了一顿年夜饭。一个难忘的大年夜!
大年初一到初三,大家休息了三天。
初四,重新整装上阵。内存专家李作骏全力攻占DDR稳定性问题,其他人全力配合。全志D1-H项目负责人孙彦邦提到当时在全志时DDR调试也是难点,他推荐了在Linux下的memtester来测试内存。
初五,徐易难很快便在Linux下编译好memtester,并开始测试。初步测试访存确实不稳定,内存在作Bit Flipping时会出现8KB数据不正确。于是开始尝试修改CPU频率,1GHz提高到1.1GHz,1.26GHz,但都不稳定;那就给CPU降频,降到800MHz、600MHz,似乎访存稳定性好一些,但还是会随机出错。
唐丹老师查看DDR PHY手册,发现PHY和DIMM的VRef配置不同步,修改后稳定性得到改善,但memtester还是会出现随机访存出错,只是出现概率降低了。但是,哪怕概率再低,也不可接受——对于理论上1GHz频率下每秒可运行60亿条指令的香山来说,哪怕是亿分之一的随机出错概率,也意味着每秒会出现几十次访存数据错误,这是不可接受的。我们必须要把访存调稳定。
初六,大家继续尝试——修改DDR Trainimg参数,修改Linux启动时内存容量,改变DDR供电电压……始终无法消除DDR访存的随机出错问题。我们怀疑DDR信号完整性问题,希望看一下DDR信号的眼图。开始一通打电话借设备,我们借到了一台DDR逻辑分析仪。这这台设备和HMTT很像,也是插在DIMM槽,但它内部提供高频采样时钟,可以直接抓DDR访存数据信号。我们花了半天的时间研究如何使用,当搞清楚后,发现在DDR-2400配置下采不到预想的信号。晚上9点多,打电话给设备代理商,被告知这台设备采购时没有选支持2400的模块,现在还支持DDR-1600。燃起的希望又熄灭了。
初七,唐丹老师又开始打一轮电话,又向郝沁汾老师借来一台示波器。有人建议看一下电源是否稳定,波动幅度是否太大,可以换一下精密电源。唐老师、徐易难立刻开始测试电源稳定性,发现真的会出现上下60-80mV的波动。那时,看到这个几十毫伏的波动,似乎大家心里涌出一丝欣喜,希望这就是DDR访存不稳定的问题所在。唐丹马不停蹄地区采购精密电源,不幸的是在换电源后,我们使用最多、相对最稳定的一块板卡“牺牲”了——烧了!来不及难过,立刻又切换到另一块板卡开始测试起来。结果有点沮丧,换了精密电源后依然无法消除访存随机性问题。
李作骏通过对DDR信号进行仿真,发现DDR DQS信号的ODT参数设置存在问题,同时把所有的访存性能相关的参数调到最保守设置。大家又寄希望于这次DDR参数修改。
此时,于是另一条调试网卡的战线开始启动,由王诲喆担任主攻手:测试网卡时钟信号、调整GMAC频率,设置设备树,修改驱动——网卡很快就被识别出来了,能看到网卡能收包了,但是问题是不能发包。
初八,跑了一个晚上的memtester,连续运行了12个小时,只有一个访存出错。这次稳定性得到了极大的提高,但还没有彻底解决,运行SPEC CPU依然出错。这时,大家决定尝试一下将DDR降频到1600。DDR-1600配置下,李作骏又对DDR Training做了优化,调高了Refresh Burst数量,激动人心的时刻发生了——之前跑不过的SPEC CPU应用都能跑完了!DDR访存稳定性问题终于解决了!
从初八开始,勾凌睿便开始用SPEC CPU2006程序烤机,香山频率设置为1GHz,DDR设置为1600,连续几十个小时的运行,再也没有出现过错误了。当然,这并不是最终目标,我们知道DDR访存性能对整个香山芯片的性能至关重要,接下来我们还继续优化DDR性能。
另一条战线,王诲喆仍然在调试网卡。在香山上用tcpdump能看到从另一台机器发过来的网络包,对比发送端的wireshark,内容正确。但是发送始终存在问题,ping依然不通。
初九,跑了一天的SPEC CPU,再也没有出错了,大家开始期待香山的SPEC CPU 2006分值了。网卡调试那边,手动修改了mac地址后,香山能收到ping,但是发送依然有问题。
初十,在修复了一个串口驱动小问题后,终于得到SPEC CPU 2006分值了,香山在1GHz频率、DDR-1600配置下,分值为5.97。这个数字对于香山来说,是一个里程碑。但我们知道,这并不是香山的真实性能,因为这是把DDR-2400降频为DDR-1600后得到的结果,从数据来看,很多访存密集型应用性能受到了很大的影响。如果把DDR进一步优化,香山性能还将进一步提升。我们根据Roofline模型推演访存性能优化目标。
正月十二,王诲喆也终于将网卡调通,香山功能基本完备。有了网络,大家就可以远程访问香山了。
正月十五,李作骏对DDR-1600时序进行了初步优化,之前受DDR访存的应用性能得到了大幅提升,比如bzip2-liberty的运行时间从483s降到了265s。这也意味着SPEC CPU2006分值即使在DDR降频的情况下还可以有很大的提升。
至此,历时近3个星期的香山攻关调试取得了圆满成功。香山调试直播完毕。
衷心感谢所有关注和支持香山的朋友!后续我们仍然会向大家介绍香山后续的性能优化进展。
—————
图1:调试攻关任务清单完成!
图2:与DDR访存稳定性战斗
图3:稳定运行SPEC CPU2006程序
图4:网卡正常工作
图5:SPECCPU 2006分值与对应配置
图6:Roofline模型推演访存性能优化目标
图7-9:香山调试现场
【X100 十周年街头霸王挑战赛全场大奖结果公布】富士X100十周年街头霸王挑战赛开启于2021年3月,截止至11月底第三季收官,历时270余日,10万影友热情参与,整体投稿量超过50万份。
经过国际评委团的审慎思考和反复筛选最终评选出:
全场大奖得主 1名
奖品#富士GFX100S# 相机
评委选择奖得主 36名
奖品#富士X-Pro3# 相机
擂主奖得主 40名
奖品#富士X-Pro3# 相机
街头斗士奖得主 9名
奖品#富士X-E4# 相机
完整获奖名单公布:https://t.cn/A6JojSqG
更多影赛信息:
1. 登陆赛事网站 https://t.cn/Ruzdfmc
2. 关注v信号 「富士数码影像」(id:fujifilm-x)
#富士数码相机##富士街霸挑战赛#
经过国际评委团的审慎思考和反复筛选最终评选出:
全场大奖得主 1名
奖品#富士GFX100S# 相机
评委选择奖得主 36名
奖品#富士X-Pro3# 相机
擂主奖得主 40名
奖品#富士X-Pro3# 相机
街头斗士奖得主 9名
奖品#富士X-E4# 相机
完整获奖名单公布:https://t.cn/A6JojSqG
更多影赛信息:
1. 登陆赛事网站 https://t.cn/Ruzdfmc
2. 关注v信号 「富士数码影像」(id:fujifilm-x)
#富士数码相机##富士街霸挑战赛#
✋热门推荐