openai 新出的解释大模型神经元作用的文章: Language models can explain neurons in language models

1、 解释的是 gpt-2 XL 1.5B的模型的神经元的作用
2、 文章的说的神经元是 MLP 结构中的隐层,即 feed forward 结构的 隐层,隐层神经元一般是 d_model 维度的四倍。 所以一共有 0-37 层的 0-6399 个神经元
3、 文章中的 activations 是神经元激活之后那一层的 文本/embedding, 每个词的颜色深浅是(0-10)是代表隐层研究的那个神经元到此 token 的 权重
4、 研究方式:
1)通过训练和推演过程的产生的大量状态提炼出每个神经元和大量在其激活状态下对应的 activations 文本数据库
2)借助 GPT-4 把这些文本例子做 prompt 工程输入,让其"总结"生成一个 "解释" 文本来解释此神经元的作用(借助了GPT4)
3)与上面反向的,让GPT4在上一步假设的 "原因" 下,给 activations 重新打上权重 "深浅不一的绿色"(借助了GPT4)
4) 比较原始 activations 和新的模拟生成的 activations,当然 2 个 activations 文字一模一样的,只是 "绿色" 权重不易。 比较两者相似的,作为那个 "解释" 文本准确度的得分

5、图一:方法步骤,图中研究14层-3822号神经元,根据绿色权重,GPT4猜测这个神经元作用是激活 x by x 或 x after x 这样的结构语法
6、图二:列出了一个 activations 同一个单词,不同层下神经元激活的 "原因", 由GPT4猜测的“解释”和自动聚类
7、图三:neuron-viewer 工具查看 30层第28号神经作用是 “意识到这是个时间字串”, 下面的 activations 例子中,时间字串的确被加重绿色“激活”了
8、链接:可交互的论文地址 和 可交互的 neuron-viewer 在评论

9、 其他随想:
1)gpt 模型 75 % 参数在 MLP 类似结构,所以MLP的神经元大有作用;
2)一个神经元可 weight 注意多个activations 中的 token,是因为 attention 机制的强大编码能力,类似傅里叶变换频域的元素是“函数”,每个单词编码是 “其他所有单词为基的函数”。 是高一阶的编码方式,这种高一阶的方法是 transformer 和 rnn 方法的本质不同。
3)如图1,浅层神经元关注到了 “以K开头的字串”这样的简单意思,深层神经元关注到了“食品相关的”深层语义。 (和卷积神经网络解释相通)
4)openai 在秀自家 gpt4 和prompt工程帮助科研的能力

在心情最糟糕的时候,仍会按时吃饭,早睡早起,自律如昔。-—这样的人才是能扛事的人。人事再乱,打不乱你心。人,不需要有那么多过人之处,能扛事就是才华横溢。

In the worst of times, I eat at the same time, go to bed early, get up early, and be disciplined as ever. -- Such people are able to carry the load. Personnel again chaos, play not chaos your heart. People, do not need to have so many exceptional, can carry things is talented.

#GTOP[超话]#
➽SIDE G

20230510 | via voguetaiwan IG

[#VogueFashionNow 久違被媒體包圍的志龍,弱小、無助、我是誰我在哪?

現在幾乎只為 @ chanelofficial 露臉的G-Dragon,特別出席剛在洛杉磯舉辦的Chanel Cruise 2023/24度假大秀。穿著全身佈滿白色山茶花的黑色夾克,被媒體團團包圍的他,手足無措的樣子實在太可愛,誰能相信眼前這位是超級巨星!

G-Dragon受訪提到,他最喜歡Chanel秀上閃亮多彩的dancing shoes。還沒看秀的你,記得鎖定台灣晚間10點的Chanel大秀影片。]

▶G-DRAGON - ‘Can't Help Falling in Love’ (TCB ⚡️) WB传送门:https://t.cn/A6ajV6Eo

#权志龙chanel全球形象大使#
#香奈儿早春度假系列#

情报:大可 https://t.cn/A6NEp9Cv


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 不是说曾经只有腥风血雨,不是说曾经的美好都喂了狗,只是觉得够了,因为曾经我有了近两年的挣扎,也换来了的对曾经的明辨、对“我”的明确和对未来的明析,我感谢曾经,感
  • ”[尴尬]你让我受尽了一切的最坏走向[挖鼻][挖鼻],超预产期一个多星期,顺转剖,住保温箱[挖鼻][挖鼻],这都是我这两个月一来所坚持不想遇到的事情,结果在一夜
  • 1、张予曦,比起王思聪的其他女友,张予曦的起点高一些,辨识度也高,他是平面模特,现在也是一名演员,不谈演技怎么样,分手后,她利用王思聪带给他的名气,踏踏实实演戏
  • 你说过,让粉丝过好自己的人生,我一直在努力,也曾希望有朝一日能站上全国的舞台向你报喜;你也说过,知世故而不世故,才是最成熟的善良,我默默坚守着这个信念。15年,
  • 岁月的风,所到之处都是有梦的地方!岁月的风,所到之处都是有梦的地方!
  • 我们今天要讲的故事的主角是位实力派演员刘嘉玲,她是一位老牌港星,是娱乐圈里面非常具有代表性的冻龄女星。我们今天要讲的故事的主角是位实力派演员刘嘉玲,她是一位老牌
  • [二哈][二哈][二哈][二哈]开动开动~#自嗨锅[超话]##一方饿霸糖纸来也##单身狗自嗨狂欢节##自嗨式单身##单身狗自嗨##单身狗自嗨狂欢# 湖​池​屋|
  • 《我的父亲(Dad)》是一首包含长大成人后对父亲的感情和想要永远在一起的极简风格的抒情歌曲,D.O.的细腻表现让歌曲的魅力倍增。永远做困难但是正确的事情,关注客
  • 致我亲爱的小孩:很高兴你已经19岁了第一次看见你是在「母になる」那个叫着「お母さん」的小豆丁模样真是可爱极了妈妈特别开心地见证了你这几年的成长尤其今年看见你在「
  • #勇气信念决胜个站[超话]##beyooooonds[超话]#【20210501平井美葉ameba博客搬运】ヒカルについて書いたよ 平井美葉こんばんは〜★彡皆さ
  • 钟嵘说: “曹公古直,甚有悲凉之句。” 鲁迅说: “曹操是‘改革文章的祖师’。” 今天,挑选曹操最经典的4首诗,与大家一起,体会曹公诗中的哲理与深情,感受曹
  • 从最开始的不适,到现在的满身疲惫,到有点期待三年后的自己了,不知道三年后的自己会不会感谢此时此刻的自己所做的选择。这一周或许会是我最为难忘的一周,也是我转变角色
  • 详情戳→#华星卫视新闻##遇见美好##财经# 海南办理这种申请“一趟清”为进一步优化营商环境,推进商事注销便利化改革,实现营业执照和食品经营许可证“证照并销”一
  • 原命局感情婚姻不顺的信息较为明显:月令姻缘宫落空亡,预示此生婚姻具有“成难,维持也难”的特点;日支夫宫坐偏印,应中了命书中“不得良夫”之断语;年时支与日支两丑冲
  • 吃了一天素不但没瘦,反而胖了二两[费解][费解][费解]⚠️减肥不是拒‮食绝‬物而是‮会学‬合理膳食,吃的聪明比不吃重要多了~~在减肥过程中掌握各‮食类‬物的属
  •    山上山下自在体验  大洪山漂流拥有与众不同的特点和优势,它处于国家级风景名胜区大洪山,与大洪山游客服务中心比邻。游客可以在漂流之旅以外,方便快捷地进入大
  • 我走啦[心]南京这七年好开心遇到了上课很难懂但是很有意思的各位双肩包男神老师让我知道想成为怎样的人的标杆学长全世界最最最优秀的MDZZ同居美少女们能歌善舞全能了
  • 我很喜欢自己的身体,虽然有时会觉得它矮了点,但是我也不愿意跟任何人交换。我说:虽然你整个人属于广义上的主流,但并不意味着和你不一样的人就是非主流,我的同龄人没有
  • #白鹿[超话]#| #向全世界安利白鹿# Day7:最想安利白鹿的哪部作品自然是最最最爱的《烈火军校》因为它在我心里是最特别的别的不说它是让我真正入坑的剧,原来
  • #揭阳# #揭阳招聘# #揭阳身边事# #揭阳爆料# #揭阳身边事# 揭阳市揭东区磐东哈轩珠宝行 【人事招聘】薪资4-6K 【玉雕设计师】5-10K 【剪辑摄影