马斯克在最后一刻如约开源了Grok,模型有314B大小,这是第一个如此规模的开源模型。#ai#

国内的公司又能起飞一波了,不过模型没有经过微调,对各家的训练技术也有一定的考验。

模型快速介绍:

基础信息: 模型规模为314B,由8个专家系统组成(其中2个处于活跃状态)。 活跃参数总数达到86B。该模型采用旋转嵌入(Rotary Embeddings)技术#rope,而非传统的固定位置嵌入方式。

这个版本的Grok-1是我们在2023年10月完成预训练阶段时的初始模型版本。

Apache 2.0这一开源许可证下发布这个模型的权重和架构,任何人都可以在该许可证的规则下使用这些资源。

它是一个拥有3140亿参数的混合专家模型,其中在处理每个数据单元(Token)时,大约有25%的模型参数是活跃的,这意味着模型可以更高效地运行。

发布公告:https://t.cn/A6ThG4y8
这个模型是xAI团队使用定制的训练架构,在JAX和Rust的基础上从头开始搭建并训练出的成果。

模型架构介绍:

分词器的词汇量为131,072(与GPT-4相似),即2的17次方。 嵌入向量的大小为6,144(48*128)。
模型包含64层的Transformer结构(这是相当高的层数)。 每层包含一个解码层,由多头注意力模块(Multihead Attention Block)和密集前馈块(Denseblock)构成。 键值对(Key-Value)的大小为128。

在多头注意力模块中: 用于查询的头数为48, 而用于键/值(Key/Value, KV)的头数为8, 其中KV的大小为128。
密集前馈块(Dense Block)的特点包括: 扩展因子为8, 隐藏层的大小为32,768。
每个Token会从8个专家中选出2个进行处理。

旋转位置嵌入(Rotary Positional Embeddings)的大小为6,144,这与模型的输入嵌入尺寸相匹配。

模型可以处理的上下文长度为8,192个Token。 计算精度为bf16。 为了运行整个模型,你可能需要5台H100 GPU。

上周五市场全天探底回升,三大指数均小幅收涨。

盘面上,有色金属携金属回收概念股再度走强,机器人板块10余股涨停,此外,有机硅和飞行汽车概念股午后异动。

指数层面,相比沪指周线录得5连阳,更值得注意的是,盘后证监会接连发布4项政策文件,之前提到过年初的非理性下跌主要是受“外资流出+DMA、雪球等产品的被动卖出”,而节后一方面是北向持续性的买回,同时监管持续查缺补漏,一旦将内外两个篱笆扎牢,后续行情大概率会越来越稳定。

而在市场回归理性后,站在机构视角,历年3、4月会开始将更多注意力放在一季报的潜在方向上。这里引用华创策略的观点,今年有望超预期的方向:部分消费行业&上游资源品。刚好上周盘面上,上半周大消费涨,下半周有色涨,契合了机构的调仓方向。

因此,除了短线题材外,类似去年下半年高股息股的机构主导板块很可能就从这些方向中走出来。

题材上,盘前刚聊到择时,上周五的一进二晋级率便达到了42.42%,仅略低于2月29日的55.56%(10/18),并且上周四和2月28日都是首板家数较少的日子。

而在这批二连板中,涉及的题材包括金属回收(环保)+地产产业链+机器人+药等,考虑到此次机器人的催化是神经网络的突破,因此现阶段仍旧是制造(机器人+飞行汽车)+科技(AI)为主,政策驱动性题材为辅的格局。

最后,近期低价股似乎更受资金偏爱,同样以周五为例,18只连板股中,13只个股在连板前一天的收盘价都是低于10元,此外除ST个股外的55只1元股在周五的平均涨幅为2%,作为对比38只百元股的涨幅则为0.75%。

【龙头板块】机器视觉

OpenAI的大模型被成功移植到Figure01上,使得机器人能够理解场景、区分物体、理解自身行为、预测响应并自我评价。升级的关键在于端到端的大语言-视觉模型,它负责从语言输入到行为输出的全程处理,包括语言交互和动作处理,显著提高了机器人的智能和灵活性。国盛证券刘高畅认为, Figure与OpenAI 合作后的进展速度体现了大模型赋能人形机器人的巨大潜力, 基于业界目前进展,人形机器人产业落地趋势明朗,有望为产业链相关公司打开增长空间。板块内上市公司包括:宏达新材、航宇微等。

#第六届“词风诗雨”汉语言文化大赛·海选赛&开赛日#

汉语言文化大赛的线上海选赛终于开始了!报名成功的同学们积极参与哟[打call]!

一、海选赛平台开放时间:2024年3月18日8:00~22:00

二、两种参赛方式:
1.进入“图管会”微信公众号点击“词风诗雨” 获取参赛链接。

2.关注“词风诗雨”官方赛事公众号输入“三峡大学”获取参赛链接。

图图期待大家能在本次海选比赛中,凭借自己的实力脱颖而出,祝大家好运哦[赢牛奶]。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 我说过,我会从那个地狱里把你拉回去』——步重华靠一句似曾相识的话在小鱼面前瞬间刷出大把好感度,这算不算是一种“前人栽树,后人乘凉”[偷笑]『做没有错的事容易,做
  • 大连活动策划公司,执行团队#大连紫韵创想传媒有限公司# 别让自己心累,应该学着想开,看淡,学着不强求,学着深藏;别让自己心累,适时放松自己,寻找宣泄,给疲惫的心
  • 帆布的歌是真的好暖,虽然就是说一直紧紧围绕情感这个主题,emmm但是真的就是听了对谈恋爱充满向往,无所畏惧了家人们,爱就要爱赵米禾这种零零后的帅弟弟,真的这五官
  • 到底是哪里不一样了,追完沉香如屑,又去看完了琉璃或者是现实中从来就没有这样的人存在的难能可贵还是演技太好了,让人共情,又或者都有琉璃中的十世相守,不管发生了任何
  • ”你不是拒绝老师了吗?你不是拒绝老师了吗?
  • 행복한 토요일이었나?아니..적어도 아침부터 전쟁 같은 총성으로 가득했어.비록 내가 만든 건 아니지만.비록 모든 모순의 시초도 내가 아니야.난 그
  • ”这一句诗是用现在的情移过去的境,为昔日的欢乐景物注入了此时的悲伤心情。这个悲,是今天的悲,是从今天的悲追溯昔日的乐;而反过来,也可以说,正因为想起当时的游乐,
  • 对方辩解肇事学生智力有“问题”但鉴定结果为正常黄某轩的父亲黄先生告诉记者,开庭时他参加了庭审,对警方出具的侦查结果也没意见。记者发现网上曾有人辱骂黄某轩是个“傻
  • #吴露可逃[超话]# #告白吴露三十天# 签到的第39天 告白吴露的第二天❤️(最捶坑底的) 最捶我的应该还是8/18点映礼 一、告白-那段真的让我一直反覆重看
  • ”今天我得知你的离世,我难过,黄太一路走好️3年前我梦见过黄生,梦里面黄生笑的很开心很快乐……好大声地喊我:“啊洪,继续俾心机啊,食多滴野,天气凉着衣服啊。这就
  • #服务老年人# 据悉,该食堂依托云南省民政厅“#老年餐桌幸福食堂#”项目,委托有资质的餐饮机构提供餐饮服务,由个旧市城区办创办,自9月1日试运营以来,始终把好安
  • 这个问题困扰着投资者,请看A股10月指数和行业历史表现,或许能对后市有所启发,助你作出更好的选择。#许凯[超话]##许凯阳华#[布朗熊]#每日一善#[布朗熊]#
  • 只是现在不准备约了[污]遇到自己喜欢的就会主动关注了,比如前一阵子就关了一个很棒的修图鹅,我也不是什么red姐,只是一个很菜的剪刀手且发挥不稳定,如果产出被你们
  • “导演心想你这年纪都可以做人家爸爸了,还怎么和她演情侣啊,就委婉地劝道:“咱这是偶像剧,男主年纪设定在20岁。”导演彻底傻了,委婉地劝老板:“人家小姑娘,还没毕
  • 距离上一次驚蟲的密集演出,已经经过了太长的时间 如梦则在去年才发布新的专辑,不想做只懒蟲…回想下两支乐队的友谊起点,竟然已经是四年前的故事了!成员交叉持续增多的
  • 这就好比,你省吃俭用,费心费力的养了条狗,这条狗长的高大威猛了,忽然有一天,你被告知,你跟它合个影要付钱……买版权!她是做了一个美梦吧,你看那些花儿,好像是开的
  • 昙花因她一现又即休,月亮因她朦胧又残缺,就连遗失千年的相思鸟,也因她的哭声,不远千里而歌。昙花因她一现又即休,月亮因她朦胧又残缺,就连遗失千年的相思鸟,也因她的
  • 变电站就如同家里的无线路由器一样,当离开一定的距离后,wifi信号就会消失,变电站也有一定的覆盖区域即供电半径,超过了这个供电半径,受制于电 压衰减、损耗等原因
  • ✨你若在呈上转运法之时,附上一份谢表,说明此事有岭南经略使着力推动、度支同仁大力支持、太府司、司农寺、尚食局助力良多,你猜鱼朝恩还敢不敢抢你的功——良元兄呐,做
  • 【#陕西通报初中女生校外遭多人殴打# 】陕西通报“初中女生校外遭多人殴打”事件:已对涉案人员依法处理人民网北京9月8日电 (记者梁秋坪、郝萍)9月7日,一段疑似