港股大模型被资金疯狂抢筹!商汤大模型大涨31%!拓尔思大模型涨4%,商汤和拓尔思是国内两家唯一真正研发出200K长文本大模型的上市公司。商汤大涨31%!与商汤200K技术一样的拓尔思还在低位,建议重点关注。
商汤:公司推出日日新大模型5.0版本,采用混合专家架构,推理时上下文窗口达到200K左右,在数学、推理及代码能力上全面对标GPT4-turbo。
拓尔思:公司自主研发的拓天大模型正在开发和测试200K长文本支持能力,后续将推出支持长文本理解的升级版本。
$商汤-W(00020)$ $拓尔思(SZ300229)$ $高新发展(SZ000628)$
商汤:公司推出日日新大模型5.0版本,采用混合专家架构,推理时上下文窗口达到200K左右,在数学、推理及代码能力上全面对标GPT4-turbo。
拓尔思:公司自主研发的拓天大模型正在开发和测试200K长文本支持能力,后续将推出支持长文本理解的升级版本。
$商汤-W(00020)$ $拓尔思(SZ300229)$ $高新发展(SZ000628)$
【商汤发布日日新5.0大模型,-W涨幅扩大至30%】商汤科技在4月23日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,相当于36.5万字个汉字,综合能力全面对标GPT-4 Turbo。
在人工智能发展的最基本法则——尺度定律(Scaling Law)的准则下,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。
商汤科技董事长兼CEO徐立表示:“商汤在尺度定律指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),突破大模型能力边界。”
24日,商汤-W(00020.HK)高开3.28%,开盘后公司股价迅速拉升一度涨超36%。截至目前,该股涨约30%。
在人工智能发展的最基本法则——尺度定律(Scaling Law)的准则下,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。
商汤科技董事长兼CEO徐立表示:“商汤在尺度定律指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),突破大模型能力边界。”
24日,商汤-W(00020.HK)高开3.28%,开盘后公司股价迅速拉升一度涨超36%。截至目前,该股涨约30%。
【#商汤集团股价暴涨30%后暂停交易#】4月24日,$商汤-W hk00020$ 在港交所暂停交易,暂停交易前上涨31.15%,盘中一度涨超36%。
消息面上,商汤科技23日发布日日新5.0大模型,该模型采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。
商汤科技董事长兼CEO徐立表示,商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。
据悉,商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。
徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。#股市##投资#
消息面上,商汤科技23日发布日日新5.0大模型,该模型采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。
商汤科技董事长兼CEO徐立表示,商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。
据悉,商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。
徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。#股市##投资#
✋热门推荐