... 这位老哥 玩的6, https://t.cn/A6TXLWj7 distributed-llama这个项目基于llama2.c 修改成分布式推理; llama2 模型训练好的超大的权重参数在cpu低端机器上也可以推理(将计算推理以分布式分发给其他worker节点进行GEMM运算,最终主机将worker的计算结果整合,然后返回);
以前用docker一键搭建了把完了下,提了一个pr: https://t.cn/A6TXLWjZ 仅用来测试下,非 feat ;

过了一段时间,今天重新看了下pr, 发现作者支持Grok-1 (314 B参数,混合专家模型MoE结构),因为权重参数量大,文件很多,一般玩家很难run起来; 作者将其量化Q40权重文件有180G, 对其进行分布式推理,分别在 4 x 16 vCPU, 64 GB RAM (4 x Google Cloud n2d-standard-16) 和 2 x c3d-highcpu-90 (90 vCPU, 45 core, 177 GB memory) 上测试,
代码详情见mr地址:https://t.cn/A6TXLWjw
主要用到cpu向量化进行GEMM元素加速,权重分发到worker内存中进行推理

PS: 自己跑了下llama2 分布式模式, 貌似在多线程上有些问题,有时间再check下;

目的: 这个可以作为超大模型在分布式急群中cpu上进行分布式推理的参考方案demo,模型结构:llama2 和 MoE

澜舟科技的Mengzi3-13B正式开源发布在始智AI wisemodel.cn开源社区平台,对学术研究完全开放,同时支持免费商用。Mengzi3-13B模型基于Llama架构,语料精选自网页、百科、社交、媒体、新闻,以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练,模型的中文能力突出并且兼顾多语言能力。在参数量20B以内的轻量化大模型领域,Mengzi3-13B在中英文语言能力方面的成绩尤为突出,具备了出色的实用性和高性价比,能更好的满足企业的商业化需求。

#模型时代# 微调和RAG,企业使用大模型的两条路线。

两天前,OpenAI推出了一系列面向开发者的优化功能,目的是帮助更多企业机构,针对其行业、业务或特定用例,做模型微调,进而定制模型。
紧接着,黄仁勋投资的另一家AI公司Cohere(创始人Aidan Gomez是Transformer论文的八名作者之一)也宣布升级它们的技术Command R+(链接:https://t.cn/A6TJBHcT),一款针对检索增强生成 (RAG) 优化的模型,专为处理企业级负载而设计,并首发于Microsoft Azure。

题外话,不得不说微软是这一轮大模型的关键投资者和收割者,在消费者尝鲜ChatGPT之后,大模型的富矿必然是企业级用户。微软的Azure在这方面比起Google Cloud有更大的优势。简单科普一下微调和RAG。

***
1、微调
微调是指对预先训练好的大语言模型进行参数调整,使它在特定领域或任务中更专业。微调只需要更小的特定数据做训练就可以,所以所需要的计算密集度比较低,不过如果从某个开源模型,比如Meta的Llama 2,还是需要大量计算资源。简单来说,就是训练一个

2、RAG
RAG是为模型提供了检索能力。大家都知道大模型经常会出现幻觉,这对消费者来说问题不是太大,但是对于企业经营(也包括科研),问题就很严重。所以RAG可以让模型检查既有的,有准确信息的数据集,查找结合上下文的事实信息。然后再讲信息输入模型,再综合生成结果。

3、区别
微调模型,只要调整训练好了,用起来和既有大模型一样,只不过它是通过专业数据训练出来的,所以比通用模型更懂行。而且既然是训练好了的模型,所以反馈时延性能也不错(计算资源都在训练阶段)。RAG效率要低一些,因为工作要分为两步,一步是检索(推理阶段也需要额外的计算资源),一步是生成。但是,如果场景追求信息的准确性,RAG 就好于微调,毕竟有一个数据库做支持。

4、场景
因此,Command R+ 的介绍文案中,关键词就是性能(图),其次是提高准确性,减少幻觉信息。目前Cohere主打的场景是财务、人力资源、销售、营销和客户支持等。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • !♥️欢迎一起来参加“没时间中年危机— —新时代女性慧·生活 下午茶” 线下教育日♥️时间: 地点:言几又·长宁来福士抓紧时间报名喽!
  • ”“我觉得是热爱,就你发自内心的想去做这件事情,这就是无尽的动力,比任何鸡血,任何马达都好用,他就是一个无穷无尽的能量,你在热爱这件事情,你做的这个事情,是你真
  • 12月6日,睦岗派出所在分局刑侦大队等警种部门的配合下,发现一名因涉嫌诈骗、于2021年10月被新疆建设兵团六师公安局网上追逃人员罗某彬(男, 25岁)的落脚
  • 海航休息室可以从48号候机厅(安检后左转)附近搭乘专用电梯前往,具体介绍可以看我们这条微博:#FM100出行提示#【30日起,海南航空全部航班将转场至海口美兰机
  • 其为人豪迈,工诗文及草书。体出孙过庭《书谱》并参以颜、米诸体,极使转纵横之能,有独特的风貌。
  • 我也感恩郭晓冬的演绎,这一次,农民的儿子回归本色,土得让人想哭,但他讲了一个好故事,给观众们好好上了一堂课。在筹拍《我的父亲焦裕禄》这部电影的时候,监制焦守云,
  • 【半夏新传考研择校蓝皮书免费送】23夏宝们,你们在忙着考虑不知道该选哪个学校吗?150+所院校参考书、历年分数线、考研报录比、真题汇总、师姐经验谈……巨干干货助
  • 雅思备考资//料更新: 雅思最新5-8月口语新题题库 雅思1-4月口语新题题库+8道新题示范 15年-21年雅思写作真题汇总(更新至2021.02.27)
  • 今天推荐的两本书分别是《学校如何运转》和《刑法中的同意制度》这两本书让我对两个教育和司法两个领域有了全新的看法,而且有一个感觉,就是这两本书都是在用类似工程学的
  • 《温柔的路途》是马家辉老师的旅行游记,主要讲的是他在国内旅游的见闻经历,比如武汉、长沙等城市,这些城市我们大都熟悉,读起来会有共鸣。今天就来给大家整理一批这些节
  • ”死灭回游泳者(玩家)鹿紫云 一(かしも はじめ)小金虫:“我是小金虫!!是连接泳者(玩家)和死灭回游的窗口!!”刚才出现在虎杖头顶像咒灵一样的东西说道。秤:“
  • 这次苏州游,山塘街突然不香了,我移情别恋了平江路;苏博有了新馆,但还是去了老的,最流连的仍是文创店,买了1000片的拼图,背了一整天。里面有我的家人十一去湖口吃
  • 各大卫视跨年演唱会阵容陆续官宣[嘘]江苏卫视:张杰张靓颖邓紫棋周深李宇春薛之谦等浙江卫视:王嘉尔邓紫棋杨丞琳关晓彤徐艺洋等湖南卫视:王源龚俊王一博杨紫周笔畅五月
  • 今年冬天依旧留着长发 比去年长了点 今年还是见不到爸爸妈妈 和去年相比瘦了 因为陆陆续续生病了好久好久 温柔了些 成熟了一点 受委屈还是喜欢不讲话 像他说的非
  • 为了排除肺炎的可能性,还是拍摄了一个胸片。嗯,王力宏和李靓蕾两位主角都熄火了,只有配角在不断的加戏也是无语了……女子咳嗽,自行用药不解,就医发现癌症多处转移,医
  • ? 你是否也想遇见在你心中的智慧老者,穿越心事的重重黑纱,遇见全新的自己?
  • 今天又忍不住哭啦 忍住两天了 今天去北苑711买了糖 北苑水果店没有蛇果 来南苑选的 大白兔 不二家 桃子味的糖果 还有尝过一个特别好吃的果冻 都想给他 他不
  • 四间房明亮通透,都配备双人床和桌椅。四间房明亮通透,都配备双人床和桌椅。
  • 考完试就开始失眠,开始清算自己为什么会失败,我吃的苦不比别人少(不是自我感动)从二月份回到学校从来没有休息过一天,哪怕身体不适也坚持,只不过我方法错了并且没有及
  • 自己也有意无意的利用伤害过好多人,他们几乎都不忍责怪,可能是由于这份“单纯”或是年轻时的模样,不是 你们这些熊孩子有我这姿色吗 瞎几把作什么啊 当然我也只是很