... 这位老哥玩的6， distributed-llama这个项目基于llam

首页发布

... 这位老哥玩的6， https://t.cn/A6TXLWj7 distributed-llama这个项目基于llama2.c 修改成分布式推理； llama2 模型训练好的超大的权重参数在cpu低端机器上也可以推理(将计算推理以分布式分发给其他worker节点进行GEMM运算，最终主机将worker的计算结果整合，然后返回)；
以前用docker一键搭建了把完了下，提了一个pr: https://t.cn/A6TXLWjZ 仅用来测试下，非 feat ;

过了一段时间，今天重新看了下pr, 发现作者支持Grok-1 (314 B参数，混合专家模型MoE结构)，因为权重参数量大，文件很多，一般玩家很难run起来；作者将其量化Q40权重文件有180G, 对其进行分布式推理，分别在 4 x 16 vCPU, 64 GB RAM (4 x Google Cloud n2d-standard-16) 和 2 x c3d-highcpu-90 (90 vCPU, 45 core, 177 GB memory) 上测试，
代码详情见mr地址：https://t.cn/A6TXLWjw
主要用到cpu向量化进行GEMM元素加速，权重分发到worker内存中进行推理

PS: 自己跑了下llama2 分布式模式，貌似在多线程上有些问题，有时间再check下；

目的：这个可以作为超大模型在分布式急群中cpu上进行分布式推理的参考方案demo，模型结构：llama2 和 MoE

澜舟科技的Mengzi3-13B正式开源发布在始智AI wisemodel.cn开源社区平台，对学术研究完全开放，同时支持免费商用。Mengzi3-13B模型基于Llama架构，语料精选自网页、百科、社交、媒体、新闻，以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练，模型的中文能力突出并且兼顾多语言能力。在参数量20B以内的轻量化大模型领域，Mengzi3-13B在中英文语言能力方面的成绩尤为突出，具备了出色的实用性和高性价比，能更好的满足企业的商业化需求。

#模型时代# 微调和RAG，企业使用大模型的两条路线。

两天前，OpenAI推出了一系列面向开发者的优化功能，目的是帮助更多企业机构，针对其行业、业务或特定用例，做模型微调，进而定制模型。
紧接着，黄仁勋投资的另一家AI公司Cohere（创始人Aidan Gomez是Transformer论文的八名作者之一）也宣布升级它们的技术Command R+（链接：https://t.cn/A6TJBHcT），一款针对检索增强生成 (RAG) 优化的模型，专为处理企业级负载而设计，并首发于Microsoft Azure。

题外话，不得不说微软是这一轮大模型的关键投资者和收割者，在消费者尝鲜ChatGPT之后，大模型的富矿必然是企业级用户。微软的Azure在这方面比起Google Cloud有更大的优势。简单科普一下微调和RAG。

***
1、微调
微调是指对预先训练好的大语言模型进行参数调整，使它在特定领域或任务中更专业。微调只需要更小的特定数据做训练就可以，所以所需要的计算密集度比较低，不过如果从某个开源模型，比如Meta的Llama 2，还是需要大量计算资源。简单来说，就是训练一个

2、RAG
RAG是为模型提供了检索能力。大家都知道大模型经常会出现幻觉，这对消费者来说问题不是太大，但是对于企业经营（也包括科研），问题就很严重。所以RAG可以让模型检查既有的，有准确信息的数据集，查找结合上下文的事实信息。然后再讲信息输入模型，再综合生成结果。

3、区别
微调模型，只要调整训练好了，用起来和既有大模型一样，只不过它是通过专业数据训练出来的，所以比通用模型更懂行。而且既然是训练好了的模型，所以反馈时延性能也不错（计算资源都在训练阶段）。RAG效率要低一些，因为工作要分为两步，一步是检索（推理阶段也需要额外的计算资源），一步是生成。但是，如果场景追求信息的准确性，RAG 就好于微调，毕竟有一个数据库做支持。

4、场景
因此，Command R+ 的介绍文案中，关键词就是性能（图），其次是提高准确性，减少幻觉信息。目前Cohere主打的场景是财务、人力资源、销售、营销和客户支持等。

发布 👍 0 举报写留言 🖊

”“我觉得是热爱，就你发自内心的想去做这件事情，这就是无尽的动力，比任何鸡血，任何马达都好用，他就是一个无穷无尽的能量，你在热爱这件事情，你做的这个事情，是你真

12月6日，睦岗派出所在分局刑侦大队等警种部门的配合下，发现一名因涉嫌诈骗、于2021年10月被新疆建设兵团六师公安局网上追逃人员罗某彬（男， 25岁）的落脚

海航休息室可以从48号候机厅（安检后左转）附近搭乘专用电梯前往，具体介绍可以看我们这条微博：#FM100出行提示#【30日起，海南航空全部航班将转场至海口美兰机

其为人豪迈，工诗文及草书。体出孙过庭《书谱》并参以颜、米诸体，极使转纵横之能，有独特的风貌。

我也感恩郭晓冬的演绎，这一次，农民的儿子回归本色，土得让人想哭，但他讲了一个好故事，给观众们好好上了一堂课。在筹拍《我的父亲焦裕禄》这部电影的时候，监制焦守云，

【半夏新传考研择校蓝皮书免费送】23夏宝们，你们在忙着考虑不知道该选哪个学校吗？150+所院校参考书、历年分数线、考研报录比、真题汇总、师姐经验谈……巨干干货助

《温柔的路途》是马家辉老师的旅行游记，主要讲的是他在国内旅游的见闻经历，比如武汉、长沙等城市，这些城市我们大都熟悉，读起来会有共鸣。今天就来给大家整理一批这些节

”死灭回游泳者(玩家)鹿紫云一(かしもはじめ)小金虫：“我是小金虫!!是连接泳者(玩家)和死灭回游的窗口!!”刚才出现在虎杖头顶像咒灵一样的东西说道。秤：“

这次苏州游，山塘街突然不香了，我移情别恋了平江路；苏博有了新馆，但还是去了老的，最流连的仍是文创店，买了1000片的拼图，背了一整天。里面有我的家人十一去湖口吃

各大卫视跨年演唱会阵容陆续官宣[嘘]江苏卫视：张杰张靓颖邓紫棋周深李宇春薛之谦等浙江卫视：王嘉尔邓紫棋杨丞琳关晓彤徐艺洋等湖南卫视：王源龚俊王一博杨紫周笔畅五月

今年冬天依旧留着长发比去年长了点今年还是见不到爸爸妈妈和去年相比瘦了因为陆陆续续生病了好久好久温柔了些成熟了一点受委屈还是喜欢不讲话像他说的非

为了排除肺炎的可能性，还是拍摄了一个胸片。嗯，王力宏和李靓蕾两位主角都熄火了，只有配角在不断的加戏也是无语了……女子咳嗽，自行用药不解，就医发现癌症多处转移，医

？你是否也想遇见在你心中的智慧老者，穿越心事的重重黑纱，遇见全新的自己？

今天又忍不住哭啦忍住两天了今天去北苑711买了糖北苑水果店没有蛇果来南苑选的大白兔不二家桃子味的糖果还有尝过一个特别好吃的果冻都想给他他不

四间房明亮通透，都配备双人床和桌椅。四间房明亮通透，都配备双人床和桌椅。

考完试就开始失眠，开始清算自己为什么会失败，我吃的苦不比别人少（不是自我感动）从二月份回到学校从来没有休息过一天，哪怕身体不适也坚持，只不过我方法错了并且没有及

自己也有意无意的利用伤害过好多人，他们几乎都不忍责怪，可能是由于这份“单纯”或是年轻时的模样，不是你们这些熊孩子有我这姿色吗瞎几把作什么啊当然我也只是很