GPT-4 不能推理?也许我们是应该考虑用外部方式"增强"了 ——
附图文章里说的,"推理不是不择手段地得出正确的答案,而是根据正确的理由得出正确的答案 " —— 这个说法我觉得是没问题的,但这容易走向以前"专家系统"的死胡同,也就是什么事都要讲个确切的道理,有个明确的逻辑。
原来大家最早做机器翻译时,就打算用这种思路,结果怎么做效果怎么不好,因为语言这个东西有非常多的约定俗成的元素,就是没什么道理讲。马未都说过一个例子:"我差点没摔一跟头",意思是我没摔,是否定含义;而"我差点没赶上车",是我赶上了车,是肯定意思。这"没"字什么时候表示肯定,有时候否定呢?没规则,这么说的人多了,就这么着了,这怎么设计翻译对应的条件?
基于人工神经网络的机器翻译为什么效果好呢?因为没有纠结一定要依照某些确切的规矩,那种"如果A或B,又有C,就一定推出D"的逻辑范式,而是用了统计学的思路—— 如果根据以往出现数据里表现出的模式,哪些输出是最有可能出现在现在这种输入的情况下?
这几乎定义了生成式AI的"创造"力,ChatGPT就是典型的通过"预测下一个Token"的方式输出 。但这种做法,就会带来明显的逻辑问题: 很多情况下,我们并不是找"最可能"的结果,我们是要找"唯一正确"的结果 —— 比如代数运算,这类情况泛化一下,很多有确定结果的问题,用统计学来解答,就显得很奇怪。比如一个已经发生并且有明确记录的事,就不需要用概率计算来回答,只需要从明确记录中读取出来就好了;而GPT们偏偏非要搜肠刮肚把一大堆参数算一遍,然后一个字一个字按概率输出一个"最有可能"结果。如果这个事实被记录在了很多文本中,跟很多其他因素交织在一起,GPT就有可能把这个事的某些元素和其他事物的元素算到了一起,这就是GPT一直挥之不去的梦魇 —— 幻觉。做数学运算更能看出GPT的"费力不讨好",哪有做四则运算是靠"预测下一个数字"的方式?有讽刺意味的是,GPT做了海量的矩阵线性代数运算,却做不对一个基本的多位数乘除。在GPT们的解释性得到很好验证之前,这些问题会一直存在。
那一个自然的思路是,能不能结合一下"符号体系"专家系统,和GPT的人工神经网络体系两者的优势,弥补一下两者的缺点呢?Meta的首席科学家杨立昆觉得不行,说两者方向根本不同,没法整一起,但我觉得这么说太绝对。我经常引用华盛顿大学的Yejin教授问GP-4的一个案例:"如果晒干5件衣服需要5小时,晒干30件衣服需要多久?",GPT4答"30个小时",这个答案,我觉得就完全可以结合专家系统的规则条件来回答,比如回答前可以加入一个检查: "问题里的事件(这个问题里是晒干衣服),是不是可并行的?" ,并在规则库里加入诸如 "如果一个事件是可并行的,那这个事件处理的时间,并不随着事件的要素(这个问题里是 衣服)的数量增多而增多" ,这样的规则。在我的想象中,GPT应该是一个自然语言的提取/翻译器,把应用题的文字转化成专家知识库/知识图谱里的逻辑实体,用规则推理引擎先来推导一遍,只有在规则引擎无法推理的情况下,再用"预测下一个Token"的方式来做输出。想想人类的思考,不也是这样吗?如果需要处理的事情有一个明确的参考规则,我们不也是依照着推理出结果,而不会上来就凭感觉做出判断吗?—— 仅代表尹智个人观点 Ken's personal view only
附图文章里说的,"推理不是不择手段地得出正确的答案,而是根据正确的理由得出正确的答案 " —— 这个说法我觉得是没问题的,但这容易走向以前"专家系统"的死胡同,也就是什么事都要讲个确切的道理,有个明确的逻辑。
原来大家最早做机器翻译时,就打算用这种思路,结果怎么做效果怎么不好,因为语言这个东西有非常多的约定俗成的元素,就是没什么道理讲。马未都说过一个例子:"我差点没摔一跟头",意思是我没摔,是否定含义;而"我差点没赶上车",是我赶上了车,是肯定意思。这"没"字什么时候表示肯定,有时候否定呢?没规则,这么说的人多了,就这么着了,这怎么设计翻译对应的条件?
基于人工神经网络的机器翻译为什么效果好呢?因为没有纠结一定要依照某些确切的规矩,那种"如果A或B,又有C,就一定推出D"的逻辑范式,而是用了统计学的思路—— 如果根据以往出现数据里表现出的模式,哪些输出是最有可能出现在现在这种输入的情况下?
这几乎定义了生成式AI的"创造"力,ChatGPT就是典型的通过"预测下一个Token"的方式输出 。但这种做法,就会带来明显的逻辑问题: 很多情况下,我们并不是找"最可能"的结果,我们是要找"唯一正确"的结果 —— 比如代数运算,这类情况泛化一下,很多有确定结果的问题,用统计学来解答,就显得很奇怪。比如一个已经发生并且有明确记录的事,就不需要用概率计算来回答,只需要从明确记录中读取出来就好了;而GPT们偏偏非要搜肠刮肚把一大堆参数算一遍,然后一个字一个字按概率输出一个"最有可能"结果。如果这个事实被记录在了很多文本中,跟很多其他因素交织在一起,GPT就有可能把这个事的某些元素和其他事物的元素算到了一起,这就是GPT一直挥之不去的梦魇 —— 幻觉。做数学运算更能看出GPT的"费力不讨好",哪有做四则运算是靠"预测下一个数字"的方式?有讽刺意味的是,GPT做了海量的矩阵线性代数运算,却做不对一个基本的多位数乘除。在GPT们的解释性得到很好验证之前,这些问题会一直存在。
那一个自然的思路是,能不能结合一下"符号体系"专家系统,和GPT的人工神经网络体系两者的优势,弥补一下两者的缺点呢?Meta的首席科学家杨立昆觉得不行,说两者方向根本不同,没法整一起,但我觉得这么说太绝对。我经常引用华盛顿大学的Yejin教授问GP-4的一个案例:"如果晒干5件衣服需要5小时,晒干30件衣服需要多久?",GPT4答"30个小时",这个答案,我觉得就完全可以结合专家系统的规则条件来回答,比如回答前可以加入一个检查: "问题里的事件(这个问题里是晒干衣服),是不是可并行的?" ,并在规则库里加入诸如 "如果一个事件是可并行的,那这个事件处理的时间,并不随着事件的要素(这个问题里是 衣服)的数量增多而增多" ,这样的规则。在我的想象中,GPT应该是一个自然语言的提取/翻译器,把应用题的文字转化成专家知识库/知识图谱里的逻辑实体,用规则推理引擎先来推导一遍,只有在规则引擎无法推理的情况下,再用"预测下一个Token"的方式来做输出。想想人类的思考,不也是这样吗?如果需要处理的事情有一个明确的参考规则,我们不也是依照着推理出结果,而不会上来就凭感觉做出判断吗?—— 仅代表尹智个人观点 Ken's personal view only
【打卡】8.16
今天晚上学完专业课心情愉快,神清气爽[太阳],早上去做了概率分布的题,发现老师讲的时候懂了,自己一做就现原形[顶],多做了几道题之后逐渐有了手感。晚上听参数估计,本来也是脑袋不清醒,后来发现自己逐渐听懂了,脑袋一下就清晰了!但是听课来来回回倒花了不少时间,就没有在做题。明天做完听假设检验,课时比较多分两天看完。
毛中特多选错了好多[泪]
英语完型剩下最后一节课的一部分,明天听完后去看新题型的两节课,这周听完完型和新题型,下周先听一下monkey老师的大小作文,等下个月开始继续做阅读以及看石雷鹏大小作文。
今天晚上学完专业课心情愉快,神清气爽[太阳],早上去做了概率分布的题,发现老师讲的时候懂了,自己一做就现原形[顶],多做了几道题之后逐渐有了手感。晚上听参数估计,本来也是脑袋不清醒,后来发现自己逐渐听懂了,脑袋一下就清晰了!但是听课来来回回倒花了不少时间,就没有在做题。明天做完听假设检验,课时比较多分两天看完。
毛中特多选错了好多[泪]
英语完型剩下最后一节课的一部分,明天听完后去看新题型的两节课,这周听完完型和新题型,下周先听一下monkey老师的大小作文,等下个月开始继续做阅读以及看石雷鹏大小作文。
一加 Ace2 Pro定价出来了,2999 12+256,这个价格是很不错的,整体的堆料就注定了这个手机不会定到2999以下。
然而现在对这个价格的争议挺大的,但其实是因为锚定物不同了。
现在的舆论玩法是这样的,我锚一个参数出来,把它的重要性无限扩大,说得特别高贵,然后其他的参数就使劲踩。
比如红米刚开始用线性马达的时候,荣耀没用,那么哒哒哒就是最重要的事情,嗡嗡嗡就是万恶不赦。
而当一加用了一个巨无霸马达之后,突然振动马达又不那么重要了,突然IP68成了唯一标准,有这个的手机就必买,其他的都不值得买。
这个就是数码圈小鬼有意思的地方,标准的锚可以不停变,厂商说啥就是啥。
但我不知道大家厌烦没有,性能机的更新就是轮换做卖点,一代更新一点,拍照,充电,散热,每个功能轮流升级,现在已经少有一步到位的水桶机了。
但今年的一加做产品就很有意思,特别一加11出来之后,大家的感觉就是不恶心,该有的都有,非常均衡。
今天发布的一加Ace 2 Pro也一样,不仅核心配置上了骁龙8gen2,满血的内闪存配置,150w有线闪充,而且上了史无前例的9140mm²的散热堆料,安卓最大的振动马达,IMX890+ois+OPPO旗舰影像算法。
讲道理,为了压价格做出来的的产品已经不好意思做一加Ace2 Pro的对手了,拿数字旗舰来比吧
是颤颤巍巍选不知道底细的产品,还是安心选没有短板的真水桶旗舰,选择权在各位手上。
#一加ace2pro#
然而现在对这个价格的争议挺大的,但其实是因为锚定物不同了。
现在的舆论玩法是这样的,我锚一个参数出来,把它的重要性无限扩大,说得特别高贵,然后其他的参数就使劲踩。
比如红米刚开始用线性马达的时候,荣耀没用,那么哒哒哒就是最重要的事情,嗡嗡嗡就是万恶不赦。
而当一加用了一个巨无霸马达之后,突然振动马达又不那么重要了,突然IP68成了唯一标准,有这个的手机就必买,其他的都不值得买。
这个就是数码圈小鬼有意思的地方,标准的锚可以不停变,厂商说啥就是啥。
但我不知道大家厌烦没有,性能机的更新就是轮换做卖点,一代更新一点,拍照,充电,散热,每个功能轮流升级,现在已经少有一步到位的水桶机了。
但今年的一加做产品就很有意思,特别一加11出来之后,大家的感觉就是不恶心,该有的都有,非常均衡。
今天发布的一加Ace 2 Pro也一样,不仅核心配置上了骁龙8gen2,满血的内闪存配置,150w有线闪充,而且上了史无前例的9140mm²的散热堆料,安卓最大的振动马达,IMX890+ois+OPPO旗舰影像算法。
讲道理,为了压价格做出来的的产品已经不好意思做一加Ace2 Pro的对手了,拿数字旗舰来比吧
是颤颤巍巍选不知道底细的产品,还是安心选没有短板的真水桶旗舰,选择权在各位手上。
#一加ace2pro#
✋热门推荐