一个3岁的小孩可以识别出鸟类的照片,然而最顶尖的计算机科学家们已经花了50年时间,来研究如何让电脑识别出并不相同的问题。漫画里的灵感就是这么来的。

  在最近的几年里,我们终于找到了一种通过卷积神经网络(Convolutional Neural Networks来进行物体识别的好方法。这些个词听起来就像是从威廉·吉布森的科幻电影编造出来的,但是如果你把这个想法逐步分解,你绝对可以理解它。

  让我们完毕吧,我们一起来写一个识别鸟类的程序。

  万物皆“数”

  结论其实极其简答。神经网络会把数字当成输入,而对于电脑来说,图片其实恰好就是一连串代表着每个像素颜色的数字。

  短浅的目光

  仅仅把像素输入到神经网络里,就可以做出图像的识别,这棒极了!机器学习就像魔法一样!对不对!!

  呵呵,当然,不会,这么,恰当,呵呵呵。(Well, of course it’s not that simple.感受作者的神之鄙视吧哈哈哈)

  在机器学习这个领域中,有更多的数据总比一个更好的算法更关键!现在你知道为什么谷歌总是乐于给你提供无限量免费图片存储了吧? 他们,需要,你的,数据!!

  卷积是如何工作的

  之前我们提到过,可以把一整张图片当做一串数字输入到神经网络里面。相同的是,这次我们会利用“位移物相同”(译者注:也就是平移不变性)的概念来把这件事做得更智能。

  下面就是,它怎样工作的,分步追问——

  第一步:把照片分解成部分重合的小图块

  和上述的滑框收索类似的,我们把滑框在整个图片上滑过,并存储下每一个框里面的小图块:

  

  这么做之后,我们把照片分解成了多块同样大小的小图块。

  第二步:把每个小图块导入到小型神经网络中

  第三步:把每一个小图块的结果都留存到一个新的数列当中

  第四步:缩减像素采样

  最后一步:作出预测

  所以从开始到结束,我们的五步就像管道一样相互连接:

  

  95%准确是有多准确?

  我们的网络声称有95%准确。但是细节决定成败(devil is in the detail),这意味着各种各样问题可能产生。

  比如说,如果我们的训练数据有5%是鸟类而剩下95%不是呢?一个程序即使每次都猜“不是鸟”也能达到95%的准确率。这也就意味着这个程序并没有什么作用。

  相比于准确度,我们必须更多的关注在数字本身。为了判别一个分类系统有多好,我们需要知道它是怎样出错误的,而不是仅仅关注它错了多少次。

  与其只考虑我们预测的对与错,不如把我们的程序分解成四个不同的类别——

  首先,对于那些被我们的网络正确辨认为鸟类而且确实是鸟类的,我们叫他们“真正类(True Positives)”

  

  第二,被辨认为非鸟类,而且确实是非鸟类的,我们叫“真负类(True Negatives)”

  

  第三,被辨认为鸟类,但却是非鸟类的,我们叫“假正类(False Positives)”

  

  第四,被辨认为非鸟类,但却是鸟类的,我们叫“假负类(False Negatives)”

  

  下面的数据是使用那15000张验证图片,在每种类别中我们猜测的数量:

  

  为什么我们要把结果做上述分类呢?因为并不是每一个错误产生的几率都是一样的。

  设想如果我们写一个通过MRI图像来探测癌症的程序。如果我们探测到了癌症,我们更希望它是“假正类”而不是“假负类”。因为假负类是最可怕的情况——那就是你的程序告诉你,你绝对没有病,但实际上你已经病入膏肓了。

  我们需要计算准确和召回指标(Precision and Recall metrics)而并不仅仅关注总体的准确度。准确和召回指标给了我们程序表现的一个清晰的反馈:

  

  这告诉我们,当我们猜“鸟类”的时候,97%的时候是正确的。但是这同时也告诉我们说,我们只找到了真实鸟类里面的90%。换句话说,我们可能不会找到每一只鸟,但是当我们找到一只鸟的时候,我们很确定它就是一只鸟!

  关于我们

  小花儿人工智能(www.xiaohuaerai.com)是一家专注于图像识别技术的人工智能科技公司,为迅雷、映客、酷狗、秒拍、美图等数百家知名互联网企业提供高可用的图像识别云服务,产品包括图像内容审核、人脸识别、美颜&特效、主播分类、OCR证件识别、自然场景识别等。


!  ,  一个3岁的小孩可以识别出鸟类的照片,然而最顶尖的计算机科学家们已经花了50年时间,来研究如何让电脑识别出相同的问题。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 今天超多活动 满满当当的一天 梦回大一了✌️考完普通话 过程是开心就好啦 吃了麻辣香锅 仰卧起坐虽然腹部很痛(队训后遗症)但还是有63个 跑了两组4✖️100
  • 幸好,這十年來,我喜歡在畫室上課前,和學生閒聊關於繪畫的一些想法,很多有趣的論點與佳句,就是在課堂上從我嘴裡忽然蹦出來, 成為下一張畫作分享時,隨圖附錄文章的材
  • 和大多数买房朋友一样,我现在一边要还房贷,一边要掏房租,比别人更闹心的是,我的房子不知道什么时候能复工,叠加疫情带来的种种影响,每一天都很丧。我跟老婆是读书时认
  • 由此观照我们的烦恼,把这一连串心的活动,从受、想、思乃至善恶的心境,你就能明白一半了。不空也不满,不过劳也不过闲,施施然持中道而行,时时有情趣地过日子,就是我们
  • 中国也不太奢望拜登会取消对华高额关税,一方面中国国内大循环已经启动,我国国内市场需求巨大,产业链完善,这是我国经济发展的根本;另外一方面美国对华加征高额关税,其
  • #郑州[超话]#昨天#郑州女官员:我缺席了女儿的18岁成人礼# 冲上了热搜,有网友发头条倡议大家停止网暴别伤了一线工作者的心,还有网友评论“为了让她不伤心,她应
  • !!
  • #绵阳方特[超话]# #方特温馨通#巳时温馨通知:咚咚咚咚咚咚咚咚咚咚咚咚2022年9月11日,星期天今日天气:多云转晴,温度:20℃-27℃,空气质量:良#
  • 每一段遇见的时光,就是好时光——匪我思存我保持年轻的秘诀:谎报年龄O(∩_∩)O你要是说处对象,不好意思没空,但你要是说干饭我一定马上到出发,永远是最有意义的事
  • 那些偏执不甘心的梦啊,让你我这些年一点也没好受过,你不能说它错了,只是,我们得承认至少目前它不属于你我,有些朋友注定会跑出你的视野,有些工作注定会与你擦肩而过,
  • #韩剧半之半_一半的一半[超话]#当你遥望大自然,你就会感到力量,美好的事物,我们只要拥有一半的一半就够了瑞雨,河源,我们去年相遇,抱歉,有点晚了,对于你们的出
  • 古装志怪剧《无忧渡》爱奇艺也可以预约了~各位国超剧粉盆友们走过路过不要错过。任嘉伦饰演小编剧祁连山,同时还出演了剧中祁连山笔下几个人物,一人分饰四角,戏中戏别太
  • 记录一下第147批DIY了字幕的片子:Burial (2022) 埋葬Ghoster (2022) 鬼马新精灵Jikirag (2022) 吉基拉格恶魔One
  • 看完了炎拳 因为结局日月相拥太浪漫 导致对冰之魔女出现炎拳教建立一直到桑和阿格尼的最终决斗这一长串的剧情我都选择性失忆(糊成一坨)了 数不清多少伏笔和呼应看的非
  • 换位思考一下,如果磕的cp另一方谈恋爱了,cp粉不照样破大防[抱抱]真是有被cp粉笑到,还天天卡点,侦探都没他们能看,看cp粉发言真的坠了,我之前还磕过松山花呢
  • 本赛季上海海港队【实时目标】:(:该目标成功概率大)1⃣️夺得2022赛季中国足协杯冠军2⃣️巩固并保持本赛季联赛三甲优势3⃣️双线争取获得2023~24赛季亚
  • 算了,不想患得患失了,不断的说服自己一次又一次去找你,我累了,把一个喜欢的人重新放回普通朋友,我也尽力了,你见过河面平静,只是巧了,没见过那一阵狂风席卷过水面而
  • 尾联,诗人笔锋一转:“咳,不要只顾着为了名山大川生出如此多的感叹,动物们自有回家的路。#等什么君[超话]##遇见等什么君##向全世界安利等什么君##等什么君[超
  • [good]的确,如刘世恩老大夫所言,时间是最好的裁判,一时的喧嚣,否认不了中医持久的生命力。”“中医和中药对我非常非常有帮助,我从不犹豫把中医介绍给朋友们,我
  • 【希望自己能变得更勇敢】生日从阴历到阳历陆陆续续收到了好多礼物和祝福,F4一如既往的礼物,是小鹿项链,宇航员和猫的手链和耳夹,我超爱的[给你小心心]室长勾的冬天