gu903();林奇准备一个一个的研究下去,第一个看到的就是图像分类。
图像分类以前还有一个赛事ig不过后来在计算机的分类能力超过人类的时候,举办方决定不再举办这个赛事了。
图像分类的定义很简单,就是从给定一组各自被标记为单一类别的图像,对一组新的测试图像类别进行预测,并测量预测的准确性结果,这就是图像分类问题。
图像分类问题需要面临几个挑战,视点变化,尺度变化,类内变化,图像变化,图像遮挡,照明条件和背景杂斑。
林奇准备着手做分类的时候,他想自己弄一个小机器人来玩玩,准备把研究成果用在这个机器人身上。
其实是以可视化的方式表现出来。
人必竟还是视觉动物,直接给一个人一大堆的数据,尤其是通过计算机高速交换的数据,没有人能看出来什么,只会看的头昏眼花。
但是如果能把数据展示出来,尤其用一个图表的方式展示出来,那人们就能一眼看出来到底,这个算法的好坏,还能看到识别正确率的提升。
林奇上网找了一些资料,从一个专门研究机器人的网站,下单购买了一些电子原件,因为林奇想自己打造一个小机器人。就连机器人的外形,林奇都想好了,他要打造一个小毛毛虫,对就是毛毛虫。
一定要有两个眼睛,这是林奇内心的想法。
有一个可以蠕动的身体
在林奇自学了一些机器人和电子原器件和电路的相关知识以后,他摸索着弄出来了一个软体毛毛虫,名字林奇都给起好了,就叫二毛。
对于这个名字二毛只能接受,如果它有意识,并且知道一些知识之后,可能会嫌弃这个名字。
林奇制造出来的毛毛虫比之普通的毛毛虫略大,普通的毛毛虫还没有小手指大,但是林奇的这个毛毛虫却堪比一条手臂。冷不丁的拿出去,估计能吓到不少人。
长度也和人的小手臂差不多,没有一整条胳膊长,有一个丑陋的脑袋,脑袋上面有两个硕大的摄像头,就像一条蛇的眼睛。
别说这个毛毛虫还真的和蛇长的不差什么,只是比蛇短了不少,现在它还不能行走,只能站在林奇的办公桌上,左右的摇晃着它那个小脑袋,眼睛左右全方位的看向四周。
看着眼前的毛毛虫,林奇感觉很有意思。
林奇第一个之所以选择的是图片分类,是因为这个的应用比较广泛,并且现在也有很好的算法。
最为流行的就是卷积神经网络n,与普通的算法不太一样,卷积神经网络算法也很有意思。
现在人们拍照的器材越来越好,10001000的图片比比皆是。
在分析图片的时候是否需要一个创建一个10001000的网络层,答案是不需要的,相反可以创建一个2020的输入层。
就好像是下面有一个很大的图片,在图片的上面有一个小纸板。
第一次把这个纸板放在了图片的左上角,只取出来被覆盖的这一部分的像素进行处理,然后把这个纸板向右移动一个像素,再取一部分像素进行处理。
有的人有疑问,这样不是第二次取的像素和第一次重复的很多吗
没错就是有很多的重复,这个算法就是要这么搞,只有这样的滑动窗口,才能体现出来这个图片像素的空间位置,才能把像素之间的关系也都考虑进去。
而不是像以前有一种识别手写的图片中的数字的例子,机器学习的入门课程,就是识别手写数字,有人统计,只有正确率达到了百分之九十九多的时候,机器识别才有作用。
最经典的一个例子就是,把所有的像素都从左到右,从上到下,一个一个的都并排排好,形成一个单个的像素线。
写一个方程式来求几个参数,给出来一些训练数据,让计算机自己发现规律,找到其中的关联,从而得到一个最好的方程的解。
但是这种计算出来的结果正确的识别率只有可怜的百分之八十多。
如果用卷积神经网络来稍加改造就能让识别率达到百分之九十九以上。
可见,卷积神经网络对图片的分类来说是最好的一个算法。
不过也是有一个问题,它需要大量的数据,对于能获得大量的数据的场景这个算法是很不错的,但是如果不能获得很多数据,它的效果就没有那么好了。
因为有以前做过语音识别的经验,所以对这个改造起来是得心应手。
很快林奇就把这个算法进行了改进,可以不用那么多的数据就能达到一样的效果。
为了验证他的这个结论是否正确,林奇向毛毛虫的身体里写入一段程序。
这个程序特别简单,就是利用林奇开发出来的程序识别眼前出现的人是否是林奇本人。
如果识别出来是林奇本人,那么毛毛虫就会开心的把头扭来扭去。
说起来做这个,是兴趣更多一些,因为这样的程序什么都做不了,也没有办法帮助林奇来修正他的研究。
不过看着眼前的毛毛虫,林奇就特别喜欢它,虽然它本身没有什么存储的能力,都是通过后台的生物计算机来计算,然后利用量子通信送到毛毛虫这边处理。
但是林奇就感觉这是一个小伙伴,可以陪着他,让他在生活中有了一丝调味。
林奇在这样的想法下,一个个的场景攻关下去,自己在这其中提高了不少。
第254章谁是最可爱的人
第二个林奇研究的就是对象检测,给定一个图片或者是视频,可以很快的识别出来里面的对象。
举个简单的例子,比如一个或者多个罪犯挟持一群人质躲在一个密闭的大楼里面。
这个时候如果能获得一张大楼里面的照片,经验丰富的人分析出来所有的信息可能时间也很短,但是交给计算机,任何一个人都能被在短短的时间里分析出来,里面的详细情况。
这对营救人质有很大的帮助,可以为警方争取一定的时间。
还有在人人都在搞的无人驾驶技术,就对此技术强烈依赖。
还有目标跟踪,语义分割,实例分割,林奇在经过不懈的努力之后,发现自己在每一项上面都有了长足的进步。
任何一项其实想要超越都不是易事,但是对于林奇来说,并不是特别困难。
gu903();