开启辅助访问
 找回密码
 立即注册

现阶段人工智能与人脑智能算法层面的对比与思考.十万个为 ...

tatacs 回答数0 浏览数839
我是一位拥有10多年软件开发经验的工程师,目前主要的职业是3d游戏开发.我很喜欢研究算法,最近对人工智能算法有一些自个的理解.所以写一写文章来总结和思考,是否有新的方法推进人工智能算法的大突破.
我要讨论的算法的终极目标是实现与人脑一样的视觉识别的泛化能力.
在追逐这个目标实现的过程中,逐渐的逼近实现目标的充分必要条件,甚至引申出一些假设并证明为定理从而奠定真实可靠的理论基础.
开始上图,看图说话!

这张图中我们人的大概印象就是双向行驶的马路,来来往往的车辆有不同的颜色,还有一些路灯,远处还有高高的建筑大楼,路上不间断的出现白条线.
我们的认知中,绝大多数人都会忽略路边的树木的树叶大概有几种颜色,偏亮的或是偏暗的,这些都不会去关注也不会去留意.目前来讨论,我们为啥一眼就能认出这些来来往往的车辆了..作为人类,我们现阶段能够识别出这个图中的类别,是因为我们已经是人脑训练成功的成品,我们能够立即得到结果.但是我们对于训练学习的过程却一无所知,所以我们需要从最原始最朴素的角度来思考与推敲我们人脑识别的逻辑过程.在这里,我认识到了一台被绝大多数神经网络研究者可能都没有考虑过的命题,静态图片中的车辆是我们人类识别出的结果,但是静态图片真的是我们识别的充分必要条件么.
由此我经过思考引申出了一台命题,静态图片和3d连续视觉图片(我们人类可以在0.1秒的时间内微调视觉角度,从而得到连续帧图片,而这个连续帧图片获得的视觉对象在像素级别上不是完全一致的,也就是有角度偏差,光照偏差等等),那一台才是人脑识别系统的必要条件,如何证明?如果我们的视觉算法从一开始就没有从充分必要条件出发,我们耗尽几十年的研究所获得的成果总是无法达到人脑智能的完美程度.所以我认为寻找并证明一台难题的解的充分必要条件是非常严肃严谨的问题,欢迎读者各抒己见.
目前命题我已经提出了,那么现阶段我们可以通过观察很多现象,来逐步的靠近或者推导静态图片和3d连续视觉图片那一台才是人脑识别系统的必要条件.
让时间回到我们童年2岁的时候吧,那个时候我们可能刚开始认知各种各样的世界场景中的对象.
有一天,我们坐在家门口玩耍,每隔一段时间,就有一辆车从我们家门口经过,我们看到了车身的正侧面,然后慢慢的目睹车辆不断的远去.这一幕的景象,成年后的我们可以用视频记录下来,然后逐帧的对场景进行分析与归纳,从而得出一些有用的提示.在这样的分析过程中,场景中的背景几乎是不变的,opencv中我们对连续的两帧图像进行差值计算就得到了,明显的运动目标.所以在儿童阶段的识别学习过程中,我们可以认为静态背景是纯白色的或者纯黑色的无关紧要.然后我们得到的是连续几百帧或者更多,一辆车从离自个很近到离自个很远逐渐逝去的不同角度的连续的目标区域图像.从这个案例可以看出,我们无法证明静态图片和3d连续视觉图片那一台才是人脑识别系统的必要条件,但是我们可以明确的知道,我们幼年的经历中是肯定有这样的连续观察的一幕,这个是孤立的静态图片无法做到的.但是我们人脑识别能够做到的是,无论那一帧静态图片我们都能识别出图中的车辆.
再举一台例子,一台人无论穿着什么颜色的服装,无论旋转成什么角度,摆出什么样的动作,我们都能清楚的认识到他是一台人.跟上面车辆的例子一样,我们所有人都经历过人的各种动作的连续动态渐变的视觉场景过程(用数据分析法来描述就是视频录制学习过程),所以无论一台连续中的场景中的任意一帧静态图片我们都能识别出场景中的人物对象.
实现人工智能视觉识别的终极目的就是完美的泛化能力,像人脑一样任意场景任意静态图片都能识别出具体的对象出来.
反过来思考,目前人工智能算法的静态图片集训练法跟我所举的例子相对比,似乎不是实现泛化识别的充分条件,因为目前无法做到任意角度,任意远近都能准确识别出一台任意场景中的目标,也就是没有泛化能力.如果我们确定了静态图片集的训练方法与人类天然的学习过程的观察方法有着巨大的差异,确定了静态图片集的训练方法不是真正的充分条件.那么我们现有的神经网络算法永远解决不了视觉识别的泛化问题也是很显而易见的,因为从数据源开始他就缺少了充分条件,无法解决终极目标就是再正常不过的事情了.其实隐含的缺陷就是,计算机并没有拥有人类儿童一样丰富的视角信息与随时动态的观察角度(本质就是360度无死角的采样学习,遮挡学习),所以我隐隐的感觉到目前的 神经网络算法在于人脑逻辑的对比上存在巨大的缺陷,这也许就是研究者几十年都还没有完美解决泛化学习的所犯的哲学错误而不是算法错误.
我有很多的总结和思考,第一篇文章先抛砖引玉,欢迎大家激烈讨论,后续还有更多的结合案例并进行人脑思维辩证推敲与反推的文章.我觉得从人脑智能算法可解释性的方向来研究人工智能是最有希望取得重大突破的方向,也是将来实现安全可靠的人工智能解决方案必须解决的问题
充分必要条件的重要性不用我多说了吧,他的重要性就好比没有o原子永远无法形成水分子一样.我们从数学科学的角度来进行探索与推敲进一步进行论证,我想一定会有很大的收获.看过很多神经网络的算法方面的知识,类似我提出的这样的命题几乎没有人提过也没有人尝试着去证明,我认为这是极其严重的失误.我认为静态图片只是连续动态图片的子集,所以他极其的不充分以至于我们无法得到完美的解.
使用道具 举报
| 来自北京 用Deepseek满血版问问看
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影