您当前的位置: 首页 > 教育培训 >> 通知书

有了人工智能机器视觉练成火眼金睛

2020-10-18 18:13:10
有了人工智能,机器视觉练成“火眼金睛”!

在《一文了解“机器视觉”》中提到:“随着智能制造的发展和‘工业4.0’时代的到来,机器视觉作为实现工业自动化和智能化的关键核心技术,正成为人工智能发展最快的分支之一。”今天麦姆斯咨询来谈一谈机器视觉与人工智能的关系。

人工智能时代,机器视觉先行!

从饮毛茹血的原始社会,到钢筋混凝土的城市森林,人类发明创造了无数不同的工具,不断完善和改变人们的生活环境,推进社会的文明发展。长期以来,制造具有智能思想的机器一直是人类的终极梦想。1956年,“人工智能(Artificial Intelligence,AI)”这个词首次出现在达特茅斯会议上,标志着其作为一个研究领域的正式诞生。2016年,AlphaGo打败了世界围棋冠军李世石,一时间“人工智能”名声大噪,相关产业进入爆发式发展阶段。

简单来说,人工智能的研究,就是要通过智能机器,延伸和增强人类在改造自然、治理社会的各项任务中的能力和效率,最终实现人类与机器和谐共生共存的社会。这里说的智能机器,可以是一个虚拟的或者物理的机器人。与人类几千年来创造出来的各种工具和机器不同的是,智能机器具有自主的感知、认知、决策、学习、执行和社会协作能力,符合人类情感、伦理与道德观念。当然,这种“类人智能”的机器以目前的人工智能技术还远达不到。迄今为止的人工智能系统都还只能实现特定功能的专用智能,虽然目前主流研究仍然集中于弱人工智能,不过已取得显著进步,如机器视觉、语音识别、图像处理和机器翻译等方面取得了重大突破,甚至可以接近或超越人类水平。

人类主要通过五官来感知与外界世界的信息,其中80%以上的信息都通过眼睛获取。既然人工智能是要机器像人一样思考和行动,那么发展人工智能,首先就要先帮助机器“看懂这个世界”。机器视觉对于人工智能的意义,正如眼睛对于人类的价值,重要性不言而喻。机器视觉是开启人工智能进入现实世界的大门。

机器视觉 vs. 人类视觉

在高速流水线上,机器视觉系统可以每秒完成成百上千个标签的检查和验证;配备适当分辨率的相机和光学元件后,能够轻松检测小到人眼无法看到的物品细节特征;通过百万级数量图片的比对,可以从监控中抓出隐藏的罪犯;在医院里通过X射线拍照,可以找出隐藏在身体内的变异细胞……目前的某些机器视觉功能已经超越了人类视觉?

事实真是如此么?仔细想想,在某些场合,机器视觉却表现差强人意。比如,机器视觉可能很容易辨识出一对双胞胎的差异,但是在辨识这对双胞胎是男性还是女性?大概多大岁数?身高胖瘦几何?是在跳舞还是唱歌?这些在人类看来一目了然的事情,但对于机器视觉系统来说,似乎很难快速响应。因为,它只设计了“看脸”和“比脸”的程序和系统,其它能力在程序中如果没有设置,那么它就无法判断。要识别性别,需要一套识别性别的系统;要识别身高,需要另一套测量身高的系统;要识别年龄、识别动作,还需要编制另外的系统。而且,就拿人脸识别系统来说,还需要人站在固定的位置、需要辅助照明、需要脸部正面图像等……

双胞胎人脸识别

所以说,目前的机器视觉只是在特定的场合和特定的任务方面,基本能够达到甚至超过人类视觉。但在视觉的智能化和自动化方面,目前的机器视觉还无法和任何一个智慧生物的“视觉”相比。

通常意义上,人类视觉主要依靠眼睛和大脑来完成对物体的观察和理解,人类通过眼睛对物体和外部场景的彩色三维图像进行观察和捕捉;然后图像信息经视觉神经传给大脑进行分析和理解,大脑能够对视场内的物体自动进行空间分离,得到物体位置、尺寸、纹理、色彩和运动状态等详细特征信息,从而快速判断物体的名称、类别和分类等等属性信息。很显然对于目前的机器视觉来说还缺少对图像自动识别和理解的“智慧”。

人工智能助力机器视觉练成“火眼金睛”

学习是人类具有的很重要的一项能力,那么机器学习(Machine Learning,ML)就是让机器或计算机模拟或实现人类的学习行为,通过获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能技术的核心,结合机器视觉可以练就一双“火眼金睛”,帮助机器看懂和理解外部的真实世界。

机器学习最基本的做法,是使用算法来解析数据,并从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

人工智能、机器学习和深度学习的关系

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等。传统的机器学习算法在指纹识别、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。

深度学习(Deep Learning,DL)是近年来在机器学习领域出现的一个新的研究热点,其最早源于人工神经网络(ANN)的研究。它通过模仿人脑多层次的模型结构,对底层信息经过多层非线性变换,逐步提取低层特征形成更加抽象的高层表示,来发现数据的本质特征。深度学习相比于一般的浅层模型的机器学习方法具有多隐层结构,对大数据具有更好的拟合性。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。至今已发展出数种深度学习框架,如深度神经网络(DNN)、卷积神经网络(CNN)和深度置信网络(DBN)和递归神经网络(RNN),已在机器视觉、语音识别、自然语言处理、音频识别与生物信息学等领域取得突破性进展。

在机器视觉领域,深度学习不仅能够使机器检测缺陷更加高效,而且让机器视觉识别的过程更加精确。最重要的是,与使用基于规则方法的传统图像处理技术相比,深度学习可以在不容易表征或非线性的应用时赋予机器更高水平的可重复性。此外,深度学习由于不需要耗费大量时间进行人工特征的提取,大大提高了开发机器视觉程序的效率。

深度学习应用于零件精加工和表面检测

如今,在计算性能不断提升和算法不断突破的推动下,机器视觉软件中深度学习技术的使用正在兴起。例如,康耐视在2017年收购了瑞士人工智能公司ViDi Systems,针对工厂自动化应用推出了VisionPro ViDi套件,通过将人工智能(AI)与VisionPro和Cognex Designer软件结合在一起,该套件在复杂检测、零件定位、分类和光学字符识别(OCR)应用方面取得了突破进展。韩国SUALAB公司基于各个工业场所产生的实际图像数据的库,推出了SuaKIT检测软件,使用深度学习技术实现分割和分类的主要功能,可以大大降低检测过程中的错误率。德国MVTec公司也将深度学习技术融入了其著名的HALCON和MERLIC机器视觉软件产品中,现在其HALCON软件中就包含一个基于深度学习技术的OCR分类器,可透过一些预训练字体来使用,能实现比之前所有分类法更高的识别速度。此外,美国Cyth Systems公司也推出了专门为帮助没有机器视觉经验的用户进行产品检查和产品分类而设计的Neural Vision软件。随着越来越多的机器视觉公司在他们的应用中成功部署深度学习技术,深度学习技术与传统的机器视觉方法正形成有益的互补,将在市场上越来越流行。

当前市面上几款常见的具有深度学习功能的机器视觉软件

总之,人工智能的迅速发展,使得机器视觉“如虎添翼”。被训练成“火眼金睛”的智能机器视觉不仅能轻松解决传统机器视觉的“痛点”问题,还将具有胜任更多的检查和识别任务的能力,让机器真正地看懂世界。展望未来,除了工业领域,智能机器视觉还将在无人商店、自动驾驶、医疗诊断等领域掀起新风暴。

推荐会议:

2019年9月5日,麦姆斯咨询将在深圳会展中心举办『“微言大义”研讨会:机器视觉及工业检测』(同期展会:第二十一届中国国际光电博览会)。本次研讨会特邀机器视觉相关行业技术大咖、业界精英和企业高管深入交流和探讨,内容包含工业相机及核心元器件技术、3D成像与传感技术、机器视觉技术及应用等等,把脉机器视觉在工业及自动化领域未来发展趋势,带来最前沿的行业技术分享及创新成果展示!目前已邀请到知微传感、图漾科技、高德智感、曼普拉斯、驭光科技、Teledyne e2v、II-VI、亮锐(Lumileds)、普密斯、深浅优视等企业进行演讲。

原文链接:http://www.mems.me/mems/system_integrator_201908/8467.html

推荐阅读
图文聚焦