浅谈计算机视觉及其在电子商务中的应用
来源:用户上传
作者:李翔
摘 要:人工智能(AI)已经成为一种热门、一种潮流、一种趋势,各行业已经形成了“谁掌握AI,谁就掌握未来”的默契。而计算机视觉(CV)作为人工智能最有力的表现形式,为人工智能技术的顺利落地开辟了道路。计算机视觉已广泛应用于医疗、安防监控、交通、工业生产、互联网、游戏、军事等各个领域。在电子商务领域中,为了提高运营效率,提升客户在线购物的满意度和体验度,各大电商巨头们也不断创新和变革,其中计算机视觉技术发挥了重要作用。
关键词:计算机视觉;电子商务;人工智能;应用
视觉对于人类是必不可少的,同样视觉对于计算机也是不可或缺的。但是知之非艰、行之惟艰,计算机视觉的实现没有想象中那么简单,不像人类与生俱来的本领,它需要经过推理、计算、建模、学习等一系列过程。经过五六十年的努力,科学家们发挥聪明才智,计算机视觉已经在图像识别、分类、检测、分割、搜索、合成等方面取得了巨大成果。在日常生活中,人们随处可见计算机视觉带来的便利,比如指纹识别、人脸识别、扫码支付、车辆识别、美颜照相、医疗CT和MRI等。同时,在人人网购的当代,计算机视觉在电子商务领域的贡献也是可圈可點。本文针对计算机视觉的相关概念及应用展开论述,希望对读者有所帮助。
一、计算机视觉
1.概念
计算机视觉,是对生物视觉的一种模拟,是研究让机器如何“看”的学科,是用摄影机和计算机代替人眼对目标进行跟踪、识别、分析、处理等,它的目标和挑战是具有人类一样的视觉来观察和理解事物。但需要说明的是,计算机视觉系统并不一定按照人类视觉系统那样来处理信息,它会根据计算机本身的特点来处理,比如图像感知、图像预处理、图像特征提取、检测分割等。
2.视觉理论方法的发展
帮助计算机拥有“视觉”,让它能够理解图片、看懂图片,是艰巨的、富有挑战性的任务。计算机视觉历经五六十年的不断更新,其方法理论的发展也是坎坷不平、好事多妨的。
计算机视觉随着人工智能的诞生而兴起,最早要追溯到19世纪60年代,美国科学家拉里·罗伯茨(Larry Roberts)提出计算机视觉识别模式与生物的识别类似,认为边缘是用来描述物体形状的最关键信息。20世纪70年代,出现了计算机视觉的代表性人物——英国的戴维·马尔(David Marr),他提出了计算机视觉由计算理论、表达和算法、硬件实现三个层次组成。马尔认为计算理论应该充分挖掘图像所蕴含的对应物理空间的内在属性,运用这些属性来实现物体的三维表达。
20世纪80年代,出现了主动视觉理论和定性视觉理论,这些理论认为计算机视觉应该是主动的,有目的性的。同时在这个时期,偏重计算和数学的计算机视觉方法开始发展,如图像金字塔、Canny边缘检测、离散马尔科夫随机模型、三维距离数据处理等。20世纪90年代,计算机视觉识别、检测、分割、分类、跟踪等技术蓬勃发展。
到21世纪初,计算机视觉已然是个大学科了,比较活跃发展的有计算摄影学、基于特征的识别方法等。2012年开始,随着ImageNet竞赛中卷积神经网络AlexNet的出现,计算机视觉进入了一个全新的时代。神经网络和深度学习算法几乎占领了计算机视觉各个领域,赋予了该领域无限生机和可能,特别是基于卷积神经网络的深度学习算法,发挥了重要作用。
深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,是通过简单的概念构建复杂的概念。卷积神经网络(CNN)是深度学习经典的模型之一,由输入层、卷积层、激活层、池化层、全连接层、输出层组成。图像输入后,首先经过卷积层和激活层进行特征提取,然后进入池化层进行特征统计和过滤,最后通过全连接层输出结果。目前,效果较好的经典的视觉卷积神经网络模型有2012年的AlexNet、2014年的VGGNet和GoogleNet、2015年的ResNet、2017年的SENet等,其中SENet的分类结果top-5错误率降低到了2.25%,这些模型的演变和发展,为计算机视觉带来了全新格局。
二、计算机视觉关键任务和技术
计算机视觉研究分为三个层次:低层特征研究,以识别和提取内容简单图像中的性能特征为目标;中层语义特征表达,除了能够识别图像中的对象,还需要分析、区分图像中不同区域的语义信息;高层语义理解,能够分析和理解复杂图像的语义。
目前,计算机视觉比较热门的关键任务有图像分类、目标检测、图像分割、目标跟踪、图像搜索、图像美化、三维重建等。
1.图像分类
图像分类是计算机视觉中最基础的一个任务,是通过算法对输入的图像进行特征提取,然后判断并将其归分到已知的一个类别中。比如一张哈士奇狗的图片,计算机通过算法将其归到“哈士奇”类别中,而不是藏獒等其它种类狗,也不是其它物体类别。目前大部分图像分类技术在ImageNet数据集上训练,ImageNet数据集有超过1400万的图像,包含2万多个类别,计算机的图像分类技术已经远远超过了人类。
2.目标检测
目标检测与图像分类相类似,但有区别,它们的侧重点不同。图像分类侧重于图像的内容是什么,而目标检测侧重于图像中特定的目标,既要识别是什么又要标出目标位置,包含了分类和定位两个子任务。比如一张有猫和狗的图片,通过目标检测算法,可以识别猫在哪里、狗在哪里。基于深度学习的卷积神经网络Faster-R-CNN模型,是计算机目标检测的经典。
3.图像分割
图像分割是计算机视觉传统领域,是以像素为单位,根据颜色和纹理等特性,对每个像素进行分类和划分,将图像划分成不同的子区域。同样图像分割方法也从阈值法、水平集法、GraphCut法等等传统方法转到了深度学习法,较热门有全卷积神经网络(FCN)、深度卷积神经网络(DCNN)等。 4.目标跟踪
目标跟踪,是对视频或者现实场景中的对象进行检测和跟踪,常应用于视频监控、无人驾驶等。传统的目标跟踪算法分为生成算法和判别算法。生成算法针对指定目标进行跟踪,而判别算法考虑目标和背景的区分来跟踪,后者鲁棒性更高。目前常用的深度学习目标跟踪算法有基于堆栈自编码器(SAE)的算法、基于卷积神经网络(CNN)的算法等。
5.图像搜索
图像搜索是一个比较复杂的过程,常见的应用平台有Google、百度等搜索平台以及淘宝、京东等在线购物平台。传统的图像搜索方法是哈希编码,而将其结合深度学习法,可以让图像搜索更高效。
6.图像美化
生活中常见的各种美颜、滤镜等功能都属于计算机图像美化技术,通过计算机视觉算法,不仅可以给图像降噪、对比度增强、超分辨处理、修复瑕疵等,还可以快速制作各种风格化效果。近几年,基于深度学习的人脸算法,可以很快很稳定地识别人脸属性,并可以灵活编辑和转换,诸如此类的美颜APP风起云涌。
7.三维重建
三维重建,是运用一个或多个场景图片或视频来重新建立三维模型,该技术在地图、电影、游戏等领域应用广泛。
三、计算机视觉在电子商务中的应用
我国电子商务始于20世纪90年代初,经过30年的发展,随着互联网技术和计算机技术的不断更新,它的成长是迅速的,它的变革是巨大的,同时人们对电子商务的要求也随之越来越高。“足不出户”购物的便利,已经不是电子商务在线购物的唯一要求。在线购物的随时随地性、寻找商品的快速准确性、商品描述的真实性、网络购物的安全性、快递物流的高速及时性等等,都是人们对电子商务提出的更高要求。为提高消费者的在线购物满意度,计算机视觉在电子商务中的主要贡献有商品识别与搜索、内容监管、智能快递等。
1.商品识别与搜索
商品识别与搜索,即“以图搜图”,是计算机视觉在电子商务领域中的重要应用。特别是在这移动电商的时代,“以图搜图”极大提升了人们的购物效率,同时也增加了商品的附加值。传统的商品文字搜索,只能带人们找到与输入的文字描述相关的产品,如果文字描述不准确或者跟商品设置的关键词不匹配,将难以搜到自己想要的商品,即使文字描述准确且与商品关键词匹配,也要花一段时间才有可能找到。而运用图片搜索商品,就显得方便快捷很多,消费者通过移动设备,将想要的商品图片或者类似款式图片上传到网购平台,平台的视觉计算功能通过提取图片的颜色、款式、形状等特征,为用户快速地找到相同的或相似的商品。另外,“以图搜图”也增强了线上线下销售的联系,为消费者提供自主购物体验的同时,也促进了商家线上线下营销模式的融合。
2.内容监管
电商领域的内容监管是必要的,不仅有利于维护商家和消费者的合法利益,而且有利于保护电商平台的生态健康。传统的人工监管工作量太大,特别是对于现在大规模数量商品和信息,人工监管费时费力费成本。在此,计算机视觉的识别、分类、检测技术就显得非常重要、有效了。比如违规商品监管,运用视觉算法对易燃易爆品、涉黄低俗品、部分药品等电商禁止销售商品进行识别、检测,就像市场监督管理员一样,对线上商品进行严格高效摸排,一旦发现违规品,可直接下架、扣分、封店等。比如违禁词、敏感词监管,有些商家会把无法加入商品标题中的违禁词、敏感词放到图片或视频中,计算机视觉的文字识别技术可以很好地消除商家的侥幸心理。再比如重复、侵权图片监管,计算机视觉技术可以对电商平台中出现一样的重复的图片进行监管,可以有效监督商家盗图行为,另外计算机视觉中常用的人脸识别技术可以发现商家非法使用明星脸做广告宣传的图片,以此有效保护了名人明星的权益。
3.智能快递
快递和电子商务虽然不属于同一行业,但是它们紧密相连。电子商务从诞生之日起,就需要快递物流的支持,快递行业也随着电子商务的兴起和发展而有了新的机遇。然而,电商在线购物消费数量在日益增长,人们对在线购物体验的要求日益提高,这就需要更高效化、智能化的快递服务来支撑。运用计算机视觉技术,可以快速识别收寄件人信息、快递面单号等,相比较传统的手写面单,现在的电子面单更快更准确。另外,基于计算机视觉的快递分拣机器人,可以对快递包裹进行自动识别、分类、搬运等,大大降低了人力成本和资金成本。
四、总结
21世纪是智能化的时代,各种智能产品和智能服务正在走进人们生活的方方面面,其中计算机视觉技术功高不赏,特别是深度学习和卷积神经网络的引入,更是让其突飞猛进。本文介绍了计算机视觉的相关基础知识,以及在电子商务领域中的应用,希望能帮助读者了解计算機视觉,投入到更深的研究中。
参考文献:
[1]李彦冬.基于卷积神经网络的计算机视觉关键技术研究[D].电子科技大学,2017.
[2]叶韵.深度学习与计算机视觉:算法原理、框架应用与代码实现[M].机械工业出版社,2017.
[3]西蒙J.D.普林斯.计算机视觉模型、学习和推理[M].机械工业出版社,2019.
[4]Richard Szeliski.计算机视觉-算法与应用[M].清华大学出版社,2012.
[5]倪晨旭.计算机视觉研究综述[J].电子世界,2018(01):91,93.
[6]刘哲.论计算机视觉技术[J].数字化用户,2019(08):159.
[7]汪亚楠.基于卷积神经网络的电商图像识别研究[D].华中科技大学,2018.
[8]马雪东.基于深度学习的电商产品图像识别系统的研究与实现[D].北京邮电大学,2017.
[9]卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016(01):1-17.
[10]邓小桂,黄睿,何金成,蒲海波.人工智能:快递行业创新发展的新路径[J].网络安全技术与应用,2019(11):101-102.
[11]林剑宏.浅析人工智能技术在电子商务领域中的应用[J].中国商论,2019(01):19-20.
转载注明来源:https://www.xzbu.com/3/view-15202295.htm