您好, 访客   登录/注册

基于BP网络的手写体数字图片特征提取

来源:用户上传      作者: 王晓娟 杨永昕 李超

  摘 要:本文主要研究了手写体数字的识别问题,选用了300组像素为的手写体图片,对其先进行归一化处理,之后提取了图像的7个不变矩(Hu矩)特征、均值、方差以及图像的字符势能,以它们作为图像的特性,用BP网络进行识别,识别效率达到80%以上。
  关键词:归一化;Hu矩;字符势能;BP网络
  DOI:10.16640/j.cnki.37-1222/t.2016.11.205
  1 引言
  手写体数字识别的研究,有助于考古学的发展,为考古某些缺失文字的识别奠定了一定基础。识别效率的高低是我们最为关心的问题。本文为了提高识别的正确率,选用了识别性能很好的BP网络。在图片处理方面,先进行了归一化,之后对归一化的图片提取了图片的Hu矩[1]、字符势能[2],用这些作为BP网络的识别对象,而不是直接去识别图像,缩小了识别对象的大小,并且掌握了对象的特征,识别更为快捷准确。
  2 图像的处理过程
  本文中,这些手写体图片都是在电脑XP系统的画图工具人为输入的。图像的大小都是。由于输入时,图片在所输入区域的位置不一样,图片本身的大小也存在差别,这些都对识别的结果有直接的影响。所以,本文就这两方面做了改进。具体的做法是,先提取图片数字的边缘,即数字的最左、最右、最上、最下的边界点,这样就把图片的数字区域提取出来了,之后把它扩大成我们需要的尺寸。这样数字的大小是一样的。然后再将这些数字部分放在我们固定大小的模板上。对图像做了这一系列的处理后,每个图片的大小是一样的,而且有数字的部分的大小也是一样的。
  3 BP网络
  BP网络是一种按误差逆传播算法训练的多层前馈网络[3],是目前应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出―模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法[4],通过反向传播来不断调整网络的权值和阀值,使网络的误差平方和最小。BP网络模型拓扑结构[5]包括输入层、隐含层和输出层。
  4 Hu矩,字符势能
  4.1 Hu矩
  Hu矩主要用到了2个不变矩作为矩特征,矩特征主要表征了图像区域的几何特征,又称为几何矩,由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。在图像处理中,几何不变矩可以作为一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。
  由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低,我做过手势识别,对于已经分割好的手势轮廓图,识别率也就30%左右,对于纹理比较丰富的图片,识别率更是不堪入眼,只有10%左右。这一部分原因是由于Hu不变矩只用到低阶矩(最多也就用到三阶矩),对于图像的细节未能很好的描述出来,导致对图像的描述不够完整。
  4.2 字符势能
  投影能表现图像的某种特征信息,指定方向上单条前景像素的个数。本文主要做了垂直方向的势能和水平方向的势能。
  垂直方向的势能,主要是记录图片的水平投影和垂直投影。本文所用的图片是最简单的黑白图片,这样的图片用矩阵表示只有0、1两种数字,黑色部分用1表示,白色部分为0.垂直方向的势能,记录的是图片中1所在的行标,图片中0的部分投影过来也用0表示。垂直方向的势能中的水平投影是投影过来的矩阵每行的和,垂直投影则是每列元素的和。水平方向的势能是记录的是图片中1所在的行标,图片中0的部分投影过来也用0表示。水平方向的势能中的水平投影是投影过来的矩阵每行的和,垂直投影则是每列元素的和。这样我们就得到了图片的字符势能。
  5 识别结果
  把图像归一中心化后,我们分别提取图片的Hu矩、均值、方差、字符势能,把这些量合到一起作为BP网络的输入量,用BP网络进行识别,表1是我们统计的识别结果。
  从表1中可以看出,识别的正确率还是不错的。只有数字5的识别正确率较低
  参考文献:
  [1]丁兴号,邓善熙.Hu矩和Zernike矩在字符识别中的应用[J].工具技术,2003(03).
  [2]Bo Li, De-Shuang Huang, Chao Wang, Kun-Hong Liu. Feature extraction using constrained maximum variance mapping[M]. Pattern Recognition. 2008,Volume 41.Pages:3287-3294.
  [3]魏国辉,孔英,李庆玲.反向传播网络与径向基网络函数逼近的仿真比较[J].济宁医学院学报,2011.
  [4]从爽,面向MATLAB工具箱的神经网络理论与应用.3版.合肥:中国科学技术大学出版社,2003:64-158.
  [5]张敏,赵金成.全局优化神经网络拓扑结构及权值的遗传算法[J].大连大学学报,1999.
  作者简介:王晓娟(1985-),女,河北张家口人,研究生,助教,研究方向:神经网络。
转载注明来源:https://www.xzbu.com/1/view-7371911.htm