«上一篇
文章快速检索     高级检索
下一篇»
  智能系统学报  2020, Vol. 15 Issue (1): 144-151  DOI: 10.11992/tis.201904028
0

引用本文  

郭晓峰, 王耀南, 毛建旭. 基于几何特征的IC芯片字符分割与识别方法[J]. 智能系统学报, 2020, 15(1): 144-151. DOI: 10.11992/tis.201904028.
GUO Xiaofeng, WANG Yaonan, MAO Jianxu. IC chip character segmentation and recognition method based on geometric features[J]. CAAI Transactions on Intelligent Systems, 2020, 15(1): 144-151. DOI: 10.11992/tis.201904028.

基金项目

国家自然科学基金项目(61733004,61573134,61433016);国家科技支撑计划项目(2015BAF13B00)

通信作者

毛建旭. E-mail:maojianxu@hnu.edu.cn

作者简介

郭晓峰,硕士研究生,主要研究方向为模式识别、机器视觉和图像处理;
王耀南,教授,博士生导师,中国工程院院士,主要研究方向为电动汽车控制、智能控制理论与应用、智能机器人。曾获国家科技进步二等奖、中国发明创业特等奖、省部级科技进步一等奖、省部级科技进步二等奖。取得国家专利12项。出版学术专著多部。发表学术论文360余篇;
毛建旭,教授,博士生导师,主要研究方向为计算机视觉、图像处理与模式识别

文章历史

收稿日期:2019-04-12
基于几何特征的IC芯片字符分割与识别方法
郭晓峰 1,2, 王耀南 1,2, 毛建旭 1,2     
1. 湖南大学 电气与信息工程学院,湖南 长沙 410082;
2. 湖南大学 机器人视觉感知与控制技术国家工程实验室,湖南 长沙 410082
摘要:针对IC芯片字符的分割与识别问题,提出了一种基于字符几何特征的分割方法和一种基于字符最小外接圆的归一化与重定位方法,使用基于像素差分的模板匹配完成识别。首先,对芯片图像进行直方图均衡化处理,并利用辅助圆进行中线定位和图像校正,定位得到ROI区域并进行均值二值化处理。随后,对二值化ROI图像进行字符分割,以字符的几何特征作为判断条件,从而完成了对缺陷字符的正确分割。之后,对单字符图像提取最大轮廓,利用其轮廓的最小外接圆进行字符的归一化与重定位。最后,对归一化的字符进行差分识别。通过采集4种芯片样本进行实验,结果表明,该方法能够实现芯片字符的准确分割,对于缺陷字符的分割准确率达90%;能够快速精准地识别芯片字符,单字符平均识别时间为4.6 ms,识别准确率达到99.4%。
关键词IC芯片    字符分割    字符识别    横纵比    面积比    几何特征    最小外接圆    像素差分    
IC chip character segmentation and recognition method based on geometric features
GUO Xiaofeng 1,2, WANG Yaonan 1,2, MAO Jianxu 1,2     
1. College of Electrical and Information Engineering, Hu’nan University, Changsha 410082, China;
2. National Engineering Laboratory for Robot Visual Perception and Control Technology, Hu’nan University, Changsha 410082, China
Abstract: To solve the problem of character segmentation and recognition in IC chip, a method based on character geometric features and a normalization and relocation method based on the smallest circumferential circle of characters are proposed. The recognition is accomplished by template matching based on pixel difference. Firstly, the histogram equalization is applied to the chip image, and the auxiliary circle is used to locate the center line and correct the image. The ROI region is located and processed by mean of binarization. Subsequently, the binary ROI region image is segmented into characters, and the geometric features of the characters are used as the judgment conditions, thus the correct segmentation of defective characters is completed. Then, the maximum contour is extracted from the single character image, and the minimum circumscribed circle of the contour is used to normalize and relocate the characters. Finally, the normalized characters are differentially recognized. Four kinds of chip samples are collected for experiments. The results show that the method can achieve accurate segmentation of chip characters, and the accuracy of defective characters is 90%. The average recognition time of single character is 4.6 ms, and the recognition accuracy is 99.4%.
Key words: IC chip    character segmentation    character recognition    aspect ratio    area ratio    geometric characteristics    minimum circumscribed circle    pixel difference    

随着网络时代的到来,电子类消费产品占据了人们生活中的各个角落,电子制造行业也正迎来一个蓬勃发展的时期[1]。早期的电子制造行业主要以劳动密集型产业为主,人工进行芯片字符识别、电子部件组装、芯片质量缺陷检测等工序[2-5]。随着机器换人大潮的来临,电子制造行业也越来越朝向自动化信息化目标迈进,而对于芯片喷码的自动识别就是其中非常重要的一步。

针对芯片字符的识别,国内外研究人员做了一些研究成果。MacLean等[6]提出使用图像梯度提取IC芯片图像的相关系数值,并对其改进,将传统的相关系数计算简化成四项加减运算,最后通过金字塔方法来加快芯片的匹配速度。Jiang等[7]提出利用灰度互相关法对IC芯片标识字符进行检测,进行二值化后使用三次形态学中的膨胀与腐蚀,随后使用图像细化对芯片字符进行细化并提取特征,最后使用归一化互相关方法来识别文字,但受制于计算机系统硬件条件,算法运算较慢。Chen等[8]提出了一套自动化IC芯片标识检测系统,使用RS232连接电脑与MCU,CCD相机拍摄图像后通过MCU传送给电脑,但其设定条件为不考虑IC芯片角度偏移,使用人工设定的检测ROI区域。国内方面:张静平[9]提出了一种集合字符面积特征、周长特征、位置信息特征和Hu矩特征的复合判断识别方法,但该方法由于特征选取过多,流程步骤复杂造成最终识别时间在50 ms左右;胡洋[10]利用BP神经网络对芯片字符进行训练和识别,但受制于机器学习特性,训练集大训练时间长,实时性不高。

综上分析,现有对IC芯片标识字符识别取得了一些成果,但仍存在一些问题[11-12],例如芯片成像时会有光照不均等干扰,识别算法对于不同大小、不同处理效果的字符要具有鲁棒性,算法应用于电子生产现场需要实时性强等。

针对上述芯片字符分割中,一般方法对于缺陷字符分割效果差的问题,提出了一种基于字符几何特征的分割方法,能够准确地实现缺陷字符的分割。针对当前机器学习字符识别方法实时性不强,而模板匹配方法存在前期处理要求高的问题,本文提出了一种基于字符轮廓最小外接圆的归一化与重定位方法,保证了基于像素差分的模板匹配识别方法对字符的高效准确识别。

1 芯片字符识别过程分析

芯片图像一般由LOGO区、字符识别区和辅助定位圆几个部分组成,如图1所示。

Download:
图 1 芯片区域组成 Fig. 1 Chip area composition diagram

芯片字符识别的一般流程为:1)预处理,芯片图像表面光照不均,对比度不强,需要先对图像进行预处理;2)芯片定位与ROI分割,受传送带机械抖动等因素干扰,图片中芯片的位置不确定;3) 字符分割;4)字符识别。

从芯片图像中可知芯片图像有几个缺点:

1)芯片表面光照不均,表面左右呈现若干亮区和暗区;

2)受传送带机械振动等原因,图片中芯片的位置不确定,存在倾斜、偏角;

3)芯片背景存在较大干扰,其背景存在大量噪声纹理,且与芯片表面纹理相近,不易分离前后景。

这些缺点会造成芯片前期处理难度大,预处理后可能会造成字符缺陷问题,从而导致分割效果差,识别错误。

2 字符分割与识别算法

针对以上芯片字符特点,本文提出一种字符分割与识别算法,算法整体流程图如图2所示。

Download:
图 2 算法整体流程图 Fig. 2 The whole flow chart of the algorithm
2.1 预处理与ROI定位

1)预处理

拍摄得到的芯片图像存在对比度低,图像质量不佳等问题,首先对其进行直方图均衡化[13-14]以提高对比度提升图像质量。均衡化前后效果图及直方图对比如图3所示。

Download:
图 3 均衡化及直方图对比 Fig. 3 Equalization and histogram comparison

2)中线定位与图像校正

利用辅助定位圆对芯片进行中线定位和图像校正。首先利用圆检测得到两辅助圆使用Hough圆检测[15-17]得到圆心位置,根据得到的两圆心坐标 $\left( {{x_1},{y_1}} \right)$ $\left( {{x_2},{y_2}} \right)$ 得到芯片中线及中线的偏角为:

$\alpha = {\rm{arctan}}\frac{{{y_1}{\rm{ - }}{y_2}}}{{{x_1}{\rm{ - }}{x_2}}}$

随后对图像进行校正,校正后如图4所示。

Download:
图 4 图像校正后 Fig. 4 After image correction

3)ROI区域分割与二值化

根据芯片模型先验知识获得字符区域ROI,得到字符区域ROI后需要对其进行二值化处理。为了提高阈值处理的鲁棒性,本文采用均值阈值进行二值化处理,首先计算图像像素灰度均值:

$ T = \frac{{\displaystyle\sum\limits_{x = 1}^M {\displaystyle\sum\limits_{y = 1}^N {I\left( {x,y} \right)} } }}{{M \times N}} $

式中: $I\left( {x,y} \right)$ 为原图像上坐标为 $\left( {x,y} \right)$ 处的灰度值;MN分别为图像像素行数和列数。之后根据像素均值选定阈值进行二值化处理:

$ I\left( {x,y} \right) = \left\{ {\begin{array}{*{20}{l}} {255,}&{I\left( {x,y} \right) < K \times T}\\ {0,}&{{\text{其他}}} \end{array}} \right. $

式中K为比例系数。通过实验确定K取1.5时,处理效果较好,阈值处理效果如图5所示。

Download:
图 5 预处理后ROI图像 Fig. 5 ROI image after pretreatment
2.2 字符分割

字符ROI区域定位后需要对区域内的字符分割成单个字符,字符分割的好坏直接影响着字符识别的效果,因此这一步骤至关重要。但在前期存在印刷错误或水渍、污渍、擦伤、划痕等缺陷,造成后期图像处理后字符存在黏连、断裂等缺陷,如图6所示。这就会造成将一个字符分割成两个,或者将两个字符分割成一个,从而造成字符的错误分割。

Download:
图 6 缺陷类型及几何特征 Fig. 6 Defect types and geometric characteristics

本文提出了一种基于字符几何特征的分割方法,首先,对ROI区域字符进行垂直投影,并获取各个连通域的最小外接矩形。随后利用字符的几种几何特征进行分割运算。提取字符的几种几何特征包括:

1)横纵比

取字符的最小外接矩形,纵轴长A与横轴长B的比值L

$L = \frac{B}{A}$

2)面积比

取二值化字符图像的面积 ${S_{{\rm{char}}}}$ 与其外界矩形的面积 ${S_{{\rm{R}}{\rm{{\rm{ect}}}}}}$ 的比值 $S$

$S = \frac{{{S_{{\rm{char}}}}}}{{{S_{\operatorname{{\rm{Re}}} {\rm{ct}}}}}}$

字符的几种几何特征示意如图6所示。

通过对字符分析可以知道,一共有3种类型的字符:1)特殊字符,例如“—”和“·”,这类字符在分割的时候可以直接剔除;2)正常字符,这类字符无需处理,正常分割即可;3)缺陷字符,包括断裂和黏连两种,对于断裂字符需要将两个断裂字符合并分割,对于黏连字符需要对一个黏连字符进行拆分分割。

不同类型字符其几何特征有所不同,利用几何特征进行字符种类判断并进行不同分割运算。整个运算流程如图7所示。

Download:
图 7 基于几何特征的字符分割方法流程图 Fig. 7 Flow chart of character segmentation method based on geometric features

对于缺陷字符的分割,使用传统的投影法和连通域分析法得到的分割结果如图8(c)8(e)所示,对比本文方法的分割结果如图8(f)所示,可以知道本文对于缺陷字符能够得到较好的分割效果。

Download:
图 8 几种分割方法的过程图和结果图对比 Fig. 8 Comparison of process images and results images of several segmentation methods
2.3 归一化与重定位

分割出单个字符后,就要进行差分识别。但在这之前,还需要解决2个问题:

1)字符大小不一的问题:由于不同行列的字符,其字符大小不同,因此无法直接使用基于像素的差分运算。只有将不同行的字符归一化缩放到统一尺寸后,才可以进行基于像素的差分运算。

2)字符定位存在偏差的问题:由于进行单个字符分割时,存在某些字符周围间距不一的情况,从而使得字符不在图像中心位置,无法直接进行字符的差分识别运算。

郭晓峰等[18]曾提出基于字符最小外接圆的二次定位方法,可以对字符进行归一化缩放运算,解决字符大小不一的问题;同时根据最小外接圆的圆心进行字符的重定位运算,以解决字符存在的定位偏差的问题。方法步骤如下:

1)载入已经二值化处理的待归一化的单字符图像,如图9(a)所示,其中原字符的图像中心点如图中红色所示。图中共展示4张图片,其中一个小型字符,一个中型字符和两个大型字符。

2)提取字符图像的所有轮廓,并依次计算各个轮廓的面积大小,保留其中最大的轮廓即最大外轮廓,如图9(b)所示。

3)寻找外轮廓的最小外接圆,如图9(c)所示,外接圆圆心如图中绿色圆点所示。圆形具有稳定性和唯一性,因此选择使用圆形而不是其他形状(例如最小外接矩形等)。

4)根据上一步得到的最小外接圆的圆心和半径,对字符图像进行归一化与重定位,结果图如图9(d)所示。

Download:
图 9 归一化与重定位过程图 Fig. 9 Normalization and relocation process image
2.4 差分识别

完成归一化与重定位处理后,对字符图像进行基于像素的差分识别。差分识别的运算流程图和实验效果图如图10所示。首先载入已归一化和重定位的待识别字符图像,随后与已制备好的模板图像进行基于像素的差分运算,得到差分的结果图 $S\left( {x,y} \right)$

$ S\left( {x,y} \right) = \left\{ {\begin{array}{*{20}{l}} {255,}&{\left| {{I_1}\left( {x,y} \right) - {I_2}\left( {x,y} \right)} \right| \leqslant K}\\ {0,}&{{\text{其他}}} \end{array}} \right. $

式中: ${I_1}\left( {x,y} \right)$ 为待识别字符图像; ${I_2}\left( {x,y} \right)$ 为模板图像; $K$ 为阈值设定为20。最后统计结果图中像素值为0的像素数量,即为待识别字符与该模板的像素差分值。则总共n个模板图像共可以得到n个像素差分值,其中值最小的模板对应的类别即是该待识别字符的类别。

Download:
图 10 差分识别流程图 Fig. 10 Differential recognition flow chart
3 实验结果与分析

本文使用Baumer VCXG13AM型CCD面阵工业相机进行芯片样本图像的采集,图像分辨率为:1 280×1 024。

实验使用4种51单片机芯片作为实验样本,型号分别为:型号1(STC89C516RD)、型号2(12C5A60S2)、型号3(STC89C52RC)和型号4(STC12C5410AD)。样品的实拍图及大小对比如图11所示。实验所用计算机CPU为intel core i5- 4 200 MB,主频2.5 GHz,通过Visual Studio 2013和Open CV2.4.9库编写C + +程序进行测试,对芯片进行了识别算法验证。

Download:
图 11 芯片样本图与大小对比 Fig. 11 Comparisons of chip sample images and sizes

4种芯片样本中,除去3种特殊字符,共有字符种类24种。其中:数字字符种类为9种,没有数字7;字母字符种类为15种,分别为:A、C、D、G、H、I、K、N、P、R、S、V、W、X和Y。

3.1 字符分割实验

对40张ROI字符区域图像进行分割实验,其中正常字符的图片为20张,包含有缺陷字符的图片20张,使用本文提出的分割方法进行分割实验,并将结果与传统投影法和连通域分析法的结果进行对比,如表1表2所示。

表 1 正常字符分割结果 Tab.1 Normal character segmentation results
表 2 缺陷字符分割结果 Tab.2 Defect character segmentation results

对于正常字符的分割,本文方法与传统方法的正确率都很高。而对于缺陷字符的分割,本文方法相较于传统分割方法,分割正确率大幅提升。

3.2 字符识别实验

通过本系统对4种电子芯片样本进行采集,每种50张,共200张样本图像(共计:数字3 450个,字母2 650个)进行字符识别实验。

首先对于单个字符进行分析,将识别实验的结果按照每个字符种类分类汇总,数字识别情况如表3所示,字母识别情况如表4所示。

表 3 数字识别结果 Tab.3 Recognition results of numeric characters
表 4 字母识别结果 Tab.4 Recognition results of alphabetic characters

通过分析可知,无论数字还是字母平均识别率都很高,都在99%以上。其中在字母和数字共24个类中,识别率在100%的有17个类(数字5个类,字母12个类),而最低识别率也都在97%以上。数字和字母的最低识别率均出现在“1”与“I”之间的错误识别,这是由于两者的字形非常相似,非常容易出现失误识别的情况,特别是对于型号4的芯片。4号芯片相对其他3种芯片,其体积更小成像ROI分辨率更小,这对于相似字形“1”与“I”的识别来说更加困难。其他相似字形出现较多错误识别的情况还有:“0”与“D”等。总体来讲全部字符的平均识别率为99.42%,单字符全流程平均识别时间为4.63 ms。

按照缺陷的严重程度,采集不同程度缺陷的图像,使用基于像素差分的字符识别方法验证缺陷字符识别率情况,绘制得到不同缺陷程度下算法的平均识别率情况如图12所示。缺陷程度D表达式为

$D = \left( {\frac{{\left| {{S_1} - {S_2}} \right|}}{{{S_1}}}\Bigg/5} \right) \times 5$

式中: ${S_1}$ 表示该字符的模板像素个数; ${S_2}$ 表示缺陷字符的像素个数;符号“/”表示取商运算。

Download:
图 12 缺陷字符识别率 Fig. 12 Defect character recognition rate

图12可以看到,当字符的缺陷程度小于18%时可以保证字符的平均识别率在95%以上。这是由于本章使用的是基于像素的差分识别方法,最大程度的利用了字符内的每一个像素信息,因此方法对于缺陷的字符识别具有一定鲁棒性。

3.3 实验效果对比

本文基于像素差分的模板匹配方法与文献[10]使用的BP神经网络相比结果如表5所示。本文识别率为99.4%高于文献[10]的98.5%,识别时间为4.6 ms低于文献[10]的7.5 ms。文献使用3 100个训练样本进行长时间的网络训练,而这些都是本文方法不需要的,本文的方法以更加简单、快速的方法高准确地识别芯片字符。

表 5 对比测试结果 Tab.5 Comparison of test result
4 结束语

本文针对芯片字符分割和识别问题,提出了一种基于字符几何特征的分割方法和基于像素差分的模板匹配识别。实验结果表明,该方法能够实现芯片字符的准确分割,对正常字符分割准确率达100%,缺陷字符达90%;能够快速精准地识别芯片字符,单字符平均识别时间为4.6 ms,识别准确率达到99.4%,且该方法具有一定鲁棒性。

目前该算法在其他多样化缺陷字符分割和相似字符识别准确度等方面存在进一步优化空间,这将是下一步研究的重点。

参考文献
[1] 吴文昌. 中国IC产业分析综述[J]. 经济师, 2006(6): 36-37.
WU Wenchang. A comprehensive analysis on China's IC industry[J]. China economist, 2006(6): 36-37. DOI:10.3969/j.issn.1004-4914.2006.06.018 (0)
[2] GUAN T, KUANG Y C, OOI M P L, et al. Data-driven condition-based maintenance of test handlers in semiconductor manufacturing[C]//Proceedings of 2011 6th IEEE International Symposium on Electronic Design, Test and Application. Queenstown, New Zealand, 2011: 189−194 . (0)
[3] LI Qingyong, REN Shengwei. A real-time visual inspection system for discrete surface defects of rail heads[J]. IEEE transactions on instrumentation and measurement, 2012, 61(8): 2189-2199. DOI:10.1109/TIM.2012.2184959 (0)
[4] JIA Hongbin, MURPHEY Y L, SHI J, et al. An intelligent real-time vision system for surface defect detection[C]//Proceedings of the 17th International Conference on Pattern Recognition. Cambridge, UK, 2004. (0)
[5] LANDSTROM A, THURLEY M J. Morphology-based crack detection for steel slabs[J]. IEEE Journal of selected topics in signal processing, 2012, 6(7): 866-875. DOI:10.1109/JSTSP.2012.2212416 (0)
[6] MACLEAN J, TSOTSOS J. Fast pattern recognition using gradient-descent search in an image pyramid[C]//Proceedings of the 15th International Conference on Pattern Recognition. Barcelona, Spain, 2000: 2873. (0)
[7] JIANG B C, TASI S L, WANG C C. Machine vision-based gray relational theory applied to IC marking inspection[J]. IEEE transactions on semiconductor manufacturing, 2002, 15(4): 531-539. DOI:10.1109/TSM.2002.804906 (0)
[8] CHEN S H, LIAO Tetan. An automated IC chip marking inspection system for surface mounted devices on taping machines[J]. Journal of scientific & industrial research, 2009, 68(5): 361-366. (0)
[9] 张静平. 基于机器视觉的QFN芯片表面检测系统设计[D]. 南京: 东南大学, 2017.
ZHANG Jingping. Design of QFN chips surface detection system based on machine vision[D]. Nanjing: Southeast university, 2017. (0)
[10] 胡洋. IC芯片印刷字符识别算法研究与应用[D]. 武汉: 华中科技大学, 2015.
HU Yang. Research and application of printed character recognition algorithm for IC chips[D]. Wuhan: Huazhong university of science and technology, 2015. (0)
[11] WANG C, JIANG B C, LIN Jingyou, et al. Machine vision-based defect detection in IC images using the partial information correlation coefficient[J]. IEEE transactions on semiconductor manufacturing, 2013, 26(3): 378-384. DOI:10.1109/TSM.2013.2261566 (0)
[12] 李杜. 字符识别技术研究及其在机器视觉测控中的应用[D]. 无锡: 江南大学, 2011.
LI Du. Character recognition technology and its application in machine vision measurement and controlling[D]. Wu’xi: Jiangnan university, 2011. (0)
[13] 吴成茂. 直方图均衡化的数学模型研究[J]. 电子学报, 2013, 41(3): 598-602.
WU Chengmao. Studies on mathematical model of histogram equalization[J]. Acta electronica sinica, 2013, 41(3): 598-602. DOI:10.3969/j.issn.0372-2112.2013.03.030 (0)
[14] 戴声奎, 钟峥, 黄正暐. 基于最大熵模型的双直方图均衡算法[J]. 电子学报, 2019, 47(3): 678-685.
DAI Shengkui, ZHONG Zheng, HUANG Zhengwei. Maximum entropy model based bi-histogram equalization algorithm[J]. Acta electronica sinica, 2019, 47(3): 678-685. (0)
[15] 陈海峰, 雷华, 孔燕波, 等. 基于最小二乘法的改进的随机椭圆检测算法[J]. 浙江大学学报(工学版), 2008, 42(8): 1360-1364.
CHEN Haifeng, LEI Hua, KONG Yanbo, et al. An improved randomized algorithm for detecting ellipses based on least square approach[J]. Journal of Zhejiang university (engineering science edition), 2008, 42(8): 1360-1364. DOI:10.3785/j.issn.1008-973X.2008.08.015 (0)
[16] 闫蓓, 王斌, 李媛. 基于最小二乘法的椭圆拟合改进算法[J]. 北京航空航天大学学报, 2008, 34(3): 295-298.
YAN Bei, WANG Bin, LI Yuan. Optimal ellipse fitting method based on least-square principle[J]. Journal of Beijing university of aeronautics and astronautics, 2008, 34(3): 295-298. (0)
[17] JIANG Lianyuan. Fast detection of multi-circle with randomized hough transform[J]. Optoelectronics letters, 2009, 5(5): 397-400. DOI:10.1007/s11801-009-9071-1 (0)
[18] 郭晓峰, 王耀南, 周显恩, 等. 中国象棋机器人棋子定位与识别方法[J]. 智能系统学报, 2018, 13(4): 517-523.
GUO Xiaofeng, WANG Yaonan, ZHOU Xianen, et al. Chess-piece localization and recognition method for Chinese chess robot[J]. CAAI transactions on intelligent systems, 2018, 13(4): 517-523. (0)