2 Changzhou Key Laboratory of Sensor Networks and Environmental Sensing, Changzhou 213022, China
与指纹和虹膜等稳定的人体物理特征相比,手写签名是人体的一种比较稳定的行为特征,利用手写签名进行个人身份的认证具有非侵犯性(或非触性)、易于获取、对签名者的非约束性等特点,是一种重要的个人身份的表示手段。签名鉴伪按实际操作方式的不同可分为联机和脱机两种,两者都有很广的应用背景,可在诸如金融、保险、公安司法部门的刑事调查和法庭审判等领域发挥重要作用。目前,联机手写签名的鉴伪技术已经十分成熟并已进入实用化阶段,而脱机签名因无法像联机签名获取到签名者书写时的笔画顺序、书写速度、运笔压力等动态信息,以致其鉴定真伪的难度较大,相应的鉴定技术尚不成熟,诸多学者正在开展相关技术的研究。
现存的签名鉴伪方法,如黄海龙提出的一种基于数学形态学的签名真伪鉴别方法[1],利用数学形态学提取签名笔画特征,根据笔画形态提取不同方位的签名图像特征来完成鉴伪工作,该方法提取的单一签名图像特征不能适应实际签名图像的多样性,鉴伪有效率较低。田伟提出了基于投影特征和离散小波变换(Discrete wavelet transform,DWT)的二次特征提取脱机中文签名鉴定方法[2],利用投影特征和离散小波变换提取二次特征,训练神经网络分配特征权重系数,完成鉴伪工作,但在实际操作过程中如遇到录入签名图像倾斜、不同签名图像纹理变化规律相近等问题时,鉴伪有效率会大幅下降。朱皓悦提出了基于拉格朗日支撑矢量积(Lagrangian Support Vector Machine,LSVM)分类鉴定器的脱机签名鉴定研究[3],用静态形状特征和伪动态特征相结合的方法,提出一种新的高灰度稳定区特征,采用算法速度更快的LSVM算法作为分类鉴定的方法完成了签名鉴伪的工作。但是在实际生活中遇到图像信息、图像环境突变等问题时,鉴伪速度和有效率会大幅下降。
1 签名图像特征提取与融合文中的签名图像均为黑色签字笔在白纸上书写的随机字符,由500万自对焦高拍仪录入至计算机,图像类型为彩色图像,格式为Jpeg。基于图像特征自适应融合识别的签名鉴伪方法包含的主要步骤为签名图像预处理、图像特征提取、特征自适应权值融合、相似性度量。文中提出的方法流程如图 1所示。
1.1 签名骨架图像提取文中签名特征数据库的签名样本为10幅不同时间、不同环境下相同内容的签名图像。实时待鉴伪的签名图像由高拍仪实时采集,直接录入签名鉴伪系统进行鉴伪。
首先对于彩色笔迹图像2(a)进行灰度化处理,再运用最大类间方差法(Otsu法)进行二值化处理,为了消除签名用笔粗细带来的影响,利用快速细化算法[4]将笔迹样本进行细化处理,该算法是基于数学形态学对目标进行模板匹配,快速提取签名图像骨架。为了消除签名尺寸大小对签名图像特征的影响,扫描去除签名骨架图像多余的边框后,将名骨架图像尺寸进行标准化处理,大小统一为600*300。
1.2 签名图像特征提取针对完成尺寸标准化处理的签名骨架图像图 2(b),从签名图像不同的特征点提取签名特征,包括从签名比例、纹理等特征方向提取签名常规性特征,同时考虑实际情况中倾斜、像素分布等问题提取签名鲁棒性特征,从而使签名图像融合特征具有良好的敏锐性和鲁棒性。文中提出的特征融合方法首先对签名字符书写形态、单方向笔画重量分布、字符像素点分布、图像字符倾斜角度等图片信息进行检测,根据检测结果自适应的改变特征融合过程中各特征的权重系数。下面对特征提取及特征有效性影响因素进行分析。
1.2.1 签名常规性特征提取与分析1)比例特征与书写形态
比例特征是可以反映个体书写习惯的直接表现,其主要为字符长度、位置、边框的比例关系。首先将二值图像2(b)中字符像素值的和提取出来记为字长L,再确定字符骨架的左右边框投影在横坐标的交点,记录这些交点所在的横坐标分别为d1、d2。再预设两个标志变量b1=0和b2=0,对每行中每个字符通过由上而下的顺序查询。第一次搜索到黑色像素置b1=1,此时可根据该黑色像素点确定上边框所在的行即纵坐标d4。然后通过由下而上的顺序查询,第一次搜索黑色像素点并置b2=1,得到下边框所在的行即纵坐标d3,从而定义比例特性:
经过大量的比例特性实验后发现,除两字签名图像与三字签名图像比例特征的分布中心不同,大部分的签名字符的形态极其相似。当签名字符书写形态在相似范围内,也就是比例特征数值的在数据聚拢区范围内时,运用其比例特征进行相似性度量时,并不能反映出明确的差异性。这时如果仍然使用该特征作为相似性度量的决策特征,会造成特征权重的浪费和结果的误差。
2)纹理特征与笔画重量分布
Gabor变换[5]在分析签名图像中局部区域的频率和方向信息方面具有优异的性能。由于签名笔画具有一定的笔画宽度和方向,从签名图像的统计信息入手,每幅笔迹样本图像经每一通道滤波即提取笔迹纹理的特征,在样本图像f(x,y)中抽取样点(X,Y),则在该点处提取的特征为
式中:w为滤波器窗口的大小,h(x,y,f0,θk,σx,σy)为去除直流分量后滤波器核心函数:
式中:f0与θk分别为波函数的频率和方向参数,σx和σy分别为高斯包络在x方向和y方向上的标准差,e为自然常数。在f(x,y)抽取足够多的样点,则所有样点可以用由式T2=(X,Y,f0,θk,σx,σy)提取特征。
Gabor变换在分析签名图像中签名的笔画宽度和笔画方向信息方面具有优异的性能。笔画的方向性的变化越大,Gabor提取的纹理特征也越明显。但是实验数据显示当笔画复杂程度在笔画重量值聚拢区内时,Gabor滤波器提取的特征会丧失特征敏锐性。文中通过数学形态学分别提取横、竖、撇、捺等单方向笔画,并且对笔画方向做定量分析,从而确定Gabor特征权重系数。
1.2.2 签名鲁棒性特征提取与分析1)灰度信息熵与字符像素分布
在实验过程中发现,存在签名图像的纹理、比例极其相似,但是签名的内容却截然不同的现象。出现上述状况的原因为,处理静态脱机签名的切入点往往是签名者书写字符的纹理特征、方位特征等,即书写者的书写习惯。这时就会出现同一书写者不同的书写内容会出现误识的现象,为了避免此类现象的产生,文中提出的方法引入了灰度信息熵作为识别的特征。
灰度共生矩阵[6]反映的是图像灰度关于方向、相邻间隔、变化幅度的综合信息。为了能更直观地以灰度共生矩阵描述纹理状况,在灰度共生矩阵的基础上获取二次统计量。在二值签名图像中,灰度共生矩阵中所有元素只有最大像素值与最小像素值,其作用可以统计像素点分布规律,从而分辨出字符不同的内容。
运用灰度共生矩阵的熵作为特征值时,不仅可以区分书写字符的内容,并且可以记录表示签名图像中纹理的非均匀程度,其定义为
式中:Pd(i,j)代表图像位置关系为d、 2个像素灰度分别为i和j的情况出现的次数。2)几何不变特征与图像倾斜角度
在实际生活和工作过程中,图像录入并不能做到精确平正,往往轻微的倾斜角度是必然存在的,文中提出引入Hu不变矩作为签名图像特征,可在减轻了签名图像倾斜带来的误差的同时记录签名图像纹理特征。文中根据中文签名的“横平竖直”的书写习惯,先对签名字符的横、竖笔画进行检测,取两个方向笔画倾斜角的平均值作为签名图像倾斜角,再根据倾斜角确定Hu不变矩特征权重系数。
通过实验可以得到,对于签名图像的平移旋转问题,Hu不变矩的二阶中心矩在保持旋转不变性的同时,亦能将图像的纹理特征记录下来,其定义为
式中:
1.3 图像信息检测与特征融合针对神经网络特征融合方法对于图片环境信息突变适应性差的问题,文中提出基于图像信息检测的图像特征自适应融合方法。图像信息检测主要根据对签名字符书写形态、单方向笔画重量的检测结果确定签名常规性特征的权重系数,根据字符像素点分布、图像字符倾斜角度的检测结果确定签名鲁棒性特征的权重系数。
对签名图像的以上的4个图像信息进行检测, 根据各特征的权重系数分配结果,进行自适应权值的特征融合,其融合方法如图 3所示。
图 3中根据检测结果,可以相应确定特征参数C1~C4的值,取C1~C4的值为0或1。以C1为例,当比例特征数值的在特征数据聚拢区内时,表示比例特征的特征有效性大幅下降,将C1的值变为1,则将比例特征 T1的权重系数均匀的分配给参数C等于0的特征,若C1的值为0,则表示比例特征的特征有效性较好,接收其他特征分配出来的比例权重系数,依次对C2、C3、C4做同样的处理。则融合特征T定义为
2 实验方法及结果分析 2.1 相似性度量方法选取
实验数据库中保存的签名特征值G是平均权值的情况下得到的签名图像特征值,且数据库特征值是收集个体签名者不同时段的随机签名,取其特征值的平均值作为数据库特征值。得到待测签名样本融合特征值T后,按照T的融合规则对G做同样的融合处理。由于每个待测样本图像的信息不同,所以会衍生出各种不同的特征融合规则,不同特征的数据大小范围差异性比较大,为了避免由于融合规则造成的误差,文中选取夹角余弦相似性度量作为度量方法。
夹角余弦相似性度量可以用在任何维度的向量比较中,尤其在高维空间中的利用尤为频繁。其主要优点为可以将多个特征值组成特征组向量,在高维空间中快速计算向量之间相似度,并且可根据实际情况,改变向量元素的权重系数,得到更加准确的相似度,适合特征矩阵的相似性判别。
针对文中提出的笔迹鉴别算法,设待鉴别的笔迹特征矩组成的向量可表示为 数据库对应的笔迹特征矩组成的向量为 。对于这两个四维向量,可以使用夹角余弦的概念来衡量它们之间的相似程度。
取角θ的度数大小作为衡量其相似度的参考值,向量间的夹角越大,则表示待鉴别的笔迹与数据库中对应的笔迹相似度较小;反之,若夹角越小,则表示待鉴别的笔迹与数据库中对应的笔迹相似度较大。设K为待鉴别的笔迹与数据库中对应的笔迹相似度,K定义为
选取夹角相似性度量作为衡量待鉴伪签名图像相似度的决策算法,特征根据图像信息进行自适应融合时,高低维的变换并不会给相似性度量结果带来影响,从而使得鉴伪结果更加客观明显。
2.2 实验结果分析文中提取了100人的1000幅签名图像的特征 录入至数据库,其中每个人在不同时段、不同环境下的签名图像10幅。在数据库中随机抽取签名做测试实验,根据数据库取得的签名样本,再去寻找一定比例的真实签名和虚假签名作为待测样本,共进行了4组实验,测试结果如表 1所示。
测试组序号 | 测试样本数 | 真实签名图像 | 虚假签名图像 | 鉴伪正确率/% | |
真实签名鉴伪成功率 | 虚假签名鉴伪成功率 | ||||
1 | 20 | 10 | 10 | 100 | 100 |
2 | 30 | 15 | 15 | 93.33 | 100 |
3 | 40 | 20 | 20 | 95 | 95 |
4 | 50 | 25 | 25 | 92 | 96 |
由表 1反映出随机进行签名鉴伪测试时,文中提出的方法可以有效解决签名鉴伪问题,可以实时的对真实签名和虚假签名做出判断,并且鉴伪成功率较高。
选取在文本依存的签名鉴伪领域中现存的3种 方法与文中提出的方法,进行签名鉴伪实验,4种方法的实验样本字符都是由文中数据库提供,测试环境相同,测试及要求均符合原作者提出要求,实验结果如表 2所示。
文中提出的基于图像特征自适应融合识别的签名鉴伪方法是针对签名鉴伪问题,从签名图像不同的特征点提取了签名图像的4个特征,包括比例特征、纹理特征、灰度信息特征、几何不变特征,每个特征都从不同的角度对手写签名进行认知和记录。实验表明,当图像的信息,包括签名字符书写形态、单方向笔画重量分布、字符像素点分布、图像字符倾斜角度的理论数据在特定的范围内时,对应特征的有效性会大幅下降。针对这一现象,提出先对图像的信息进行检测,根据检测结果,自适应的改变特征融合时的权重系数,从而保证了特征融合后的有效性,同时特征的融合也提高了该鉴伪方法的通用性和鲁棒性。
[1] | 黄海龙, 王宏, 李微. 一种基于数学形态学的签名真伪鉴别方法[J]. 东北大学学报:自然科学版, 2011, 32(6): 854-858. |
[2] | 田伟, 乔谊正, 马志强. 基于DWT的二次特征提取脱机中文签名鉴定[J]. 山东大学学报:工学版, 2007, 37(3): 55-59. |
[3] | 朱皓悦, 耿国华, 周明全, 等. 基于LSVM分类鉴定器的脱机签名鉴定研究[J]. 计算机应用与软件, 2009, 26(7): 219-221. |
[4] | 梅园, 孙怀江, 夏德深. 一种基于改进后模板的图像快速细化算法[J]. 中国图形图像学报, 2006, 11(9): 1306-1310. |
[5] | 李莹. 汉字笔迹鉴别的算法研究[D]. 济南: 山东大学, 2007: 29-55. |
[6] | 高程程, 惠晓威. 基于灰度共生矩阵的纹理特征提取[J]. 计算机系统应用, 2010, 19(6): 195-198. |
[7] | 鄢煜尘. 基于信息融合的中文笔迹鉴别研究[D]. 武汉: 武汉大学, 2009: 29-60. |
[8] | 李昕, 丁晓青. 基于改进微结构特征的笔迹鉴别[J]. 清华大学学报(自然科学版), 2010, 50(4): 595- 600. |
[9] | ZAMORA-MARTINEZ F, FRINKEN V, ESPAÑA-BOQUERA S, et al. Neural network language models for off-line handwriting recognition[J]. Pattern Recognition, 2014, 47(4): 1642-1652. |
[10] | DREUW P, DOETSCH P, PLAHL C, et al. Hierarchical hybrid MLP/HMM or rather MLP features for a discriminatively trained Gaussian HMM: a comparison for offline handwriting recognition[C]//Proceedings of the 2011 18th IEEE International Conference on Image Processing. Brussels, Belgium, 2011: 3541-3544. |