一种脱机手写签名认证方法

liyf 发表于 2012-1-21 23:45:09

1 引言手写签名认证方法属于生物测定技术。签名认证与其他生物测定技术相比，具有难以模仿、区分性较高、尊重隐私权、信息获取高效等优点，在特征的可搜集性、人体伤害可接受性和鲁棒性方面都很突出，具有广阔的应用前景。但与其他生物测定方法相比，手写签名认证的识别率并不是很高，尤其是脱机中文手写签名认证。因为在脱机签名认证中，丢失了书写过程中的动态信息，使可利用的信息减少，增加了鉴别的难度。另外，有些高超的伪造签名模仿得惟妙惟肖，有时即使是人类专家进行鉴定，识别率也可能会很低。这里针对脱机中文签名，提出一种主成分特征提取和径向基神经网络相结合的脱机手写签名认证方法。2 主成分特征提取假设x是一个N×1的随机向量，即x的每个元素xi都是一个随机变量。x的均值可用L个样本向量估计：
http://www.21ic.com/d/file/200910/3f36f52b82347463053592106390e9e4.jpg
而其协方差矩阵可由式(2)估计：
http://www.21ic.com/d/file/200910/4f5a16380a76ef0fe991738ecb962ae3.jpg
协方差矩阵是N×N的实对称矩阵。对角元素是各个随机变量的方差，非对角元素是它们的协方差。用矩阵A定义一个线性变换，它可由任意向量x通过式(3)得一个新向量y：
http://www.21ic.com/d/file/200910/6c2cd7bd58d7e678c86652ea8acc9dbb.jpg
式中，A的行向量就是Cx的特征向量。这里为了方便，对这些行向量按使得其对应的特征值递减的顺序排列。变换后的向量y是具有零均值的随机向量，其协方差矩阵与x的协方差矩阵的关系为：
http://www.21ic.com/d/file/200910/180d0de42eeb1efd8ac2abbd5aef95f4.jpg
   由于A的行向量是Cx的特征向量，所以Cy是对角阵且其对角元素为Cx的特征值。于是：
http://www.21ic.com/d/file/200910/5ea25d68e6d00c4581ffebc5fc5ae61d.jpg
   从而λk也是Cy的特征值。因为Cy的非对角元素都是零，所以y个元素之间都是不相关的。于是线性变换A去掉了变量间的相关性。此外，λk是第k个变换后的变量yk的方差。可通过略去对应于较小特征值的一个或多个特征向量给y降维。令B为M×N的矩阵(MT，则建立新的一类ω2，其中心Z2=x2，若Dist1，2≤T,则x2∈ω1； (5)假设已有聚类中心Z1·Z2…Zk，计算尚未确定类别的特征矢量xi到各聚类中心Zj(j=1，2…，k)的距离dij。如果dij>T，则 xi作为新的一类ωk+1的中心，Zk+1=xi，否则，如果dij=mindij，则判断xi∈ωg,检查是否所有的模式都划分完类别，如都划分完则结束，否则返同(5)，上述算法采用规格化的Euclidean计算公式度量两个对象间的距离。具体公式定义如下：
http://www.21ic.com/d/file/200910/959951e9668aad10e46b9941afce05f2.jpg
在包含有N个对象的m维单位空间(各属性取值均采用规格化处理)中，对象间的平均距离为
http://www.21ic.com/d/file/200910/15ed81fcc87af207fc948249b0de30a0.jpg
。对象间的平均距离与对象的个数及维数有关。在一定空间内，待分类的对象个数越少，各对象的维数越大，各对象间的距离就越大；反之，对象数量越大，各对象的维数越小，则各对象间的距离就越小。



   在包含有N个对象的m维单位空间(各属性取值均采用规格化处理)中，对象间的平均距离为以此为标准，并按照“各聚类中对象问的距离不应超过此标准，各聚类间距离不应低于此标准”的规则进行聚类学习。采用此方法得到的聚类类别数即为将要确定的隐层神经元数。整个RBF网络的学习步骤为： (1)设由上述聚类算法得到的RBF网络隐层单元数为K，最大允许误差ε，置所有可调参数(权)为均匀分布的较小数(0～1或－1～1之间的随机数)。置初始误差E为0，学习率η为0～1之间的小数。网络训练后达到的精度Emin为一个正小数。 (2)采用上面根据相似性阈值和最小距离原则的简单聚类方法确定基函数的中心Zi及δi方差，
http://www.21ic.com/d/file/200910/1fcbad4ac4b5006c1993a725e7cceb88.jpg
(3)按梯度下降法调整网络权值W直至误差E<ε，才结束。4 实验结果径向基神经网络由主成分特征提取出的10特征值作为输入节点，而隐含层节点个数则根据每组训练样本的不同(参见上述算法)确定，输出层只有一个神经元，该神经元的输出就是签名图像的对应分类(真假两类)。实验中共采集11个人的660个签名。每人有30个真签名和其他人模仿的30个假签名。图1和图2是部分训练和测试样本，图1和图2的前两个签名为作者签名，其他为假冒签名。
http://www.21ic.com/d/file/200910/33ef2b62c57d41feeb16867dba5cf95d.jpg
在每个人的60个签名中，42个签名(其中真签名21个，假签名21个)作为训练样本，剩下的18个真假签名作为测试样本，因为有11个人的11组签名，所以认证工作也分成11次，即1次进行1个人训练签名样本的训练和测试样本的测试。把这些样本送入RBF神经网络进行分类验证，实验结果见表1：
http://www.21ic.com/d/file/200910/0b98499a6c10d425414d21a71ad2e22f.jpg
5 结论提出一种基于主成分特征提取和径向基神经网络相结合的脱机手写签名认证方法。首先为了减少运算量，对经过预处理的签名灰度图像进行降维，即采用主成分特征提取的方法降低图像维数，同时过滤掉高频干扰信号，突出签名的主要特征，得到适合计算机识别的低维图像，然后在签名的分类认证中，基于径向基神经网络的验证方法可以在合理的时间内，以较少的主成分个数得到较好的识别效果。因为国内尚未出现统一的签名数据库，实验在自行采集的小型签名数据样本进行，对更大型的数据库的认证识别是今后需做的工作。

cmjx 发表于 2016-3-20 14:06:42

好深奥，没读懂。谢谢楼主分享。

李小路 发表于 2020-10-1 12:02:35

谢谢分享！:D

页: [1]