Corresponding author: ZHU He-gui, E-mail: zhuhegui@mail.neu.edu.com
人脸识别技术是一种重要的生物特征识别技术.本文提出一种融合MBC和POEM特征的人脸识别方法,通过特征融合提高特征丰富度,应用加权方法提升特征的可分类能力.
1 特征提取首先使用Adaboost算法进行人脸检测,再进行特征点定位,根据特征点位置信息归一化人脸,最后利用Retinex滤波[1]处理图像.
1.1 MBC特征的提取MBC[2]全称为单演二值编码,其采用了不同策略的编码方式进行二进制化. MBC特征建立在Reisz变换的基础上,一幅二维图像f(x,y)的Riesz变换可表示为
其中,
本文在Riesz变换前对图像进行带通滤波操作,以保留信号的不变-同变性[3]. Log-Gabor滤波器的频率响应表示为
其中:ω0是中心频率;σ是带通宽度的比例系数.本文将σ/ω0设为一个常数,采用Log-Gabor滤波器对图像进行滤波操作.
本文采用多重解析的单演信号表示,用多个不同中心频率、带通宽度比例系数的Log-Gabor滤波器提取信号不同范围的频率信息,设定σ=σratioω0,ω0=(λminμn-1)-1,其中λmin是设定的最小波长,μ是波长的倍增系数,n是尺度比例,σratio是比例因子.
对经过Log-Gabor滤波器滤波的二维图像flg(x,y)来说,其二维单演信号表示为
式中:flg(x,y)为单演信号的实部;flg-x(x,y)和flg-y(x,y)为单演信号的虚部.从而图像f(x,y)可以被分解成局部振幅Alg,局部相位φlg,局部方向θlg,3个部分表达式为
采用如下3种编码方式得到局部振幅图、局部相位图和局部方向图的二进制编码图.
1) 局部振幅的二进制编码. 在一个局部区域中,用A(x,y)表示区域中心像素点(x,y)的振幅值,A(i)表示中心像素点(x,y)的第i个相邻像素振幅值,那么第i个相邻像素的振幅二值化值为
用CA(x,y)表示中心像素点(x,y)的局部振幅二进制编码,则
2) 局部相位和局部方向的二进制编码.首先将[0°,360°)离散化到K个区域.在一个局部区域中,用φ(x,y)表示中心像素点(x,y)的局部相位值,φ(i)表示第i个相邻像素的局部相位值,则第i个相邻像素的局部相位二值化值为
其中,
用CP(x,y)表示中心像素点(x,y)的局部相位二进制编码,则
局部方向的编码类似于局部相位编码,用CO(x,y)表示中心像素点(x,y)的局部方向二进制编码,类似地有
3) 局部图像强度的二进制编码. 在单演信号表示中有两个虚部分量,分别是flg-x(x,y)和flg-y(x,y),利用这两个分量在象限上的位置进行二进制编码,单演信号表示在中心像素点(x,y)虚部编码方式为
式中d∈{x,y}.从而单演信号局部图像强度的二进制编码为[ CxI(x,y),CyI (x,y)].
综上,通过以上编码方式,可以得到MBC编码图. 本文用MBC-A,MBC-P和MBC-O分别表示振幅、相位、方向的编码图.对于图像上的每一个像素,可以得到以下3个特征分量:
1.2 POEM特征的提取
POEM[4, 5]全称为基于方向的边缘振幅模式. POEM特征的提取步骤如下:
1) 梯度图像的计算.给定一幅图像,计算梯度图,然后得到振幅图和方向图,并依据方向对振幅进行软划分,形成d个不同方向的振幅图.
2) 基于方向的振幅累加.在第i个方向的振幅图上,将以像素点p为中心的w×w的图像块记为Cell,计算Cell所有像素点振幅并累加,作为p在第i个方向振幅图上的特征i(p),即i(p)=∑pj∈CellGi(pj),其中Gi表示第i个方向的振幅图,将所有d个方向的振幅累加值串联起来,形成的向量[1(p),…,d(p)],即为像素点p的特征向量.
3) 自相关计算.在像素点p上,对于第i个方向,POEM特征的计算公式为
其中:cj是p的相邻像素点;np是编码所选相邻像素点的总个数;i表示第i个划分方向上的振幅累加图;w是Cell的边长;f的定义如下,如果x>0,f(x)=1,否则f(x)=0. 像素点p的POEM特征就是把d个方向的POEM值连接起来:POEMw,np=[POEMw,np1,…,POEMw,npd].图 1 展示了一幅图像POEM特征的提取过程.
由于人脸图像存在局部变化,因此本文采用分段线性判别分析法,用每一段的局部线性拟合整体的非线性. 由于人脸局部子块对识别的影响不同,因此采用Logistic Regression对人脸分块进行赋权,提升分类效果.
2.1 图像分块对一张人脸图像,根据1节中的叙述,每个人脸图像最终可以得到MBC特征编码图和d个方向上的POEM特征编码图.在此基础上,按照相同的方式将每个特征编码图分成M×N块,分别统计每个图像块的某种特征编码图的直方图,生成一个特征直方图子序列,作为这个图像块对应特征编码图的特征. 把同一个特征图的M×N块特征直方图子序列按照分块顺序连接,即得到该人脸图像对应特征编码图的直方图序列描述: Vi=[H1i,H2i,…,HMi×N],其中Hji表示第i种编码图的第j个分块直方图子序列.
2.2 分段线性判别分析与图像分块的赋权算法在得到MBC特征编码图直方图序列(振幅编码图、相位编码图以及方向编码图)和d个方向上的POEM特征编码图直方图序列后.对第i种特征编码图直方图序列Vi第j个分块直方图子序列Hji上用PCA降维,再用LDA加强图像块直方图分类能力. 设Hji对应的PCA投影矩阵为WijPCA,对应的LDA投影矩阵为WijLDA,则每一块的低维表示为Fij=(WijPCAW<ijsup>LDA)Hji,整幅人脸图像在低维空间的第i个特征为 Fi=( Fi1,…,FiM×N).
本文采用衡量两幅图像第i个特征编码图之间的相似度,其中FijIk(k=1,2)表示第i个特征编码图的图像对第k幅图像中的第j个图像块的特征,dist(x,y)=,<x,y>表示x与y的内积,wij对应第i个特征编码图第j个分块的权重,本文采用Logistic Regression对分块进行赋权.
Logistic Regression模型如下:hθ(x)=gθ(x),其中g(z)=1/(1+e-z),针对二分类问题,以此作为分类标准,判断结果为. 在二分类Logistic Regression模型中,考虑到y的取值只有0和1,损失函数的定义如下:
为了求出最优参数θ,应该让损失函数最小,则目标函数为J(θ).求出参数θopt后,当给出一个新的观测值x时,该Logistic Regression预测该结果为1的概率是h(x)=1/(1+e-θoptTx).当h(x)大于等于0.5时,判定为y=1,否则,判定为 y=0.
利用上述方式可以得到每个编码图对应的分块权重,即可计算每个特征编码图的加权相似度,为了便于描述,按照类型将图像编码图分成MBC-振幅编码图(MBC-A),MBC-相位编码图(MBC-P),MBC-方向编码图(MBC-O)以及POEM编码图四类,由四类编码图可以得到四类相似度,分别记为SMBC-A,SMBC-P,SMBC-O,SPOEM.最终两幅图像的相似度为
其中φ只取0或者1,表示对应的特征分量在计算最终的相似度时是否适用. 3 实验结果及分析
实验中MBC特征中方向个数K取4,POEM的特征Cell大小w取7,np取8.
3.1 数据库FERET上的实验人脸数据库FERET有Training训练库和Dup1,Dup2,Fb,Fc 4个测试库.本文用Training库进行赋权分段线性判别分析训练,在其4个测试库上进行测试,图 2为部分特征组合在Dup1库上的ROC曲线.实验证明,当MBC特征的相位、方向和POEM特征结合时,认证率最高.
表 1给出本文方法与其他人脸识别算法的比较结果.由表 1可得,本文方法在没有增加特征量的前提下,在4个测试库上都取得了与MBC-F方法相当的识别率,优于其他比较方法.
1) 本文方法通过特征融合,增加特征丰富度,解决了利用单一类型特征识别率不高的问题.
2) 利用赋权分段线性判别分析加强特征分类能力,用逻辑回归对图像分块进行赋权,将特征分量组合得到识别结果,进一步提升识别率.
3) 本文算法在FERET 4个测试库上分别取得93.77%,90.60%,99.58%,99.49%的识别率,在误识率为0.1%时取得95.70%,92.31%,99.75%,100%的认证率.
致谢 感谢DARPA和NRL提供的FERET数据库.
[1] | Tan X Y, Triggs B.Enhanced local texture feature sets for face recognition under difficult lighting conditions[J].IEEE Transactions on Image Processing, 2010, 19(6):1635-1650.(1) |
[2] | Yang M, Zhang L, Shiu S C K, et al.Monogenic binary coding:an efficient local feature extraction approach to face recognition[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(6):1738-1751.(2) |
[3] | Felsberg M, Sommer G.The monogenic signal[J].IEEE Transactions on Signal Processing, 2001, 49(12):3136-3144.(1) |
[4] | Vu N S.Exploring patterns of gradient orientations and magnitudes for face recognition[J]. IEEE Transactions on Information Forensics and Security, 2013, 8(2):295-304.(1) |
[5] | Vu N S, Caplier A.Face recognition with patterns of oriented edge magnitudes[C]//Computer Vision-ECCV 2010.Berlin:Springer- Heidelberg, 2010:313-326.(1) |
[6] | Zhang W, Shan S, Gao W, et al.Local Gabor binary pattern histogram sequence (LGBPHS):a novel non-statistical model for face representation and recognition[C]New York:I EEE, 2005:786-791.(1) |
[7] | Zhang B, Shan S, Chen X.Histogram of Gabor phase patterns (HGPP):a novel object representation approach for face recognition[J].IEEE Transactions on Image Processing, 2007, 16(1):57-68.(1) |
[8] | Vu N S, Caplier A.Enhanced patterns of oriented edge magnitudes for face recognition and image matching[J].IEEE Transactions on Image Processing, 2012, 21(3):1352-1365.(2) |
[9] | Zou J, Ji Q, Nagy G.A comparative study of local matching approach for face recognition[J].IEEE Transactions on Image Processing, 2007, 16(10):2617-2628.(1) |
[10] | Tan X, Triggs B.Fusing Gabor and LBP feature sets for kernel-based face recognition[C]// 10th IEEE International Conference on Computer Vision 2005.New York:IEEE, 2005:786-791.(1) |