东北大学学报:自然科学版   2015, Vol. 36 Issue (11): 1526-1529   PDF (355 KB)    
基于MBC和POEM特征的人脸识别方法
张祥德, 朱和贵, 李倩颖, 唐青松    
东北大学 理学院, 辽宁 沈阳 110819
摘要:针对人脸识别中单一特征难以取得理想效果的问题,提出了基于MBC和POEM特征融合的人脸识别方法.首先,在归一化的人脸图像上提取MBC编码图和POEM编码图,在每个编码图块上生成特征向量,应用线性判别分析对特征向量进行低维映射,并对其进行赋权相加得到最终相似度. 所提算法在FERET的Dup1,Dup2,Fb和Fc 4个测试库上取得了较高的识别率,分别为93.77%,90.60%,99.58%和99.49%;在误识率为0.1%的条件下,在4个测试库上的认证率分别为95.70%,92.31%,99.75%和100%,进一步验证了该方法的有效性.
关键词人脸识别     MBC特征     POEM特征     特征融合     赋权分段线性判别分析    
Face Recognition Algorithm Based on MBC and POEM Feature
ZHANG Xiang-de, ZHU He-gui, LI Qian-ying, TANG Qing-song    
School of Sciences, Northeastern University, Shenyang 110819, China.
Corresponding author: ZHU He-gui, E-mail: zhuhegui@mail.neu.edu.com
Abstract: Due to the representation difficulty of a face image by a single type feature used in face recognition, a MBC feature and POEM feature-based face recognition scheme was proposed. Firstly,MBC and POEM coding patterns were extracted from normalized face images. Secondly, feature vector of every block was generated by dividing the MBC and POEM coding patterns into blocks. Finally, the classification capacity of features was enhanced by using weighted piecewise LDA algorithm. Recognition and verification test were carried out using the proposed algorithm on Dup1,Dup2, Fb and Fc, respectively, which were the four subsets of FERET. The recognition rates were 93.77%, 90.60%, 99.58%, and 99.49%, respectively, and the verification rates(false accepted rate is 0.1%) were 95.70%, 92.31%, 99.75%, and 100% , respectively. All these results indicated the effectiveness of the proposed algorithm.
Key words: face recognition     MBC feature     POEM feature     feature fusion     weighted piecewise LDA    

人脸识别技术是一种重要的生物特征识别技术.本文提出一种融合MBC和POEM特征的人脸识别方法,通过特征融合提高特征丰富度,应用加权方法提升特征的可分类能力.

1 特征提取

首先使用Adaboost算法进行人脸检测,再进行特征点定位,根据特征点位置信息归一化人脸,最后利用Retinex滤波[1]处理图像.

1.1 MBC特征的提取

MBC[2]全称为单演二值编码,其采用了不同策略的编码方式进行二进制化. MBC特征建立在Reisz变换的基础上,一幅二维图像f(x,y)的Riesz变换可表示为

其中,

本文在Riesz变换前对图像进行带通滤波操作,以保留信号的不变-同变性[3]. Log-Gabor滤波器的频率响应表示为

其中:ω0是中心频率;σ是带通宽度的比例系数.本文将σ/ω0设为一个常数,采用Log-Gabor滤波器对图像进行滤波操作.

本文采用多重解析的单演信号表示,用多个不同中心频率、带通宽度比例系数的Log-Gabor滤波器提取信号不同范围的频率信息,设定σ=σratioω00=(λminμn-1)-1,其中λmin是设定的最小波长,μ是波长的倍增系数,n是尺度比例,σratio是比例因子.

对经过Log-Gabor滤波器滤波的二维图像flg(x,y)来说,其二维单演信号表示为

式中:flg(x,y)为单演信号的实部;flg-x(x,y)和flg-y(x,y)为单演信号的虚部.从而图像f(x,y)可以被分解成局部振幅Alg,局部相位φlg,局部方向θlg,3个部分表达式为

采用如下3种编码方式得到局部振幅图、局部相位图和局部方向图的二进制编码图.

1) 局部振幅的二进制编码. 在一个局部区域中,用A(x,y)表示区域中心像素点(x,y)的振幅值,A(i)表示中心像素点(x,y)的第i个相邻像素振幅值,那么第i个相邻像素的振幅二值化值为

CA(x,y)表示中心像素点(x,y)的局部振幅二进制编码,则

2) 局部相位和局部方向的二进制编码.首先将[0°,360°)离散化到K个区域.在一个局部区域中,用φ(x,y)表示中心像素点(x,y)的局部相位值,φ(i)表示第i个相邻像素的局部相位值,则第i个相邻像素的局部相位二值化值为

其中,

CP(x,y)表示中心像素点(x,y)的局部相位二进制编码,则

局部方向的编码类似于局部相位编码,用CO(x,y)表示中心像素点(x,y)的局部方向二进制编码,类似地有

3) 局部图像强度的二进制编码. 在单演信号表示中有两个虚部分量,分别是flg-x(x,y)和flg-y(x,y),利用这两个分量在象限上的位置进行二进制编码,单演信号表示在中心像素点(x,y)虚部编码方式为

式中d∈{x,y}.从而单演信号局部图像强度的二进制编码为[ CxI(x,y),CyI (x,y)].

综上,通过以上编码方式,可以得到MBC编码图. 本文用MBC-A,MBC-P和MBC-O分别表示振幅、相位、方向的编码图.对于图像上的每一个像素,可以得到以下3个特征分量:

1.2 POEM特征的提取

POEM[4, 5]全称为基于方向的边缘振幅模式. POEM特征的提取步骤如下:

1) 梯度图像的计算.给定一幅图像,计算梯度图,然后得到振幅图和方向图,并依据方向对振幅进行软划分,形成d个不同方向的振幅图.

2) 基于方向的振幅累加.在第i个方向的振幅图上,将以像素点p为中心的w×w的图像块记为Cell,计算Cell所有像素点振幅并累加,作为p在第i个方向振幅图上的特征i(p),即i(p)=∑pj∈CellGi(pj),其中Gi表示第i个方向的振幅图,将所有d个方向的振幅累加值串联起来,形成的向量[1(p),…,d(p)],即为像素点p的特征向量.

3) 自相关计算.在像素点p上,对于第i个方向,POEM特征的计算公式为

其中:cjp的相邻像素点;np是编码所选相邻像素点的总个数;i表示第i个划分方向上的振幅累加图;w是Cell的边长;f的定义如下,如果x>0,f(x)=1,否则f(x)=0. 像素点p的POEM特征就是把d个方向的POEM值连接起来:POEMw,np=[POEMw,np1,…,POEMw,npd].图 1 展示了一幅图像POEM特征的提取过程.

图 1 POEM特征提取过程 Fig. 1 The process of extracting POEM feature
2 赋权分段线性判别分析分类

由于人脸图像存在局部变化,因此本文采用分段线性判别分析法,用每一段的局部线性拟合整体的非线性. 由于人脸局部子块对识别的影响不同,因此采用Logistic Regression对人脸分块进行赋权,提升分类效果.

2.1 图像分块

对一张人脸图像,根据1节中的叙述,每个人脸图像最终可以得到MBC特征编码图和d个方向上的POEM特征编码图.在此基础上,按照相同的方式将每个特征编码图分成M×N块,分别统计每个图像块的某种特征编码图的直方图,生成一个特征直方图子序列,作为这个图像块对应特征编码图的特征. 把同一个特征图的M×N块特征直方图子序列按照分块顺序连接,即得到该人脸图像对应特征编码图的直方图序列描述: Vi=[H1i,H2i,…,HMi×N],其中Hji表示第i种编码图的第j个分块直方图子序列.

2.2 分段线性判别分析与图像分块的赋权算法

在得到MBC特征编码图直方图序列(振幅编码图、相位编码图以及方向编码图)和d个方向上的POEM特征编码图直方图序列后.对第i种特征编码图直方图序列Vi第j个分块直方图子序列Hji上用PCA降维,再用LDA加强图像块直方图分类能力. 设Hji对应的PCA投影矩阵为WijPCA,对应的LDA投影矩阵为WijLDA,则每一块的低维表示为Fij=(WijPCAW<ijsup>LDA)Hji,整幅人脸图像在低维空间的第i个特征为 Fi=( Fi1,…,FiM×N).

本文采用衡量两幅图像第i个特征编码图之间的相似度,其中FijIk(k=1,2)表示第i个特征编码图的图像对第k幅图像中的第j个图像块的特征,dist(x,y)=,<x,y>表示xy的内积,wij对应第i个特征编码图第j个分块的权重,本文采用Logistic Regression对分块进行赋权.

Logistic Regression模型如下:hθ(x)=gθ(x),其中g(z)=1/(1+e-z),针对二分类问题,以此作为分类标准,判断结果为. 在二分类Logistic Regression模型中,考虑到y的取值只有0和1,损失函数的定义如下:

为了求出最优参数θ,应该让损失函数最小,则目标函数为J(θ).求出参数θopt后,当给出一个新的观测值x时,该Logistic Regression预测该结果为1的概率是h(x)=1/(1+e-θoptTx).当h(x)大于等于0.5时,判定为y=1,否则,判定为 y=0.

利用上述方式可以得到每个编码图对应的分块权重,即可计算每个特征编码图的加权相似度,为了便于描述,按照类型将图像编码图分成MBC-振幅编码图(MBC-A),MBC-相位编码图(MBC-P),MBC-方向编码图(MBC-O)以及POEM编码图四类,由四类编码图可以得到四类相似度,分别记为SMBC-ASMBC-PSMBC-OSPOEM.最终两幅图像的相似度为

其中φ只取0或者1,表示对应的特征分量在计算最终的相似度时是否适用.

3 实验结果及分析

实验中MBC特征中方向个数K取4,POEM的特征Cell大小w取7,np取8.

3.1 数据库FERET上的实验

人脸数据库FERET有Training训练库和Dup1,Dup2,Fb,Fc 4个测试库.本文用Training库进行赋权分段线性判别分析训练,在其4个测试库上进行测试,图 2为部分特征组合在Dup1库上的ROC曲线.实验证明,当MBC特征的相位、方向和POEM特征结合时,认证率最高.

图 2 不同组合特征在Dup1上的ROC曲线 Fig. 2 The ROC curves of different features on Dup1
3.2 不同方法的识别率比较

表 1给出本文方法与其他人脸识别算法的比较结果.由表 1可得,本文方法在没有增加特征量的前提下,在4个测试库上都取得了与MBC-F方法相当的识别率,优于其他比较方法.

表 1 FERET子库上不同方法的识别率比较 Table 1 Recognition rates by different methods on FERET sub-databases
4 结论

1) 本文方法通过特征融合,增加特征丰富度,解决了利用单一类型特征识别率不高的问题.

2) 利用赋权分段线性判别分析加强特征分类能力,用逻辑回归对图像分块进行赋权,将特征分量组合得到识别结果,进一步提升识别率.

3) 本文算法在FERET 4个测试库上分别取得93.77%,90.60%,99.58%,99.49%的识别率,在误识率为0.1%时取得95.70%,92.31%,99.75%,100%的认证率.

致谢 感谢DARPA和NRL提供的FERET数据库.

参考文献
[1] Tan X Y, Triggs B.Enhanced local texture feature sets for face recognition under difficult lighting conditions[J].IEEE Transactions on Image Processing, 2010, 19(6):1635-1650.(1)
[2] Yang M, Zhang L, Shiu S C K, et al.Monogenic binary coding:an efficient local feature extraction approach to face recognition[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(6):1738-1751.(2)
[3] Felsberg M, Sommer G.The monogenic signal[J].IEEE Transactions on Signal Processing, 2001, 49(12):3136-3144.(1)
[4] Vu N S.Exploring patterns of gradient orientations and magnitudes for face recognition[J]. IEEE Transactions on Information Forensics and Security, 2013, 8(2):295-304.(1)
[5] Vu N S, Caplier A.Face recognition with patterns of oriented edge magnitudes[C]//Computer Vision-ECCV 2010.Berlin:Springer- Heidelberg, 2010:313-326.(1)
[6] Zhang W, Shan S, Gao W, et al.Local Gabor binary pattern histogram sequence (LGBPHS):a novel non-statistical model for face representation and recognition[C]New York:I EEE, 2005:786-791.(1)
[7] Zhang B, Shan S, Chen X.Histogram of Gabor phase patterns (HGPP):a novel object representation approach for face recognition[J].IEEE Transactions on Image Processing, 2007, 16(1):57-68.(1)
[8] Vu N S, Caplier A.Enhanced patterns of oriented edge magnitudes for face recognition and image matching[J].IEEE Transactions on Image Processing, 2012, 21(3):1352-1365.(2)
[9] Zou J, Ji Q, Nagy G.A comparative study of local matching approach for face recognition[J].IEEE Transactions on Image Processing, 2007, 16(10):2617-2628.(1)
[10] Tan X, Triggs B.Fusing Gabor and LBP feature sets for kernel-based face recognition[C]// 10th IEEE International Conference on Computer Vision 2005.New York:IEEE, 2005:786-791.(1)