欠定盲源分离是当前盲源分离理论研究的热点[1], 解决欠定盲源分离问题分为三种方法:一是基于非负矩阵分解的方法[2]; 二是基于二步法的稀疏分量分析方法[3]; 三是基于信号升维思想的经验模态分解方法[4]及小波包分解方法[5].本文基于第二种方法展开研究, 即先估计出混合矩阵, 然后利用估计到的混合矩阵恢复源信号.估计混合矩阵一般采用稀疏分量分析[6](sparse component analysis, SCA)的方法, 实现的步骤是通过合理地提取单源点[7], 最终使得混合信号数据点线性地聚集在固定的方向上, 通过聚类分析算法[8]实现混合矩阵的估计.这样将混合矩阵估计的问题转化为设计一种有效地提取单源点的问题, 文献[9]提出了一种基于混合信号数据点分量的相角差提取单源点的方法, 该方法可以提取大多数单源点, 但是存在着计算复杂度高、算法的时间效率差的缺陷.文献[10]提出了一种基于邻域内混合信号数据点的幅值比方差极小提取单源点的方法, 但是该方法对单源点的提取效果不理想, 源信号的稀疏性增强效果不明显, 而且当混合矩阵中存在负元素时, 该算法完全失效.
本文提出了一种在时频域下基于混合信号数据点的方向幅值比提取单源点的算法, 首先定义了混合信号数据点的方向幅值比, 与文献[10]中定义的混合信号数据点的幅值比相比, 本文引入了幅角函数的概念, 解决了文献[10]所存在的算法局限性的问题.该算法克服了文献[9]中算法存在的计算复杂度高与文献[10]中算法存在的单源点提取性能差的缺点, 通过聚类算法实现混合矩阵的精确估计, 最后通过仿真验证了本文算法对混合矩阵估计的可靠性与高效性.
1 欠定盲源分离理论 1.1 欠定盲源分离模型盲源分离的数学模型为
(1) |
其中:S为源信号矩阵, 其每一列称为源信号数据点; X为混合信号矩阵, 其每一列称为混合信号数据点; A为M×N维的混合矩阵, 当M < N时称为欠定盲源分离.
1.2 稀疏分量分析混合信号数据点仅由一路幅值非常大的源信号和其余几路幅值非常小的源信号经混合矩阵混合而来, 满足该性质的时间点所对应的混合信号数据点称为单源点, 利用欠定盲源分离的模型, 在某一时间点t上, 混合信号数据点x(t)可以写成混合矩阵列矢量的线性表达, 表达式为
(2) |
其中:ai, si(t)分别为混合矩阵第i个列矢量和源信号数据点s(t)的第i个分量.如果在时间点t下对应的混合信号数据点为单源点, 则混合信号数据点x(t)=aisi(t).
(3) |
由式(3)得知, 当混合信号数据点为单源点时, 可以得到混合矩阵的列元素之比, 比值是混合信号数据点分量之间的比值.如果混合信号数据点均为单源点时, 那么混合信号数据点的散点图会清晰地聚集在N条直线附近.提取出聚类中心, 就可以实现混合矩阵的估计.
2 混合矩阵的估计 2.1 时频域中信号的特征在进行单源点提取之前, 需要将信号从时域转换到时频域下分析.以双通道欠定盲源分离为例, 对式(1)给出的方程组两边同时作离散短时傅里叶变换(discrete short-time Fourier transform, DSTFT), 根据DSTFT可以得到
(4) |
信号经时频变换由实数域变换到复数域, 信号在时域中的幅度信息不能表征时频域中的信息,因此, 需要重新定义一些变量, 来描述时频域中信号的特征.本文定义复数的方向幅值为
(5) |
其中,fang(z)称为幅角函数, 幅角函数的定义为
(6) |
式中,ang(z)表示复数z的相角, 定义混合信号数据点在某一时频点处的方向幅值比为
(7) |
其中:A(X1(t, f))为混合信号数据点的第1个分量的方向幅值; A(X2(t, f))为混合信号数据点的第2个分量的方向幅值.
2.2 基于方向幅值比的单源点提取算法由非平稳信号的短时平稳性质可知, 一定存在一个频率不变、时间相邻的邻域U(t, f), 满足此邻域内都是由同一路源信号si主导的, 这个邻域称为源信号si主导的单源点区域.在此邻域中的混合信号数据点满足
(8) |
式(8)表明在理想的情况下, si主导的单源点区域内所有的混合信号数据点的方向幅值比均相同, 在实际情况中si主导的单源点区域下α(t, f)不会完全相同.如果某一区域内的混合信号数据点的方向幅值比之间维持极小的偏差, 该区域内的混合信号数据点被视为单源点.
将M个相邻的时频点作为一个邻域, 其中M的取值不应过小, 过小将导致提取性能的下降, 过大将导致单源点大量被筛除, 无法估计混合矩阵.根据经验选取M为5~10之间的整数, 邻域内对应的M个混合信号数据点称为一个分组, 设置一个数量级较小的阈值δ, δ∈[0.001, 0.01], 同理δ也不应选取过小, 否则, 单源点被大量筛除.利用分组内混合信号数据点的方向幅值比的方差来衡量彼此之间的差异程度, 即
(9) |
其中:αzi表示第i个分组内混合信号数据点的方向幅值比的均值;αj表示第i个分组内第j个混合信号数据点的方向幅值比.比较varzi与δ大小:当varzi>δ, 将分组内的混合信号数据点删除.
根据语音信号短时平稳特征, 当分组内的混合信号数据点是单源点时, 此分组内混合信号数据点的方向幅值比的均值αzi和相邻分组内混合信号数据点的方向幅值比的均值αzi-1, αzi+1之间存在极小的差值.反之, αzi与αzi-1, αzi+1之间存在一个较大的差值.因此, 可将剩余分组的均值αzi, i=1, 2, …, L作为输入数据, 以K个输入数据再次划分为一个邻域, 计算邻域内输入数据的方差, 保留方差小于阈值δ所对应的K个分组, 删除方差大于阈值δ所对应的K个分组.
经过前面的工作, 混合信号数据点的方向幅值比存在上界和下界, 将上界和下界分别保留一位小数四舍五入, 分别得到max和min.以Q为单位长度, 将max和min对应的一段区间均分成P个子区间, 则
(10) |
定义混合信号数据点的方向幅值比在子区间j的分布密度ρj为
(11) |
其中, cj是混合信号数据点的方向幅值比落在子区间j对应混合信号数据点的个数.通过建立j-ρj函数关系, 提取N个极大值点, N为源信号的数目, 获取N个极大值点对应的N个子区间序号ji, i=1, 2, …, N, 保留N个子区间ji及ji对应的前后子区间ji-1, ji+1内的混合信号数据点, 将剩余子区间内的混合信号数据点全部删除.
2.3 混合矩阵的估计将提取到的单源点作单位投影化处理, 进行单位投影化的作用是使得聚集在同一直线方向上的单源点投影在直线方向上的同一侧, 以便于K均值聚类,可以精确地估计混合矩阵.假设单源点为Xi, 单位投影化为
(12) |
其中,Xi1, Xi2分别表示Xi的第1行、第2行分量, 通过对单位投影化的单源点进行K均值聚类分析, 获取N个聚类中心C1, C2, …, CN, 分别计算N个聚类中心的方向幅值比α(Ci)(i=1, 2, …, N), 通过求解方程组(13)实现混合矩阵的估计.其中,
(13) |
通过估计出来的混合矩阵就可以进行源信号的重构, 本文采用匹配追踪算法[11-12]进行源信号的重构.将源信号和观测信号拉伸成一维矢量形式, 得到源信号矢量
式中t为时刻.
则有
(14) |
其中:
aij表示混合矩阵中的第i行第j列元素, 由于aij未知, 可利用2.3节中估计的混合矩阵的元素
匹配追踪算法重构信号的精度与信号本身的稀疏性也是密切相关的.信号稀疏性越高, 重构的效果也就越好, 故可对观测矢量
选取本地三路语音信号, 经过2×3维的混合矩阵
表 1为三种算法估计混合矩阵的归一化均方误差和所用时间.表 2为三种算法的分离信号的相似系数.
在不考虑噪声影响的情况下, 将本文算法与文献[9]、文献[10]提出的算法作对比, 从表 1得出:本文算法估计的混合矩阵归一化均方误差最小,因而精确度最高,归一化均方误差达到了-42.59 dB.而文献[10]算法在混合矩阵中存在负元素的情况下, 估计到的混合矩阵出现较大的误差,文献[9]算法可以获得-22.87 dB的精度.从表 2得出:本文得到的源信号重构的效果最好, 分离信号的相似系数高达0.917 4, 0.962 2与0.966 7, 均高于对比算法的各路分离信号的相似系数.
5 结语本文主要针对欠定盲源分离中混合矩阵的估计展开研究, 提出了一种基于方向幅值比的欠定盲源分离算法.与基于幅值比与相角差的欠定盲源分离算法相比, 该算法以增加少量的计算复杂度为代价, 通过混合信号数据点的方向幅值比实现单源点的精确提取, 大幅度地降低了偏离直线方向上数据点的比例, 从而提高了混合矩阵的估计精确度.最后通过匹配追踪算法进行源信号的重构.经仿真实验验证, 本文提出的算法可以实现混合矩阵的精确估计, 利用高精度的混合矩阵实现了源信号的重构.
[1] |
彭赛阳, 王振华, 朱元清.
盲源分离现状及发展[J]. 舰船电子对抗, 2016, 39(3): 54–57.
( Peng Sai-yang, Wang Zhen-hua, Zhu Yuan-qing. Status and development of blind source separation[J]. Ship Electronic Countermeasures, 2016, 39(3): 54–57. ) |
[2] |
Uramoto T, Tachioka Y, Narita T, et al.Sequential initialization of multichannel nonnegative matrix factorization for sound source separation[C]//IEEE 6th Global Conference on Consumer Electronics(GCCE).Nagoya, 2017: 1-2.
|
[3] |
Wang Y J, Feng Q Y.Underdetermined blind separation for speech signal based on two-step sparse component analysis[C]//International Conference of Information Technology, Computer Engineering and Management Sciences.Nanjing, 2011: 392-395.
https://www.researchgate.net/publication/254016627_Underdetermined_Blind_Separation_for_Speech_Signal_Based_on_Two-Step_Sparse_Component_Analysis |
[4] |
Dey P, Satija U, Ramkumar B.Single channel blind source separation based on variational mode decomposition and PCA[C]//Annual IEEE India Conference(INDICON), New Delhi, 2015: 1-5.
https://www.researchgate.net/publication/293822165_Single_Channel_Blind_Source_Separation_Based_on_Variational_Mode_Decomposition_and_PCA |
[5] |
Mei X, Yuan X L, Huang J S, et al.Separation of single-channel mixed signals based on the frequency-division of a convolution-type wavelet packet[C]//The 27th Chinese Control and Decision Conference(2015 CCDC).Qingdao, 2015: 5606-5611.
https://www.researchgate.net/publication/308871165_Separation_of_single-channel_mixed_signals_based_on_the_frequency-division_of_a_convolution-type_wavelet_packet |
[6] |
Javanmard A, Pad P, Babaie-Zadeh M, et al.Estimating the mixing matrix in underdetermined sparse component analysis(SCA) using consecutive independent component analysis(ICA)[C]//The 16th European Signal Processing Conference.Lausanne, 2008: 1-5.
https://www.researchgate.net/publication/29601037_Estimating_the_mixing_matrix_in_underdetermined_Spare_Component_Analysis_SCA_using_consecutive_Independent_Component_Analysis_ICA |
[7] |
Zhu D Y, Ma X H.Mixing matrix estimation based on single-source point identification and improved clustering method[C]//The 3rd International Conference on Awareness Science and Technology(ICAST).Dalian, 2011: 282-286.
https://www.researchgate.net/publication/254056104_Mixing_matrix_estimation_based_on_single-source_point_identification_and_improved_clustering_method |
[8] |
Orakoglu M E, Ekinci C E.
Optimization of constitutive parameters of foundation soils k-means clustering analysis[J]. Sciences in Cold and Arid Regions, 2013, 5(5): 626–636.
DOI:10.3724/SP.J.1226.2013.00626 |
[9] |
任喜顺, 沈越泓, 高猛, 等.
基于时频分析的混合矩阵估计方法[J]. 信号处理, 2012, 28(4): 545–553.
( Ren Xi-shun, Shen Yue-hong, Gao Meng, et al. A hybrid matrix estimation method based on time-frequency analysis[J]. Signal Processing, 2012, 28(4): 545–553. DOI:10.3969/j.issn.1003-0530.2012.04.013 ) |
[10] |
李雅凤.基于时频稀疏性的欠定盲源语音信号分离技术研究[D].成都: 电子科技大学, 2016.
( Li Ya-feng.Research on the separation of underdetermined blind source speech signals based on time frequency sparsity[D].Chengdu: University of Electronic Science and Technology, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10614-1016169894.htm ) |
[11] |
吴海佳, 张雄伟, 陈卫卫, 等.
压缩感知新技术与压缩感知理论中的信号重构算法研究[J]. 军事通信技术, 2012, 33(2): 93–99.
( Wu Hai-jia, Zhang Xiong-wei, Chen Wei-wei, et al. Research on signal reconstruction algorithm in compressed sensing technology and compressed sensing theory[J]. Military Communications Technology, 2012, 33(2): 93–99. ) |
[12] |
Gao G Y, Zhou C X, Cui Z M, et al.Improved sparsity adaptive matching pursuit algorithm[C]//The 3rd IEEE International Conference on Computer and Communications(ICCC).Chengdu, 2017: 1761-1766.
|