东北大学学报:自然科学版  2019, Vol. 40 Issue (9): 1245-1251  
0

引用本文 [复制中英文]

冯宝, 张绍荣. 组稀疏贝叶斯逻辑回归的P300信号通道自动选择算法[J]. 东北大学学报:自然科学版, 2019, 40(9): 1245-1251.
[复制中文]
FENG Bao, ZHANG Shao-rong. Channel Automatic Selection Algorithm for P300 Signal with Group Sparsity Bayesian Logistic Regression[J]. Journal of Northeastern University Nature Science, 2019, 40(9): 1245-1251. DOI: 10.12068/j.issn.1005-3026.2019.09.006.
[复制英文]

基金项目

国家自然科学基金地区科学基金资助项目(81960324);广西壮族自治区自然科学基金资助项目(2016GXNSFBA380160);广西壮族自治区自动检测技术与仪器重点实验室基金资助项目(YQ19209)

作者简介

冯宝(1986-),男,山西太原人,中山大学博士后研究人员,桂林航天工业学院副教授。

文章历史

收稿日期:2018-07-25
组稀疏贝叶斯逻辑回归的P300信号通道自动选择算法
冯宝 1,2, 张绍荣 2     
1. 中山大学 生物医学工程学院, 广东 广州 510640;
2. 桂林航天工业学院 自动化系, 广西 桂林 541004
摘要:为了提高脑机接口中P300脑电信号的分类准确率和计算速度, 提出一种组稀疏贝叶斯逻辑回归的P300脑电信号通道自动选择算法.该算法首先在贝叶斯框架下建立P300脑电信号的解码模型, 其次提出先验的组自动相关确定(GARD)方法构建组稀疏约束下的P300脑电通道权重系数, 最后通过最大似然估计来求解超参数并选出P300脑电通道最优子集, 避免了大量的交叉验证过程.所提方法在BCI竞赛数据和自采集数据上进行了验证分析.实验结果表明, 所提的方法能够自动选择P300脑电通道子集, 提高了P300特征分类准确率.
关键词自动相关确定    组稀疏贝叶斯    通道选择    P300    脑机接口    
Channel Automatic Selection Algorithm for P300 Signal with Group Sparsity Bayesian Logistic Regression
FENG Bao 1,2, ZHANG Shao-rong 2     
1. School of Biomedical Engineering, Sun Yat-sen University, Guangzhou 510640, China;
2. Department of Automation, Guilin University of Aerospace Technology, Guilin 541004, China
Corresponding author: FENG Bao, E-mail: fengbao1986.love@163.com
Abstract: In order to improve the classification accuracy and calculation speed of P300 electroencephalogram(EEG)signals in the brain-computer interface(BCI), a channel automatic selection algorithm of P300 EEG signal based on group sparsity Bayesian logistic regression was proposed. First, the algorithm established the decoding model of P300 EEG signals under the Bayesian framework, and then, a priori group automatic relevance determination(GARD)was proposed to determine the weight coefficients of P300 EEG channels under group sparse constraints. Finally, the maximum likelihood estimation was used to solve the hyperparameters and select the optimal subset of P300 EEG channels, avoiding a large number of cross-validation processes. The proposed method was verified on the BCI competition dataset and self-acquisition dataset. The experimental results showed that the proposed method can automatically select P300 related channels and may improve the accuracy of P300 feature classification.
Key words: automatic relevance determination(ARD)    group sparsity Bayesian    channel selection    P300    brain-computer interface(BCI)    

脑机接口(brain-computer interface, BCI)是一种借助计算机控制系统直接建立脑电信号(electroencephalogram, EEG)与外部设备的信息交互技术.根据脑电信号诱发方式的不同, 脑机接口系统可以分为两类:自发式脑机接口和诱发式脑机接口系统.与自发式脑机接口系统相比, 诱发式脑机接口系统产生的脑电信号更稳定[1].

P300信号是一种典型的诱发式脑电信号, 是指在刺激事件发生后约300 ms出现的正峰值脑电信号[2].在基于P300的BCI系统中, 如何选出与P300特征相关的最优通道子集是决定系统性能的一个关键步骤[3].一个最优的P300相关脑电通道子集不仅可以自动适应受试者个体化差异, 且可以提高BCI系统的识别效率和识别准确率, 增强系统的实时性交互能力, 利于BCI系统的商业推广.

传统的通道选择方法主要包括两类:一类是经验选择法; 另一类是机器学习算法.经验选择法是根据先验知识选择或剔除指定通道[4].经验选择法易于实现, 但是无法满足不同被试者的个体化差异, 会导致部分有效特征通道信息丢失.机器学习算法自动学习所有通道对应的权重系数, 通过权重系数来选择最优通道子集参与后续分析过程.文献[5-6]对比分析了Fisher值、L0范数迭代优化和基于SVM(support vector machine)的递归通道消除方法等三种常用的通道选择方法, 发现基于SVM的递归通道消除优于其他两种算法.Cecotti等对P300拼写系统的研究, 表明使用信号与信号加噪声的比值作为通道消除准则可以获得更好的性能[7].然而上述算法的共同点是没有考虑最优脑电通道子集的空间稀疏性(任务相关脑区在全脑中具有空间稀疏性)[8], 一定程度上影响了后续P300特征分类的准确性.

LASSO(least absolute shrinkage and selection operator, LASSO)方法通过对所有脑电通道内特征向量施加L1范数约束, 可以选择出具有空间稀疏性的最优通道子集[9-10].然而在实际应用中发现, 基于LASSO方法选择出的最优通道子集过于稀疏, 在优化构建过程中忽略了同一通道内特征信号的空间平滑特性(即同一通道内特征向量归属于同一组, 具有相似的表现), 因此最优脑电通道子集应该具有组间稀疏性.组LASSO(group LASSO, GLASSO)方法通过对通道对应的权重系数进行分组, 并以组为单位施加稀疏约束来同时满足最优脑电通道子集的组间稀疏性和组内空间平滑性特点.GLASSO方法得到的结果较好地表征了最优通道子集的空间结构化先验, 所选择的通道更易于进行解释.然而确定正则项参数时需要进行大量的交叉验证, 使得GLASSO方法计算量增加, 不利于提升BCI系统的输入效率[11-13].

针对上述问题, 本文提出贝叶斯框架下基于组稀疏约束的脑电通道自动选择方法——组稀疏贝叶斯逻辑回归(group sparsity Bayesian logistic regression, GSBLR), 在满足最优脑电通道子集空间结构化先验的同时避免了大量的交叉验证过程.首先建立贝叶斯框架下P300脑电信号解码模型; 其次定义脑电通道权重系数对应的超参数, 将权重系数的求解过程转换为超参数的确定过程, 提出先验的组自动相关确定(group automatic relevance determination, GARD)方法进行超参数的求解, 完成了贝叶斯框架下的最优脑电通道子集的自动选择, 避免了大量的交叉验证.在BCI竞赛数据和自采集数据上的实验结果表明, 所提出的方法可以利用较少的通道数据获取较高的P300字符分类准确率.

1 组稀疏贝叶斯逻辑回归模型 1.1 基于贝叶斯框架的脑电信号模型

在基于P300的BCI系统中, 通常会预先设定靶刺激和非靶刺激的闪烁方式, 通过在刺激闪烁过程中检测是否出现P300特征来确定闪烁字符位置, 从而找到对应的靶刺激.收集K个刺激下的脑电信号, 表示为

(1)

其中X(l)(l=1, …, K)是第l个刺激下的信号序列, C是通道数量, T是时间.实验任务是从K个刺激中挑选出靶刺激a∈(1, …, K), 可以表示为

(2)
(3)

其中: < W, X(l)>是WX(l)两个矩阵的内积; θ=(W, b)是参数项, WRC×T是系数矩阵, bR是偏差项; pθ(a|X)表示第a个刺激下出现P300特征的概率.则P300目标检测任务可以表示为最大化pθ(a|X), 即

(4)

为了减少计算量, 对每个通道数据进行下采样(下采样率为r), 则信号时间长度减少为Td=T/r, 则P300信号序列记为X(l)RC×Td.为了方便计算, 进一步将X(l)转变为P维行向量x(l), 其中P=C×Td.同样地, 可以将系数矩阵W转换为P维向量ω, 则式(2)和式(4)可以改写为

(5)
(6)
1.2 组稀疏贝叶斯逻辑回归的通道选择

检测某一刺激下脑电信号中是否包含P300特征是一个典型的二分类问题.将P维特征向量xRP映射到类别标签t∈{-1, 1}的线性模型可以表示为

(7)

其中:ωRP是权重向量; εR是具有精度为β的零均值高斯随机变量,则GLASSO可定义为

(8)

其中:ωi是第i组的权重向量; G是通道组的数量.给定训练数据集(X, t), XRN×P, 其中X=(x1, …, xN)T, 类别标签t∈{-1, 1}N, N表示样本数.设权重向量ω服从如下高斯分布:

(9)

为了估计ω的后验概率, 结合ARD先验, 引入一个关于ω的先验分布.由于大脑具有功能分区现象, 同一脑区负责同样的大脑功能, 因此同一通道对应的脑电特征也应具有相似的表现, 即ω应该以“通道”为单元组表现出组间稀疏性[14-15].将ω分为G组(ω1, …, ωg, …, ωG), 为每组权重系数ωg定义超参数αg, 则组内权重参数ωb, bIg(Ig是包含第g组索引的集合)共享一个超参数αg.ω的组稀疏约束形式表示如下:

(10)

其中,

(11)

由于ω的似然函数和先验概率都服从高斯分布, 因此其后验概率也服从高斯分布.后验概率形式如下:

(12)

通过最大化后验概率的方法可以求得最优的ω值.均值和方差由下式给出:

(13)
(14)

式中A=diag(α).

为了估计超参数αβ, 首先通过对权重ω进行积分获取边缘似然函数p(t|α, β):

(15)

转换为标准高斯分布进行系数归一化, 可以进一步得到p(t|α, β)的对数形式:

(16)

在式(16)中分别对αgβ求偏导, 并令偏导数为零, 可以获得αgβ的最大似然估计, 进一步根据式(13)和式(14)得到mΣ.然后为下一步迭代更新αgnew, βnew, 表示为

(17)
(18)

其中mg是后验概率的均值向量m中第g组分量的均值, γi定义为

(19)

其中Σbi是后验概率方差Σ的第b个对角线分量.

综上所述, 基于组稀疏约束的贝叶斯逻辑回归方法可以表示为如下过程:

1) 初始化超参数αβ;

2) 据式(13)和式(14)计算后验概率分布的均值和方差的参数;

3) 根据式(17), 式(18)和式(19)更新超参数αβ;

4) 检查对数似然函数的收敛性, 如果不满足收敛条件, 更新ααnew, ββnew,并返回步骤2.否则以 =m结束.

在脑电通道中, 所构造的P=C×Td维特征向量xRP包含了C个通道在Td个时间点内的脑电数据.在组数目设置方面, 一般设置组的个数G等于通道个数C, 此时单位组内的数据代表了一个通道在Td个时间点的脑电数据.在组稀疏约束下, 权重系数ω中大多数值将收缩为零, 意味着其所对应的脑电通道数据将被剔除, 此时可根据ω中非零值的分布自动完成通道选择.

2 实验结果分析

在本研究中, 使用两种实验数据集来评估所提出的算法性能.一个是BCI竞赛数据[16], 另一个是自采集数据.同时, 采用LASSO, GLASSO和稀疏贝叶斯逻辑回归(sparsity Bayesian logistic regression, SBLR)三种算法进行对比分析.LASSO和GLASSO在[10-10, 105]范围内进行交叉验证以估计正则化系数.LASSO和SBLR需执行另外的交叉验证程序以获得最佳通道数目[17].GLASSO和GSBLR通过消除权重为零或接近零的通道直接确定最佳通道数量.

2.1 BCI竞赛数据集结果 2.1.1 BCI竞赛数据描述

竞赛数据集使用Farwell和Donchin提出的基于P300的字符拼写实验[16].该范式向被试者呈现一个6×6的字符矩阵.在实验过程中, 当目标字符所在的行或列闪烁时, 需要默数目标字符闪烁次数.字符矩阵的所有行和列都闪烁一次称为一轮闪烁.为了提高信噪比, 每个字符拼写过程都需要重复进行连续15轮的闪烁, 因此一个字符产生的数据样本为12×15=180个.在任务执行过程中, 当目标字符出现的时间无法被被试预知时, 诱发的P300信号会更强烈.脑电信号采集使用64导电极帽, 采样频率为240 Hz.该数据集包含了2个被试, 每个被试都拼写了85个字符作为训练数据集和100个字符作为验证数据集.所有通道选择算法在训练集中进行通道选择, 并将选择出的通道在测试集中进行验证分析.

从闪烁开始后的[0~600 ms]内提取数据, 对收集到的脑电数据进行预处理.预处理步骤主要包括带通滤波(频率为[0.5~20 Hz])和下采样(频率为40 Hz).预处理完成后, 每个刺激可获得64×24大小的脑电数据矩阵, 即每个通道内包含24维脑电特征.当目标字符所在的行或列闪烁时, 此通道内特征矩阵会被标记为“+1”, 意味着特征矩阵中有P300信号的存在;否则标记为“-1”.

2.1.2 BCI竞赛数据结果分析

表 1列出了三种通道选择方法估计出的最佳通道数目.与LASSO和SBLR方法相比, GLASSO和GSBLR方法选择出的通道数较多, 但更容易进行结果解释.在组稀疏通道选择方法中, 与GLASSO相比, GSBLR选择出的最优通道数相对较少.为了更直观地展示GSBLR方法所选出的通道合理性, 图 1给出了训练集中各通道权重系数空间分布图.如图 1所示, 与LASSO和SBLR方法相比, GLASSO和GSBLR方法得到的通道权重分布更符合大脑功能分区的生理解释.此外, 4种通道选择方法都选中了顶部和枕部的通道(例如CPz, Pz, PO7, PO8, O1, Oz, O2), 这些区域参与了大脑视觉刺激处理过程, 这一结果也证明了所提出方法的可靠性.

表 1 最佳通道数对比结果(BCI竞赛数据) Table 1 Comparison results of the best channel number(BCI competition datasets)
图 1 脑电通道权重系数分布图(BCI竞赛数据) Fig.1 Distribution map of EEG channel weight coefficient(BCI competition datasets)

为了提高字符输入准确率, 基于P300的字符输入系统需要进行多次重复刺激来提升P300特征检测准确率(竞赛数据中每个字符重复了15次).为了进一步验证所选择通道的有效性, 利用所选通道在测试集中分别进行5次、10次、15次重复下的字符输入准确率测试.结果如表 2所示, 在大多数情况下GSBLR方法得到的准确率更高.

表 2 测试集中5, 10和15次重复的字符输入准确率(BCI竞赛数据) Table 2 Character input accuracy of 5, 10 and 15 repetitions in the test set(BCI competition datasets)

图 2给出了4种通道选择方法在验证数据集中不同重复次数下的字符识别准确率.在大多数情况下, 本文提出的方法在测试精度方面优于其他算法.

图 2 测试集中不同重复次数下字符输入准确率(BCI竞赛数据) Fig.2 Character input accuracy under different repetition times in the test set(BCI competition datasets) (a)—A被试;(b)—B被试.
2.2 自采集数据集结果 2.2.1 数据采集过程描述

自采集数据使用的是Neuroscan公司32通道的Quik-CapTM电极帽和SynAmps2放大器, 以右耳为参考, 从受试者头皮上以250 Hz的采样率采集脑电信号.除了“HEOG”和“VEOG”的2个眼电采集通道外, 剩下的所有30个通道(Fz, FCz, Cz, CPz, Pz, Oz, FP2, F4, FC4, C4, CP4, P4, O2, FP1, F3, FC3, C3, CP3, P3, O1, F8, FT8, T8, TP8, P8, F7, FT7, T7, TP7, P7)的信号被用来进一步处理.参考文献[18]中的实验范式, 向被试者呈现一个包含40个不同字符的4×10字符矩阵以适应宽屏液晶显示器.每个字符都以随机顺序依次闪烁, 单个字符闪烁一次称为一个试次(一个train).所有字符闪烁一次称为一轮闪烁(一个round).为了提高信噪比和节约字符输入时间, 每个字符拼写过程都需要重复进行连续10轮的闪烁, 形成一个数据块(一个block).采集数据的对象是15名健康被试者(年龄23~30岁, 男性8人, 女性7人).实验中对每个被试进行两次实验, 每次40个字符:一次用于构造训练数据集, 选择最佳通道子集和设置交叉验证的参数; 一次作为验证数据集.

从闪烁开始后的0~600 ms内提取数据, 对收集到的脑电数据进行预处理.预处理步骤主要包括带通滤波(频率为0.5~20 Hz)和下采样(频率为40 Hz).预处理完成后, 每个刺激可获得32×25大小的脑电数据矩阵, 即每个通道内包含25维脑电特征.拼写一个字符可产生10×40=400个样本.在模型训练中, 对每个字符400个样本的输出在对应位置进行平均得到40个值, 输出最大值对应位置的字符即为模型预测的字符.

2.2.2 自采集数据分析结果

表 3给出了测试集中4种通道选择方法给出的最佳通道数量.类似于BCI竞赛数据的结果, LASSO和SBLR方法选择出的通道数相对较少.与GLASSO相比, GSBLR选择的通道数目较少.为了更直观地展示所选出的通道合理性, 图 3给出了训练集中各通道权重系数空间分布图.如图 3所示, 与P300电位密切相关的电极(Pz, O1, O2和Oz)大多数都被GSBLR方法保留(图 3中脑电通道权重拓扑图中灰度较大的空间区域,可通过图像标尺中偏向于1或-1的灰度情况,直接定位脑电通道权重拓扑图中相似灰度的空间区域), 说明所选择的通道是正确的.

表 3 各方法和各被试最佳通道数量(自采集数据) Table 3 Number of the best channels for each method and each subject(self-collected datasets)
图 3 脑电通道权重系数分布图(自采集数据) Fig.3 Distribution map of EEG channel weight coefficient(self-collected datasets)

为了进一步验证所选最优通道子集的有效性, 利用所选通道在验证数据集中进行了字符识别准确率分析.表 4显示15个被试重复5, 10次情况下的字符输入准确率, 可以看出与其余三种方法相比, GSBLR方法在5次和10次重复情况下的准确率都是最好的.图 4进一步展示了测试集中所有被试在不同重复次数下的字符识别准确率.可以看出GSBLR表现出了优越的性能, 且在重复次数少的情况下明显优于其他方法.这意味着GSBLR可以显著提高P300的信息传输速率.当次数大于5时, GLASSO与GSBLR的准确率没有显著的差异, 但GLASSO保留了更多的电极, 带来了较大的计算量.

表 4 各通道选择方法在测试集中各被试重复5次和10次的准确率(自采集数据) Table 4 Accuracies of 5 and 10 repetitions in the test set for each channel selection method and each subject(self-collected datasets)
图 4 各通道选择方法在测试集中各被试的平均准确率(自采集数据) Fig.4 Average accuracies of the test set for each channel selection method and each subject(self-collected datasets)
3 结论

本文提出了一种贝叶斯框架下基于组稀疏约束的通道选择方法.BCI竞赛数据和自采集数据结果表明, 所提出的GSBLR保留的通道位于或靠近视觉区域, 这意味着选择的通道在生理上是合理的.GSBLR能够在不影响P300字符识别准确性的情况下消除冗余通道.与GLASSO相比, GSBLR更适合P300脑电信号通道选择, 且算法稳定, 不需要复杂的交叉验证过程, 时间成本低, 有利于提高BCI系统的信息传输率.BCI竞赛数据集中重复15次的平均准确率为97%, 而在自采集数据中重复5次和10次的平均准确率也达到了94.5%和98.4%.

参考文献
[1]
Vo K, Pham T, Nguyen D N, et al. Subject-independent ERP-based brain-computer interfaces[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2018, 26(4): 719–728. DOI:10.1109/TNSRE.2018.2810332
[2]
Polich J. Updating P300:an integrative theory of P3a and P3b[J]. Clinical Neurophysiology, 2007, 118(10): 2128–2148. DOI:10.1016/j.clinph.2007.04.019
[3]
Atum Y V, José B M, Rufiner L, et al. Genetic feature selection for a P300 brain computer interface[J]. IFMBE Proceedings, 2015, 49(10): 603–606.
[4]
Corralejo R, Nicolás-Alonso L F, álvarez D, et al. A P300-based brain-computer interface aimed at operating electronic devices at home for severely disabled people[J]. Medical & Biological Engineering & Computing, 2014, 52(10): 861–872.
[5]
Simbolon A I, Turnip A, Hutahaean J, et al.An experiment of lie detection based EEG-P300 classified by SVM algorithm[C]// International Conference on Automation, Cognitive Science, Optics, Micro Electro-Mechanical System, and Information Technology.Bandung-Indonesia, 2015: 68-71.
[6]
Momennezhad A, Ebrahimnezhad H, Shamsi M, et al. Brain activity EEG-P300 signal categorization from LPC based estimation of signal using fisher linear discriminant analysis[J]. International Journal of Intelligent Computing in Medical Sciences & Image Processing, 214, 6(1): 17–26.
[7]
Cecotti H, Graser A. Convolutional neural networks for P300 detection with application to brain-computer interfaces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(3): 433–445. DOI:10.1109/TPAMI.2010.125
[8]
Kutsenko D O, Ivonin A A, Shuvaev V T, et al. Spatial structure of EEG in depression patients with co-occurring anxiety disorders[J]. Human Physiology, 2015, 41(1): 34–38.
[9]
Tu W, Sun S.Spatial filter selection with LASSO for EEG classification[C]//International Conference on Advanced Data Mining & Applications.Berlin-Heidelberg: Springer, 2010: 142-149.
[10]
Tomioka R, Müller K R. A regularized discriminative framework for EEG analysis with application to brain-computer interface[J]. Neuroimage, 2010, 49(1): 415–432. DOI:10.1016/j.neuroimage.2009.07.045
[11]
Kondo Y, Hayashi K, Maeda S I. Sparse Bayesian linear regression with latent masking variables[J]. Neurocomputing, 2017, 258: 3–12. DOI:10.1016/j.neucom.2016.12.080
[12]
黄璐, 王宏. 单导联脑电信号分类研究[J]. 仪器仪表学报, 2014, 35(4): 814–819.
( Huang Lu, Wang Hong. Research on the classification of P300 in single channel EEG[J]. Chinese Journal of Scientific Instrument, 2014, 35(4): 814–819. )
[13]
单海军, 朱善安. 基于Relief-SBS的脑机接口通道选择[J]. 生物医学工程学杂志, 2016, 33(2): 350–356.
( Shan Hai-jun, Zhu Shan-an. A novel channel selection method for brain-computer interface based on relief-SBS[J]. Journal of Biomedical Engineering, 2016, 33(2): 350–356. )
[14]
Castillo I, Schmidt-Hieber J, Aad V D V. Bayesian linear regression with sparse priors[J]. e-Print arXiv, 2015, 43(5): 1986–2018.
[15]
Hall M H, Smoller J W, Cook N R, et al. Patterns of deficits in brain function in bipolar disorder and schizophrenia:a cluster analytic study[J]. Psychiatry Research, 2012, 200(2/3): 272–280.
[16]
Michael T, Klaus-Robert M, Ad A, et al. Review of the BCI competition Ⅳ[J]. Frontiers in Neuroscience, 2012, 6(55): 1–31.
[17]
Hwang H J, Hahne J M, Muller K R.Channel selection for simultaneous myoelectric prosthesis control[C]// International Winter Workshop on Brain-Computer Interface.Seoul: IEEE, 2014: 1-4.
[18]
Long J, Li Y, Wang H, et al.Control of a simulated wheelchair based on a hybrid brain computer interface[C]// Annual International Conference of the IEEE Engineering in Medicine and Biology Society.San Diego, 2012: 6727-6730.