2. 桂林航天工业学院 自动化系, 广西 桂林 541004
2. Department of Automation, Guilin University of Aerospace Technology, Guilin 541004, China
脑机接口(brain-computer interface, BCI)是一种借助计算机控制系统直接建立脑电信号(electroencephalogram, EEG)与外部设备的信息交互技术.根据脑电信号诱发方式的不同, 脑机接口系统可以分为两类:自发式脑机接口和诱发式脑机接口系统.与自发式脑机接口系统相比, 诱发式脑机接口系统产生的脑电信号更稳定[1].
P300信号是一种典型的诱发式脑电信号, 是指在刺激事件发生后约300 ms出现的正峰值脑电信号[2].在基于P300的BCI系统中, 如何选出与P300特征相关的最优通道子集是决定系统性能的一个关键步骤[3].一个最优的P300相关脑电通道子集不仅可以自动适应受试者个体化差异, 且可以提高BCI系统的识别效率和识别准确率, 增强系统的实时性交互能力, 利于BCI系统的商业推广.
传统的通道选择方法主要包括两类:一类是经验选择法; 另一类是机器学习算法.经验选择法是根据先验知识选择或剔除指定通道[4].经验选择法易于实现, 但是无法满足不同被试者的个体化差异, 会导致部分有效特征通道信息丢失.机器学习算法自动学习所有通道对应的权重系数, 通过权重系数来选择最优通道子集参与后续分析过程.文献[5-6]对比分析了Fisher值、L0范数迭代优化和基于SVM(support vector machine)的递归通道消除方法等三种常用的通道选择方法, 发现基于SVM的递归通道消除优于其他两种算法.Cecotti等对P300拼写系统的研究, 表明使用信号与信号加噪声的比值作为通道消除准则可以获得更好的性能[7].然而上述算法的共同点是没有考虑最优脑电通道子集的空间稀疏性(任务相关脑区在全脑中具有空间稀疏性)[8], 一定程度上影响了后续P300特征分类的准确性.
LASSO(least absolute shrinkage and selection operator, LASSO)方法通过对所有脑电通道内特征向量施加L1范数约束, 可以选择出具有空间稀疏性的最优通道子集[9-10].然而在实际应用中发现, 基于LASSO方法选择出的最优通道子集过于稀疏, 在优化构建过程中忽略了同一通道内特征信号的空间平滑特性(即同一通道内特征向量归属于同一组, 具有相似的表现), 因此最优脑电通道子集应该具有组间稀疏性.组LASSO(group LASSO, GLASSO)方法通过对通道对应的权重系数进行分组, 并以组为单位施加稀疏约束来同时满足最优脑电通道子集的组间稀疏性和组内空间平滑性特点.GLASSO方法得到的结果较好地表征了最优通道子集的空间结构化先验, 所选择的通道更易于进行解释.然而确定正则项参数时需要进行大量的交叉验证, 使得GLASSO方法计算量增加, 不利于提升BCI系统的输入效率[11-13].
针对上述问题, 本文提出贝叶斯框架下基于组稀疏约束的脑电通道自动选择方法——组稀疏贝叶斯逻辑回归(group sparsity Bayesian logistic regression, GSBLR), 在满足最优脑电通道子集空间结构化先验的同时避免了大量的交叉验证过程.首先建立贝叶斯框架下P300脑电信号解码模型; 其次定义脑电通道权重系数对应的超参数, 将权重系数的求解过程转换为超参数的确定过程, 提出先验的组自动相关确定(group automatic relevance determination, GARD)方法进行超参数的求解, 完成了贝叶斯框架下的最优脑电通道子集的自动选择, 避免了大量的交叉验证.在BCI竞赛数据和自采集数据上的实验结果表明, 所提出的方法可以利用较少的通道数据获取较高的P300字符分类准确率.
1 组稀疏贝叶斯逻辑回归模型 1.1 基于贝叶斯框架的脑电信号模型在基于P300的BCI系统中, 通常会预先设定靶刺激和非靶刺激的闪烁方式, 通过在刺激闪烁过程中检测是否出现P300特征来确定闪烁字符位置, 从而找到对应的靶刺激.收集K个刺激下的脑电信号, 表示为
(1) |
其中X(l)(l=1, …, K)是第l个刺激下的信号序列, C是通道数量, T是时间.实验任务是从K个刺激中挑选出靶刺激a∈(1, …, K), 可以表示为
(2) |
(3) |
其中: < W, X(l)>是W和X(l)两个矩阵的内积; θ=(W, b)是参数项, W∈RC×T是系数矩阵, b∈R是偏差项; pθ(a|X)表示第a个刺激下出现P300特征的概率.则P300目标检测任务可以表示为最大化pθ(a|X), 即
(4) |
为了减少计算量, 对每个通道数据进行下采样(下采样率为r), 则信号时间长度减少为Td=T/r, 则P300信号序列记为X′(l)∈RC×Td.为了方便计算, 进一步将X′(l)转变为P维行向量x(l), 其中P=C×Td.同样地, 可以将系数矩阵W转换为P维向量ω, 则式(2)和式(4)可以改写为
(5) |
(6) |
检测某一刺激下脑电信号中是否包含P300特征是一个典型的二分类问题.将P维特征向量x∈RP映射到类别标签t∈{-1, 1}的线性模型可以表示为
(7) |
其中:ω∈RP是权重向量; ε∈R是具有精度为β的零均值高斯随机变量,则GLASSO可定义为
(8) |
其中:ωi是第i组的权重向量; G是通道组的数量.给定训练数据集(X, t), X∈RN×P, 其中X=(x1, …, xN)T, 类别标签t∈{-1, 1}N, N表示样本数.设权重向量ω服从如下高斯分布:
(9) |
为了估计ω的后验概率, 结合ARD先验, 引入一个关于ω的先验分布.由于大脑具有功能分区现象, 同一脑区负责同样的大脑功能, 因此同一通道对应的脑电特征也应具有相似的表现, 即ω应该以“通道”为单元组表现出组间稀疏性[14-15].将ω分为G组(ω1, …, ωg, …, ωG), 为每组权重系数ωg定义超参数αg, 则组内权重参数ωb, b∈Ig(Ig是包含第g组索引的集合)共享一个超参数αg.ω的组稀疏约束形式表示如下:
(10) |
其中,
(11) |
由于ω的似然函数和先验概率都服从高斯分布, 因此其后验概率也服从高斯分布.后验概率形式如下:
(12) |
通过最大化后验概率的方法可以求得最优的ω值.均值和方差由下式给出:
(13) |
(14) |
式中A=diag(α).
为了估计超参数α和β, 首先通过对权重ω进行积分获取边缘似然函数p(t|α, β):
(15) |
转换为标准高斯分布进行系数归一化, 可以进一步得到p(t|α, β)的对数形式:
(16) |
在式(16)中分别对αg和β求偏导, 并令偏导数为零, 可以获得αg和β的最大似然估计, 进一步根据式(13)和式(14)得到m和Σ.然后为下一步迭代更新αgnew, βnew, 表示为
(17) |
(18) |
其中mg是后验概率的均值向量m中第g组分量的均值, γi定义为
(19) |
其中Σbi是后验概率方差Σ的第b个对角线分量.
综上所述, 基于组稀疏约束的贝叶斯逻辑回归方法可以表示为如下过程:
1) 初始化超参数α和β;
2) 据式(13)和式(14)计算后验概率分布的均值和方差的参数;
3) 根据式(17), 式(18)和式(19)更新超参数α和β;
4) 检查对数似然函数的收敛性, 如果不满足收敛条件, 更新α←αnew, β←βnew,并返回步骤2.否则以
在脑电通道中, 所构造的P=C×Td维特征向量x∈RP包含了C个通道在Td个时间点内的脑电数据.在组数目设置方面, 一般设置组的个数G等于通道个数C, 此时单位组内的数据代表了一个通道在Td个时间点的脑电数据.在组稀疏约束下, 权重系数ω中大多数值将收缩为零, 意味着其所对应的脑电通道数据将被剔除, 此时可根据ω中非零值的分布自动完成通道选择.
2 实验结果分析在本研究中, 使用两种实验数据集来评估所提出的算法性能.一个是BCI竞赛数据[16], 另一个是自采集数据.同时, 采用LASSO, GLASSO和稀疏贝叶斯逻辑回归(sparsity Bayesian logistic regression, SBLR)三种算法进行对比分析.LASSO和GLASSO在[10-10, 105]范围内进行交叉验证以估计正则化系数.LASSO和SBLR需执行另外的交叉验证程序以获得最佳通道数目[17].GLASSO和GSBLR通过消除权重为零或接近零的通道直接确定最佳通道数量.
2.1 BCI竞赛数据集结果 2.1.1 BCI竞赛数据描述竞赛数据集使用Farwell和Donchin提出的基于P300的字符拼写实验[16].该范式向被试者呈现一个6×6的字符矩阵.在实验过程中, 当目标字符所在的行或列闪烁时, 需要默数目标字符闪烁次数.字符矩阵的所有行和列都闪烁一次称为一轮闪烁.为了提高信噪比, 每个字符拼写过程都需要重复进行连续15轮的闪烁, 因此一个字符产生的数据样本为12×15=180个.在任务执行过程中, 当目标字符出现的时间无法被被试预知时, 诱发的P300信号会更强烈.脑电信号采集使用64导电极帽, 采样频率为240 Hz.该数据集包含了2个被试, 每个被试都拼写了85个字符作为训练数据集和100个字符作为验证数据集.所有通道选择算法在训练集中进行通道选择, 并将选择出的通道在测试集中进行验证分析.
从闪烁开始后的[0~600 ms]内提取数据, 对收集到的脑电数据进行预处理.预处理步骤主要包括带通滤波(频率为[0.5~20 Hz])和下采样(频率为40 Hz).预处理完成后, 每个刺激可获得64×24大小的脑电数据矩阵, 即每个通道内包含24维脑电特征.当目标字符所在的行或列闪烁时, 此通道内特征矩阵会被标记为“+1”, 意味着特征矩阵中有P300信号的存在;否则标记为“-1”.
2.1.2 BCI竞赛数据结果分析表 1列出了三种通道选择方法估计出的最佳通道数目.与LASSO和SBLR方法相比, GLASSO和GSBLR方法选择出的通道数较多, 但更容易进行结果解释.在组稀疏通道选择方法中, 与GLASSO相比, GSBLR选择出的最优通道数相对较少.为了更直观地展示GSBLR方法所选出的通道合理性, 图 1给出了训练集中各通道权重系数空间分布图.如图 1所示, 与LASSO和SBLR方法相比, GLASSO和GSBLR方法得到的通道权重分布更符合大脑功能分区的生理解释.此外, 4种通道选择方法都选中了顶部和枕部的通道(例如CPz, Pz, PO7, PO8, O1, Oz, O2), 这些区域参与了大脑视觉刺激处理过程, 这一结果也证明了所提出方法的可靠性.
为了提高字符输入准确率, 基于P300的字符输入系统需要进行多次重复刺激来提升P300特征检测准确率(竞赛数据中每个字符重复了15次).为了进一步验证所选择通道的有效性, 利用所选通道在测试集中分别进行5次、10次、15次重复下的字符输入准确率测试.结果如表 2所示, 在大多数情况下GSBLR方法得到的准确率更高.
图 2给出了4种通道选择方法在验证数据集中不同重复次数下的字符识别准确率.在大多数情况下, 本文提出的方法在测试精度方面优于其他算法.
自采集数据使用的是Neuroscan公司32通道的Quik-CapTM电极帽和SynAmps2放大器, 以右耳为参考, 从受试者头皮上以250 Hz的采样率采集脑电信号.除了“HEOG”和“VEOG”的2个眼电采集通道外, 剩下的所有30个通道(Fz, FCz, Cz, CPz, Pz, Oz, FP2, F4, FC4, C4, CP4, P4, O2, FP1, F3, FC3, C3, CP3, P3, O1, F8, FT8, T8, TP8, P8, F7, FT7, T7, TP7, P7)的信号被用来进一步处理.参考文献[18]中的实验范式, 向被试者呈现一个包含40个不同字符的4×10字符矩阵以适应宽屏液晶显示器.每个字符都以随机顺序依次闪烁, 单个字符闪烁一次称为一个试次(一个train).所有字符闪烁一次称为一轮闪烁(一个round).为了提高信噪比和节约字符输入时间, 每个字符拼写过程都需要重复进行连续10轮的闪烁, 形成一个数据块(一个block).采集数据的对象是15名健康被试者(年龄23~30岁, 男性8人, 女性7人).实验中对每个被试进行两次实验, 每次40个字符:一次用于构造训练数据集, 选择最佳通道子集和设置交叉验证的参数; 一次作为验证数据集.
从闪烁开始后的0~600 ms内提取数据, 对收集到的脑电数据进行预处理.预处理步骤主要包括带通滤波(频率为0.5~20 Hz)和下采样(频率为40 Hz).预处理完成后, 每个刺激可获得32×25大小的脑电数据矩阵, 即每个通道内包含25维脑电特征.拼写一个字符可产生10×40=400个样本.在模型训练中, 对每个字符400个样本的输出在对应位置进行平均得到40个值, 输出最大值对应位置的字符即为模型预测的字符.
2.2.2 自采集数据分析结果表 3给出了测试集中4种通道选择方法给出的最佳通道数量.类似于BCI竞赛数据的结果, LASSO和SBLR方法选择出的通道数相对较少.与GLASSO相比, GSBLR选择的通道数目较少.为了更直观地展示所选出的通道合理性, 图 3给出了训练集中各通道权重系数空间分布图.如图 3所示, 与P300电位密切相关的电极(Pz, O1, O2和Oz)大多数都被GSBLR方法保留(图 3中脑电通道权重拓扑图中灰度较大的空间区域,可通过图像标尺中偏向于1或-1的灰度情况,直接定位脑电通道权重拓扑图中相似灰度的空间区域), 说明所选择的通道是正确的.
为了进一步验证所选最优通道子集的有效性, 利用所选通道在验证数据集中进行了字符识别准确率分析.表 4显示15个被试重复5, 10次情况下的字符输入准确率, 可以看出与其余三种方法相比, GSBLR方法在5次和10次重复情况下的准确率都是最好的.图 4进一步展示了测试集中所有被试在不同重复次数下的字符识别准确率.可以看出GSBLR表现出了优越的性能, 且在重复次数少的情况下明显优于其他方法.这意味着GSBLR可以显著提高P300的信息传输速率.当次数大于5时, GLASSO与GSBLR的准确率没有显著的差异, 但GLASSO保留了更多的电极, 带来了较大的计算量.
本文提出了一种贝叶斯框架下基于组稀疏约束的通道选择方法.BCI竞赛数据和自采集数据结果表明, 所提出的GSBLR保留的通道位于或靠近视觉区域, 这意味着选择的通道在生理上是合理的.GSBLR能够在不影响P300字符识别准确性的情况下消除冗余通道.与GLASSO相比, GSBLR更适合P300脑电信号通道选择, 且算法稳定, 不需要复杂的交叉验证过程, 时间成本低, 有利于提高BCI系统的信息传输率.BCI竞赛数据集中重复15次的平均准确率为97%, 而在自采集数据中重复5次和10次的平均准确率也达到了94.5%和98.4%.
[1] |
Vo K, Pham T, Nguyen D N, et al.
Subject-independent ERP-based brain-computer interfaces[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2018, 26(4): 719–728.
DOI:10.1109/TNSRE.2018.2810332 |
[2] |
Polich J.
Updating P300:an integrative theory of P3a and P3b[J]. Clinical Neurophysiology, 2007, 118(10): 2128–2148.
DOI:10.1016/j.clinph.2007.04.019 |
[3] |
Atum Y V, José B M, Rufiner L, et al.
Genetic feature selection for a P300 brain computer interface[J]. IFMBE Proceedings, 2015, 49(10): 603–606.
|
[4] |
Corralejo R, Nicolás-Alonso L F, álvarez D, et al.
A P300-based brain-computer interface aimed at operating electronic devices at home for severely disabled people[J]. Medical & Biological Engineering & Computing, 2014, 52(10): 861–872.
|
[5] |
Simbolon A I, Turnip A, Hutahaean J, et al.An experiment of lie detection based EEG-P300 classified by SVM algorithm[C]// International Conference on Automation, Cognitive Science, Optics, Micro Electro-Mechanical System, and Information Technology.Bandung-Indonesia, 2015: 68-71.
|
[6] |
Momennezhad A, Ebrahimnezhad H, Shamsi M, et al.
Brain activity EEG-P300 signal categorization from LPC based estimation of signal using fisher linear discriminant analysis[J]. International Journal of Intelligent Computing in Medical Sciences & Image Processing, 214, 6(1): 17–26.
|
[7] |
Cecotti H, Graser A.
Convolutional neural networks for P300 detection with application to brain-computer interfaces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(3): 433–445.
DOI:10.1109/TPAMI.2010.125 |
[8] |
Kutsenko D O, Ivonin A A, Shuvaev V T, et al.
Spatial structure of EEG in depression patients with co-occurring anxiety disorders[J]. Human Physiology, 2015, 41(1): 34–38.
|
[9] |
Tu W, Sun S.Spatial filter selection with LASSO for EEG classification[C]//International Conference on Advanced Data Mining & Applications.Berlin-Heidelberg: Springer, 2010: 142-149.
|
[10] |
Tomioka R, Müller K R.
A regularized discriminative framework for EEG analysis with application to brain-computer interface[J]. Neuroimage, 2010, 49(1): 415–432.
DOI:10.1016/j.neuroimage.2009.07.045 |
[11] |
Kondo Y, Hayashi K, Maeda S I.
Sparse Bayesian linear regression with latent masking variables[J]. Neurocomputing, 2017, 258: 3–12.
DOI:10.1016/j.neucom.2016.12.080 |
[12] |
黄璐, 王宏.
单导联脑电信号分类研究[J]. 仪器仪表学报, 2014, 35(4): 814–819.
( Huang Lu, Wang Hong. Research on the classification of P300 in single channel EEG[J]. Chinese Journal of Scientific Instrument, 2014, 35(4): 814–819. ) |
[13] |
单海军, 朱善安.
基于Relief-SBS的脑机接口通道选择[J]. 生物医学工程学杂志, 2016, 33(2): 350–356.
( Shan Hai-jun, Zhu Shan-an. A novel channel selection method for brain-computer interface based on relief-SBS[J]. Journal of Biomedical Engineering, 2016, 33(2): 350–356. ) |
[14] |
Castillo I, Schmidt-Hieber J, Aad V D V.
Bayesian linear regression with sparse priors[J]. e-Print arXiv, 2015, 43(5): 1986–2018.
|
[15] |
Hall M H, Smoller J W, Cook N R, et al.
Patterns of deficits in brain function in bipolar disorder and schizophrenia:a cluster analytic study[J]. Psychiatry Research, 2012, 200(2/3): 272–280.
|
[16] |
Michael T, Klaus-Robert M, Ad A, et al.
Review of the BCI competition Ⅳ[J]. Frontiers in Neuroscience, 2012, 6(55): 1–31.
|
[17] |
Hwang H J, Hahne J M, Muller K R.Channel selection for simultaneous myoelectric prosthesis control[C]// International Winter Workshop on Brain-Computer Interface.Seoul: IEEE, 2014: 1-4.
|
[18] |
Long J, Li Y, Wang H, et al.Control of a simulated wheelchair based on a hybrid brain computer interface[C]// Annual International Conference of the IEEE Engineering in Medicine and Biology Society.San Diego, 2012: 6727-6730.
|