EEG-ATCNet

本仓库提供了论文《基于物理信息的注意力时间卷积网络用于脑电图运动想象分类》中提出的注意力时间卷积网络(ATCNet)的代码。

作者：Hamdi Altaheri, Ghulam Muhammad, Mansour Alsulaiman

沙特阿拉伯国王大学智能机器人研究中心

更新：

ATCNet的正则化参数已经修改，resulting in提高了模型性能并增强了抗过拟合能力。
目前的main_TrainTest.py文件遵循论文1和论文2中概述的训练和评估方法，但已被确定为不符合行业最佳实践。因此，我们强烈建议采用在改进的main_TrainValTest.py文件中实现的方法。这个更新版本将数据分为训练/验证/测试集，遵循这篇文章中详细说明的指南（选项2）。

除了提出的ATCNet模型外，models.py文件还包括其他相关方法的实现，这些方法可以与ATCNet进行比较，包括：

EEGNet，[论文，原始代码]
EEG-TCNet，[论文，原始代码]
TCNet_Fusion，[论文]
MBEEG_SENet，[论文]
EEGNeX，[论文，原始代码]
DeepConvNet，[论文，原始代码]
ShallowConvNet，[论文，原始代码]

下表显示了ATCNet和其他复现模型基于main_TrainValTest.py文件中定义的方法的性能：

<table> <tr> <td rowspan="2">模型</td> <td rowspan="2">参数数量</td> <td colspan="2">BCI 竞赛 IV-2a 数据集 (<a href="https://www.bbci.de/competition/iv/#dataset2a">BCI 4-2a</a>)</td> <td colspan="2">高伽马数据集 (<a href="https://github.com/robintibor/high-gamma-dataset">HGD</a>)*</td> </tr> <tr> <td>训练时间(分钟)1,2</td> <td>准确率(%)</td> <td>训练时间(分钟)1,2</td> <td>准确率(%)</td> </tr> <tr> <td>ATCNet</td> <td>113,732</td> <td>13.5</td> <td>81.10</td> <td>62.6</td> <td>92.05</td> </tr> <tr> <td>TCNet_Fusion</td> <td>17,248</td> <td>8.8</td> <td>69.83</td> <td>65.2</td> <td>89.73</td> </tr> <tr> <td>EEGTCNet</td> <td>4,096</td> <td>7.0</td> <td>65.36</td> <td>36.8</td> <td>87.80</td> </tr> <tr> <td>MBEEG_SENet</td> <td>10,170</td> <td>15.2</td> <td>69.21</td> <td>104.3</td> <td>90.13</td> </tr> <tr> <td>EEGNet</td> <td>2,548</td> <td>6.3</td> <td>68.67</td> <td>36.5</td> <td>88.25</td> </tr> <tr> <td>DeepConvNet</td> <td>553,654</td> <td>7.5</td> <td>42.78</td> <td>43.9</td> <td>87.53</td> </tr> <tr> <td>ShallowConvNet</td> <td>47,364</td> <td>8.2</td> <td>67.48</td> <td>61.8</td> <td>87.00</td> </tr> </table> 1 使用 Nvidia GTX 1080 Ti 12GB 2 (500轮，无提前停止) * 请注意，<a href="https://github.com/robintibor/high-gamma-dataset">HGD</a>用于"实际运动"而非"运动想象"

本仓库在attention_models.py文件中包含以下注意力机制的实现：

这些注意力模块可以通过attention_models.py文件中的*attention_block(net, attention_model)方法调用，其中'net'是输入层，'attention_model'*表示注意力机制的类型，有五个选项：None、'mha'、'mhla'、'cbam'和'se'。

示例：
    input = Input(shape = (10, 100, 1))   
    block1 = Conv2D(1, (1, 10))(input)
    block2 = attention_block(block1,  'mha') # mha: 多头自注意力
    output = Dense(4, activation="softmax")(Flatten()(block2))

preprocess.py文件基于两种方法加载和划分数据集：

特定受试者（受试者相关）方法。在这种方法中，我们使用与原始BCI-IV-2a竞赛划分相同的训练和测试数据，即第1阶段的试验用于训练，第2阶段的试验用于测试。
留一受试者法（LOSO）方法。LOSO用于受试者无关评估。在LOSO中，模型通过多个折叠进行训练和评估，折叠数等于受试者数量，每个折叠中使用一个受试者进行评估，其他受试者用于训练。LOSO评估技术确保使用训练数据中未出现的独立受试者来评估模型。

preprocess.py文件中的get_data()方法用于加载数据集并将其分为训练集和测试集。该方法默认使用特定受试者方法。如果您想使用受试者无关（LOSO）方法，请将参数LOSO设置为True。

关于ATCNet

ATCNet部分受到Vision Transformer (ViT)的启发。ATCNet与ViT的区别如下：

ViT使用单层线性投影，而ATCNet使用多层非线性投影，即专门为基于EEG的脑信号设计的卷积投影。
ViT由一系列编码器堆叠而成，前一个编码器的输出是后一个的输入。ATCNet由并行编码器组成，所有编码器的输出被连接起来。
ViT中的编码器块由多头自注意力(MHA)和多层感知器(MLP)组成，而ATCNet中MHA后面是时间卷积网络(TCN)。
ViT的第一个编码器接收整个输入序列，而ATCNet中每个编码器接收输入序列的移动窗口。

ATCNet与Vit对比

ATCNet模型由三个主要模块组成：

卷积(CV)模块：通过三个卷积层将MI-EEG信号中的低级时空信息编码为高级时间表示序列。
注意力(AT)模块：使用多头自注意力(MHA)突出时间序列中最重要的信息。
时间卷积(TC)模块：使用时间卷积层从突出的信息中提取高级时间特征。

ATCNet模型还利用基于卷积的滑动窗口来增强MI数据并有效提升MI分类性能。

可视化ATCNet模型中数据的转换。 <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/07f03058-a6f1-4a59-b29e-cc017bb36379.png" alt="所提出的ATCNet模型的组成部分" width="700"/>