X-FASNet：跨尺度特征感知和自注意力网络，用于阿尔茨海默病认知衰退评估

张

张建站

2026/5/28 2:00:07

10分钟阅读

论文总结1、作者提出了X-FASNet设计了专门从阿茨海默症影像中提取特征的多尺度特征提取模块。简单来说就是用5*5和7*7的卷积核来提取两个不同尺度的特征。2、作者提出了跨尺度特征感知自注意力机制促进不同尺度上的信息有效融合3、作者在Kaggle阿尔茨海默病分类KAC数据集1以及阿尔茨海默病疾病预测挑战DPC-Pre和DPC-SF的初级和半决赛阶段。2三个数据集上评估了模型的分类性能。涵盖多分类和二分类任务。摘要阿尔茨海默病的早期诊断对于有效的治疗干预至关重要。认知衰退的渐进性需要精确的计算方法来检测前驱期的细微神经解剖变化。当前多尺度神经网络的跨尺度特征集成能力有限限制了其识别早期神经退行性标志物的有效性。本文提出了一个高效的跨尺度特征感知自我注意力网络X-FASNet旨在通过系统层级表征学习解决这些局限性。该架构采用双通路多尺度特征提取方法识别不同空间分辨率下的辨别性神经解剖模式同时集成了一种新型跨尺度特征感知自我关注模块增强尺度间信息交换并捕捉长距离依赖关系。DPCSF数据集的定量评估显示X-FASNet以93.7%的准确率和0.973的F1评分实现了更优异的性能比CONVADD高出10.8个百分点F1评分为0.118个百分点同时在关键性能指标上也超过了EfficientB2。对多个神经影像数据集的全面实验证实X-FASNet为神经退行性变性评估提供了有效的计算框架其特点是增强了对细微解剖变异的检测能力和更佳的病理模式识别能力。引言阿尔茨海默病AD是全球最常见的神经退行性疾病其特征是认知功能和记忆系统的逐渐退化1。临床表现为执行功能受损、视空间障碍及最终自主性丧失阿尔茨海默病的发病机制涉及淀粉样蛋白-β沉积、tau病理和神经炎症之间的复杂相互作用2。疾病发展通常经历三个临床定义阶段认知正常CN、轻度认知障碍MCI和完全痴呆AD其中MCI是治疗干预的关键窗口3,4。阿尔茨海默病进展的隐蔽性凸显了早期检测方法的必要性。目前依赖神经心理学评估如MMSE、ADAS-Cog的诊断范式对临床前阶段的敏感性有限。与此同时脑脊液生物标志物在人群筛查中依然具有侵入性和成本高昂5。神经影像技术尤其是结构性MRI已成为识别神经退行性退行性早期模式的关键工具。对MRI衍生生物标志物包括海马萎缩、皮层稀薄和白质高强度的自动分析提供了与认知衰退轨迹相关的可量化指标6。深度学习架构在解码阿尔茨海默病AD进展的复杂神经影像特征方面表现出显著成功7 8。卷积神经网络CNN擅长通过多尺度特征学习捕捉神经退行性模式的层级表示。然而当前实现面临三大基本限制1跨尺度上下文信息整合不足导致空间分辨率互补特征的利用不佳;2受AD影响的分布式神经基底之间长期依赖建模能力有限;3对神经解剖学上合理的关注区域关注不足影响模型可解释性9。多尺度架构和注意力机制的最新进展为这些挑战提供了有希望的解决方案。虽然残留连接和密集块增强了特征重用10自注意模块改善了全局上下文建模11但现有实现常忽视神经退行性过程的层级性质。AD病理的空间扩展——从内侧颞叶结构到关联皮层——要求能够适应性地加权局部和全局神经退行性退行性特征的架构12。尽管具备良好能力当前多尺度卷积神经网络仍面临两个关键限制13,14。首先这些架构在特征融合过程中难以有效整合跨空间尺度的信息。这一整合挑战常导致特征冗余或信息丢失最终损害分类性能。其次传统的卷积操作根本受限于其局部感受野阻碍了解剖学上遥远但功能相关区域之间的长距离依赖性捕捉——这一限制显著降低了特征表示能力。为应对这些挑战我们提出了跨尺度特征感知自关注网络X-FASNet。我们的架构实现了两项互补创新1专门设计用于从阿尔茨海默病神经影像数据中捕获全面的神经解剖信息的多尺度特征提取框架;2跨尺度特征感知自我关注机制促进不同尺度上的信息有效融合。这种集成方法优化了跨尺度特征交互同时建模长距离依赖关系显著提升了网络的表征能力和诊断准确性。本文的主要贡献总结如下• 我们设计了一个双通路多尺度特征提取模块采用并行的卷积路径5×5和7×7条卷积路径后续则有深度可分离卷积。我们的方法既提取了对细微病理变化至关重要的细粒度局部特征也提取了描述疾病进展的更广泛情境模式。消融研究表明这种双通路结构相比单量表方法分类准确率提高了4.7%。• 我们引入了一种跨尺度特征感知自我关注机制实现跨空间尺度的动态特征整合同时模拟受阿尔茨海默病影响的解剖学上远离大脑区域之间的长距离依赖关系。该机制增强了表征能力表现为多类分类准确率较传统特征融合方法提升6.5%可视化分析也证实了对神经解剖相关区域的关注。• 我们提出了X-FASNet一种整合架构结合这些贡献解决传统多尺度网络在阿尔茨海默病诊断中的局限性。大量评估显示在多个数据集上表现良好在DPC-SF上X-FASNet准确率为93.7%F1分数为0.973比CONVADD15高出10.8%;在DPC-Pre中准确率达到95.5%AUC为0.997超越当前领先模型同时保持临床相关性。相关工作基于机器学习的阿尔茨海默病诊断考虑到传统诊断方法无法满足阿尔茨海默病早期检测的需求。近年来机器学习在阿尔茨海默病AD诊断领域引起了广泛关注。首先通过特征提取算法定位关键区域进行医学图像特征挖掘然后基于分类模型识别特征。与传统诊断方法相比基于机器学习的诊断方法相对客观更适合大规模筛查。Change等9总结了若干新颖生物标志物并利用机器学习算法和多变量分析区分了阿尔茨海默病患者和健康个体。实验表明将机器学习算法与多元分析结合可以提高阿尔茨海默病AD诊断的准确性。Fan等16采用支持载体机SVM模型利用MRI影像数据对阿尔茨海默病的不同阶段进行分类和预测以促进疾病的高效诊断。Alghamedy 等人17提出了基于机器学习的多模型医学方法。影像学研究旨在分类和检测阿尔茨海默病。Neffati 等人18提出了一种基于缩小核主成分分析DKPCA和多类支持载体机的方法用于分类不同阿尔茨海默病状态下的MRI图像。Beheshti等人6基于MRI数据的全脑体素分析开发了一种特征选择方法用于计算机辅助诊断CAD框架。Dong 等人19提出了一种基于全脑连接组功能连接的机器学习方法用于探究阿尔茨海默病认知缺陷的网络基质。Alatrany等20提出了一种具有可解释性的机器学习模型旨在早期诊断阿尔茨海默病AD。具体来说该方法引入了类关联规则CAR和稳定且可解释分类规则集SIRUS模型以增强方法的可解释性。尽管基于机器学习的方法在早期诊断中表现更佳但它们通常依赖手动提取特征这导致模型在面对个体生理差异时的泛化能力不足。基于深度学习的阿尔茨海默病检测诊断近年来深度学习方法已成为早期阿尔茨海默病诊断研究的重要焦点。通过深度学习方法研究人员可以自动从各种医学图像中提取深度特征以提升诊断的准确性和稳健性21。AbdulAzeem等人22提出了基于卷积神经网络的阿尔茨海默病端到端图像分类框架取得了有希望的结果。Al Shehri23提出了一种基于深度学习的解决方案利用DenseNet-169和ResNet-50的CNN架构来诊断和分类阿尔茨海默病。Yang等12评估了深度学习算法在利用基线MRI脑数据区分阿尔茨海默病患者方面的表现。他们还将从神经网络中提取的特征与其他基线生物标志物结合创建了阿尔茨海默病的预后标志物。梁等24提出了一种带有散大分类器和自蒸馏的蒸馏多残差网络DMRNet用于阿尔茨海默病AD的早期诊断旨在探索每个特征之间的隐藏知识。Khan 等人25提出了一种基于深度学习的多类别分类方法用于区分阿尔茨海默病早期诊断的各个阶段。通过广泛的实验验证表明所提方法具有良好的分类性能。Wu等人26提出了基于二维2D迁移学习的三维3D迁移学习网络用于从MRI图像中分类阿尔茨海默病AD和正常群体。Jiang等27提出了一种基于外部注意力机制的新阿尔茨海默病图像分类方法。该方法利用外部注意力机制对阿尔茨海默病图像进行分类。为了进一步提升表征能力多项研究探讨了多尺度特征提取策略。宋等28提出了一种三维多尺度卷积神经网络特征提取模型实现了更优的整体性能。Tu 等人29提出了一种多模态特征转换方法用于阿尔茨海默病诊断该方法从多种模态中提取互补特征以增强阿尔茨海默病相关模式的表现。尽管这些方法试图提取多尺度信息但仍然高度依赖卷积架构而卷积结构在建模长距离空间依赖关系方面有限。总之尽管现有的深度学习方法在阿尔茨海默病早期诊断方面取得了令人鼓舞的进展但许多方法主要关注局部或短距离特征。因此多尺度特征建模和长距离依赖性捕捉仍存在不足限制了提取高度辨别性阿尔茨海默病信息的能力。方法方法概览尽管基于多尺度卷积神经网络的阿尔茨海默病状态识别模型取得了显著进展但它利用不同大小的卷积核来提取图像的各个部分从而有效捕捉全局和局部特征信息。然而融合不同尺度特征的过程常伴随着特征信息不平衡导致识别模型识别性能较差。此外缺乏长期依赖性意味着融合的特征往往无法捕捉大脑中的复杂关联进而影响早期疾病的准确诊断。因此我们提出了基于X-FASNet的阿尔茨海默病早期识别模型。首先为了捕捉不同尺度的关键信息我们利用卷积构建了具有不同核大小的多尺度图像特征。其次为了高效融合多尺度特征我们提出了跨尺度特征感知自我关注。一方面多尺度特征通过跨尺度特征融合合并;另一方面融合特征的长程依赖性通过自关注机制被提取出来。最后提取的特征被输入卷积层和池化层以获得最终的分类结果。整体模型的结构如图1所示。图1 X-FASNet的整体模型结构。a整体框架;b 多尺度特征提取;c 跨尺度特征感知自我关注X-FAS块;d 分类器。多尺度特征提取为了更高效地从阿尔茨海默病图像中提取合适的特征我们采用基于双向网络的多尺度特征提取策略。首先我们针对图像进行浅层特征提取同时使用大核卷积和小核卷积。其中使用大核卷积旨在提取全局特征并从图像中获得更多空间信息。小核卷积更侧重于图像的局部细节特征。随后我们通过应用1×1卷积增加了通道数量该过程使得在后续特征提取过程中更好地提取数据中的特异性信息。然后为了减少网络中参数的总数我们采用深度可分离卷积并通过1×1卷积来减少通道数量以增强特征信息的表达能力。不仅如此对于每个路径分支我们还使用残差连接来提升模型的性能。在获得双向分支特征后我们将这些特征组合形成多尺度特征。设阿尔茨海默病影像为X ∈ RH×W×C以下方程可描述为其中μB代表批次的平均值σB²代表批次的方差ε是一个小的正数保证计算安全。α和β是一组参数在网络训练过程中会不断更新。Conv 表示卷积操作BN 表示批量归一化。跨尺度特征感知自注意力机制从医学图像中提取的多尺度特征通常包含丰富的局部和全局信息。为了增强特征的描述我们设计了跨尺度功能感知自注意机制模块。该模块分为两部分跨尺度特征融合和自注意力机制。多尺度特征包含多个层面的信息既有局部的也有全局的。为了增强不同尺度特征的表征能力我们引入了一个跨尺度特征融合模块。该模块采用两分支结构。在其中一个分支中我们使用1×1卷积来调整通道数量从而实现残余连通性同时保持原始信息。在另一个分支中引入相同的1×1卷积以统一通道维数随后引入三个RepVGG块30用于深度特征提取。作为结构重参数化单元它能有效提升特征的表达能力。最后将两个分支的结果逐元素相加以实现多尺度特征的残余融合。这将为后续依赖挖掘提供稳定且判别性的特征输入。该过程可以表示为其中XCross−scale是跨尺度融合后的特征Conv表示卷积操作。RepVGG3表示RepVGG块的三次操作。尽管跨尺度特征融合能高效整合不同尺度的特征但特征间的依赖关系并未被充分利用。因此我们引入了多头自关注机制。与传统机制相比K和V的空间维数首先通过核大小为k×k的深度可分卷积每k步进行简化。其次加入一个偏置项用于学习记为B。该过程可表示为其中XFeature是输出特征dk是键向量K的维数Wo、WQ、i、WiK和WiV都是参数矩阵LN代表层归一化。分类器在完成高层语义特征提取后我们设计了一个结构化分类器模块用于阿尔茨海默病AD的最终判别。首先为了降低特征维度输入特征通过平均池处理。其次利用平坦化操作将二维特征转换为一维。最后我们利用紧凑的多层感知器通过非线性映射生成预测结果。该过程可表示为其中 O 是最终输出AvgPooling 是平均的池化操作。实验数据集我们所提出的模型使用了三个公开数据集Kaggle阿尔茨海默病分类KAC数据集1以及阿尔茨海默病疾病预测挑战DPC-Pre和DPC-SF的初级和半决赛阶段。2 KAC数据集包含6,400个MRI样本分为四类阿尔茨海默病图像非痴呆、非常轻度痴呆、轻度痴呆和中度痴呆。DPCPre 是一个二元分类任务通过每类 1,000 张 MRI 图像区分正常个体CN和阿尔茨海默病患者AD。DPC-SF 将任务扩展为三个类别——正常CN、轻度认知障碍MCI和 AD分别包含 3,000、3,000 和 4,000 个样本。这三个数据集的详细描述见表 1、2。图像预处理后所有图像被调整为固定分辨率 168×168 像素用于模型输入。对于 KAC 数据集我们将数据随机分为 70% 用于训练30% 用于评估。对于DPC数据集包括DPC-Pre和DPC-SF90%的数据用于训练分类模型剩余10%保留用于评估。评估指标为了全面评估分类模型的性能我们采用以下标准评估指标准确率、精度、召回率、F1分数以及ROC曲线下的面积AUC。这些指标定义为这里TP、TN、FP和FN分别表示真阳性、真阴性、假阳性和假阴性。AUC是接收者工作特征ROC曲线下的面积ROC将TP率与假阳性率绘制出来。AUC值越高接近1表示分类表现越好。表现性能评估为验证我们所提模型的有效性和泛化能力我们在三个阿尔茨海默病分类数据集DPC-Pre、DPC-SF 和 KAC上进行了全面实验。该方法与一系列代表性分类器进行了比较包括传统的深度卷积和基于注意力的模型10 11 30–39。KAC的分类结果见表3。DPC-Pre和DPC-SF的分类结果分别见表4和表5。在KAC数据集见表3中我们通过比较其在二分类和多分类任务中的表现进行了对所提方法有效性的全面评估。在二分类任务中我们提出的方法在所有评估指标上均优于其他比较模型准确率为0.8431F1分数为0.8575。它显著优于大多数深度学习模型如DenseNet和ResNet系列并展现出强大的判别能力。在多分类任务中尽管整体识别难度更高且模型性能下降我们提出的方法仍能实现最优结果。准确率为0.7924F1得分为0.8508。我们的方法通过召回率和精度指标分别为0.8422和0.8596能够准确区分多个类别。在DPC-Pre数据集见表4中大多数深度网络都能在该数据集上实现高识别准确率其中MobileNetV293.9%、ResNet3492.4%和DenseNet92.9%表现良好。相比之下我们提出的方法表现最佳准确率为95.5%F1得分为0.979。在DPC-SF数据集见表5中大多数模型的性能因任务复杂度增加而下降。然而我们提出的方法仍保持显著优势在准确率93.7%和F1评分0.973方面均优于其他对照方法。它在所有指标上仍显著提升。总之KAC、DPC-Pre和DPC-SF数据集的实验结果表明我们提出的方法持续优于现有主流模型并展现出更优的判别能力。消融实验为了进一步验证我们提出方法中每个模块的有效性我们在KAC数据集上进行了一系列消融实验。具体来说我们从基线架构出发逐步扩展所提出的模块。比较模型列于表6。具体结果见表7。基本单分支结构性能有限准确率为0.7810分支I和0.7843分支II。将两者融合为双分支结果显著的性能提升。在为双分支添加增强模块后性能略有下降可能是由于引入的结构复杂度未能有效工作。注意力机制的进一步引入提升了多个指标包括精度达到0.8319AUC最高达0.9368。最终所提方法最优精度为0.8431F1得分为0.8575证明了整体架构设计的有效性。在多分类任务中单分支模型表现较弱最高精度为0.6764而双分支模型显著提升了性能准确率达到0.7385。注意力机制同样有效。最终提出的方法在多分类任务中也取得了最佳成绩准确率为0.7924F1得分为0.8508进一步验证了该模块在复杂任务中的适应性和优越性。总之消融实验充分展示了分类任务整体设计的有效性和互补性表明该方法具有稳健的泛化能力和高判别性能。混淆矩阵为了进一步研究每个消融模型的分类性能我们对其混淆矩阵进行了分析和可视化。二元和多分类的混淆矩阵结果见图2和图3。结果显示随着模型结构的逐步增强分类准确性显著提升。最初的“分支I - 小”模型在预测中存在较高的假阳性和假阴性率。“分支I - 大型”模型提高了预测准确率并减少了假阴性。随后通过引入“双分支”结构进一步提升了分类性能。该模型将更好地识别阿尔茨海默病尽管仍会存在许多假阳性。最终所提模型通过结合所有改进策略在分类任务中表现良好。这表明增强模型结构并引入注意力机制有效提升分类准确率优化模型泛化能力。模型的可解释性能为了进一步验证所提模块提升模型辨别力和可解释性的能力我们在各种消融设置下对模型进行了GradCAM 40 分析。具体来说我们将整个模型生成的热图与去除关键模块的模型生成的热图进行比较。如图4、图5所示整个模型的关注区域更为集中且高度对应病灶区域。相比之下去除模块的模型倾向于关注零散或无关的领域。这一结果表明我们引入的模块不仅提升了量化指标的性能还促使模型在决策过程中更加关注医学上重要的区域。它提升了模型在临床诊断中的可解释性和可靠性。讨论近年来深度学习在阿尔茨海默病AD图像识别中的应用取得了显著成果;然而现有方法在处理复杂大脑结构特征时仍面临诸多挑战。具体来说多尺度卷积神经网络在融合不同空间尺度信息时常常难以实现有效的尺度间交互。这导致关键焦点区域信息的代表性有限。与此同时传统卷积运算的局部感受场阻碍了模型有效捕捉不同尺度特征间长距离依赖性的能力。为此本文提出的X-FASNet在结构设计层面引入了三种核心策略。首先采用多尺度特征提取结构能够在不同感受野间全面捕捉图像信息从而提升模型对阿尔茨海默病的敏感性。其次跨尺度特征感知自我关注旨在促进不同尺度之间的信息交互与整合。在实验分析中我们通过一系列定量评估和可视化方法进一步验证上述结构设计的有效性。此外基于CAM的结果表明整个模型相比去除关键模块的对照模型更能关注与阿尔茨海默病相关的典型区域。这表明引入的结构设计不仅提升了分类性能还使模型的聚焦机制更贴合实际临床关注区域从而增强模型输出的可信度。通过一系列实验验证了所提结构设计的有效性。首先消融结果见表7显示我们的模型在多个评估指标上始终优于所有基线变体证实这三种核心策略对性能提升有显著贡献。此外多尺度特征提取为诊断提供了更丰富的信息而跨尺度特征感知自我关注则增强了特征表示能力。此外这些定量改进还得到了Grad-CAM可视化的定性证据支持见图4、图5。与仅使用单一尺度分支或缺乏注意力机制的模型相比我们提出的模型展现出更聚焦、语义意义强且结构连贯的注意力区域。激活模式集中在与阿尔茨海默病病理密切相关的脑区表明其临床一致性更强且可解释性更高。然而所提出的方法仍存在一些局限性。首先由于获取与阿尔茨海默病相关的高质量神经影像数据成本高昂目前训练数据的规模和多样性仍有限。此外本研究采用单模结构MRI数据在一定程度上限制了模型全面表现阿尔茨海默病复杂病理机制的能力。其次本研究基于公开数据集进行评估。其图像采集条件相对均匀缺乏来自不同中心、不同设备或不同群体的异构数据验证。未来我们将考虑结合多模态数据如PET图像以增强模型表达复杂病理机制的能力。同时引入来自不同医院或设备的数据构建跨中心验证集增强模型在现实场景中的鲁棒性和泛化性能。除了数据集扩展我们还将考虑验证模型的实际应用效果。首先我们将与临床机构合作开展前瞻性研究并将模型集成到计算机辅助诊断CAD系统中用于实际工作流的评估。此外我们还计划在医院级硬件上测试模型的推理效率和部署可行性以确保其满足临床部署的性能要求。这些努力将有助于我们将方法从研究验证转向实际应用。总结本研究提出了用于阿尔茨海默病早期诊断任务的X-FASNet并基于阿尔茨海默病MRI数据进行了验证。该模型通过跨尺度信息融合有效捕捉脑图像中的局部和全局特征。在多个公开数据集上的实验表明X-FASNet在分类性能方面优于现有方法。与此同时可视化分析结合模型可解释性显示模型能够稳定聚焦临床意义显著的脑区为模型的辨别过程提供直观支持。

SecGPT-14B参数详解：temperature=0.3在生成标准化安全建议时的稳定性验证

SecGPT-14B参数详解：temperature0.3在生成标准化安全建议时的稳定性验证 1. 模型概述与核心能力 SecGPT-14B是一款专注于网络安全领域的专业大语言模型，基于Qwen2ForCausalLM架构开发，拥有140亿参数规模。该模型经过大量网络安全相关数据的…...

2026/5/8 18:27:20 阅读更多 →

扩散模型驱动的语音增强：从STFT域到复杂谱图域的创新实践

1. 扩散模型如何革新语音增强技术第一次接触扩散模型在语音增强中的应用时，我被它的"逆向思维"惊艳到了。传统方法总想着直接滤除噪声，而扩散模型却像一位经验丰富的修复师，先理解噪声是如何污染语音的，再一步步逆向修…...

2026/5/8 18:27:21 阅读更多 →

抖音批量采集工具：从零构建你的个人视频资源库

抖音批量采集工具：从零构建你的个人视频资源库【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 想象一下，你正在为一个创意项目寻找灵感，需要收集大量相关视频素材&#xf…...

2026/5/8 18:27:21 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/27 12:43:11 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/27 0:57:50 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/27 16:46:38 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/27 17:17:05 阅读更多 →