时间:2024-07-29
裴莉敏
(南京医科大学无锡医学中心,无锡市人民医院,南京医科大学附属无锡人民医院 江苏 无锡 214000)
在医学的发展中,对疾病的正确判定是非常重要的,而医学成像技术的高速发展为医护人员提供了更加详细、更清晰、更全面的组织结构和生理功能信息[1-2]。计算机断层扫描(computed tomography,CT)技术作为临床应用中常见的影像检测手段,提供了数量庞大的疾病检测影像[3-4]。但传统的CT 图像中病灶的诊断手段,多是通过人工来完成的,这使得标注的时间较长,评判也容易受到其它因素的影响而发生漏检和错检的情况[5-6]。而深度神经网络的应用,能够通过自我学习读取人眼所观察不到的细节特征,同时也避免了评判者的主观因素[7-8]。但是神经网络对于CT 中病灶区域较小的病变位置的定位识别较差[9]。基于此,本文以深度神经网络为主干,提出了一种基于空间注意力机制的CT 图像病灶的识别定位模型,使网络模型自动捕捉到关键区域,减少无关区域的影响[10-11],并在检测区域融合了特征金字塔FPN,进一步提升算法识别定位的性能。现报道如下。
注意力机制的提出源于对人类视觉的研究,众所周知当人脑接收到外部信息后,并不会对全部信息进行处理,而只会将关注重点集中在表现显著或感兴趣的信息上,注意力机制模仿了这种工作原理[12-13]。在计算机视觉中,注意力机制就是让系统关注图像中最重要的区域而忽略无关的区域,它可以被视为一个动态选择的过程,根据输入图像的重要性,通过自适应加权特征来实现[14]。
本文提出的基于空间注意力机制CT 识别检测模型主要由两个部分组成,即用于提取CT 图像ROI 的区域检测部分和用于对病变区域分类定位的注意力机制网络部分,整体流程见图1。
CT 识别定位模型的区域检测网络将特征图金字塔网络FPN 与RPN 网络相结合,用于提取CT 的感兴趣区域。
但RPN 在小目标的检测中准确度不理想[15-16]。但是CT 图像中常有面积较小的病变区域,例如肺结节、纤维化等。为了解决RPN 网络的该项不足,将特征金字塔网络嵌入网络,将FPN 所提取的多尺度的特征图谱作为RPN 网络的输入对象,使RPN 网络对小目标细节的检测更加精确。区域检测部分的整体框架见图2。
该检测区域的损失函数也为两部分,其方程如下:
式中,anchor 锚框的索引用a表示,而第a个被anchor 预测为目标的概率则用Wa表示,而区域网络中anchor 所预测的位置回归信息表示为Qa。而Kcls与Kreg分别表示损失函数以及回归函数,a则为分类损失和回归损失的权重比,且a=1,使用smooth L1 函数作为回归损失函数,其定义方程如下:
本文在DenseNet-121 网络的变体中引入了注意力机制,将区域检测部分所提取的ROI 特征作为注意力信息输入,使网络能够更加专注于病变的位置,从而减少噪声的影响。网络构架见图3。
图3 基于空间注意力机制的CT 识别定位网络模型构架
假设第l层的输出表示为ml,而Fl表示一个非线性变换,方程(7)能够描述DenseNet-121 网络中Dense block 模块的每一层变换:
每张CT 以及注意力图集通过Dense block 均能得到相应的特征图,将原始CT 与注意力特征图相融合,而后输入全连接层以及igmoid 层进行分类,得到相应的分类结果。本文以能够在通道数目不改变的情况下,使提取的特征图增加信息量的逐像素相加融合特征,从而避免网络的复杂性。而后以最大值原则对a个分类结果进行选择:
其中,Xa表示该图像的疾病类别。
CT 图像中异常区域的定位由分类得分给出。
本文的实验采用公开的DeepLesion 数据集来进行,该数据集包含了8 类病灶,如腹部、肝脏、肺部、肾脏、软组织、骨盆、纵膈以及骨骼等病灶。将DeepLesion 数据集分成3 个类别,即训练集、测试集和验证集,按照75%、15%和15%的比例划分,其中训练集包含22124 张CT 切片。
各区域病灶的识别均取得了较为优异的结果,其大小尺寸肝脏病灶以及纵膈病灶两处都出现了两组预测率,这是因为数据集提供的病变位置范围较广,而且病灶的形状比较不规则,故将该病变预测为单独的2 个病变。见表1。
表1 本文网络的预测概率
本文建立的算法模型在精度、灵敏度、特异度上均优于其他的神经网络模型,在去除特征图金字塔网络FPN的差异后,也明显使本文的算法模型更加优异。其中,AUC 的分值也是本文提出的算法模型较高,而AUC 的值越大则表明该算法模型的识别定位性能越好,从AUC值来看,也进一步表明本文算法的分类识别性能更好。各模型的性能均值见表2。
CT 是使用放射技术诊断疾病最普遍的方法,目前已成为现在医学检查中重要的辅助工具。虽然CT 技术的应用为医生等工作人员提供了患者清晰的人体器官结构,但是处理图像并诊断疾病是一件耗时费力的工作。相较于传统的人工检测CT 图像的病变,不仅耗时费力而且耽误治疗方案的及时提出。
综上所述,基于空间注意力机制的特性,使构建的神经网络模型在特征的提取上避免无关区域的影响,使网络模型对关键区域的提取更加精准,进而提升模型的算法识别定位性能。且本文基于空间注意力机制建立的深度卷积神经网络模型,在仿真实验中,对病灶的预测率均在90%以上,以此可见本文建立的模型具有一定的可行性。但在应用过程中,并不能避免假阳性的出现。因此,网络可能还需要额外的信息才能够降低错误判断的样本数量。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!