时间:2024-05-04
杨明明,贺玉华
(四川大学计算机学院,成都610065)
由于X 射线计算机断层图像(Computed Tomogra⁃phy,CT)具有扫描速度快、成像清晰等特点,CT 图像在医学临床诊断方面得到广泛应用。CT 技术在为医学临床诊断带来极大方便的同时,CT 扫描时存在的辐射也在严重危害着人类的健康,过量的X 光照射会诱发多种疾病,如白血病、癌症以及其他一些遗传性疾病,目前CT 已经被许多国家列为最主要的医疗辐射源[1]。随着人们对CT 辐射的认识不断加深,保证CT 图像质量的同时,尽可能减少受检者的辐射剂量(ALARA)已成为当今影像学重要的研究方向和目标[2]。然而随着辐射量的减少,重建出的CT 图像多出现噪声、伪影,对临床诊断有极大的影响,所以出现了许多改善CT 图像重建质量的方法以及低剂量CT 图像(LDCT)的图像处理的方法。这些方法可以大致分为三类:投影域处理方法、图像域重建方法和图像后处理方法。
投影域处理方法也成为预处理方法,对于探测器接收到的投影数据,进行去噪处理,再通过滤波反投影或者其他重新方法进行CT 图像重建。由于这类方法效率极高,因此便于临床应用,但是其对设备依赖性较高,且大多数厂家拒绝提供投影数据,阻碍了此类算法研究的发展。
图像重建方法包括解析重建和迭代重建。解析法是以Radon 变换对投影域数据进行处理后的一种方法,如滤波反投影(Filtered Back Projection,FBP)重建方法[3],解析法重建速度较快,但是对CT 扫描的辐射剂量有较高的要求。迭代法图像重建算法迭代去计算人体每个部位的CT 值,从而获得更好的图像质量,但是迭代法需要大量的计算,对计算机性能要求过高。
后处理算法对低剂量扫描获得的CT 图像进行处理,以正常剂量的CT 图像作为算法去噪目标,经过去噪处理得到标准清晰的CT 图像,无需投影域数据,具有图像重建算法与CT 设备无关性,更具有普适性。
近年来,随着深度学习技术的不断发展,深度学习技术在计算机视觉得到了广泛应用,人工神经网络算法已经在图像去噪领域取得了良好成绩,基于深度学习的低剂量CT 图像去噪算法也取得了良好表现。Chen H 等人基于卷积神经网络设计的低剂量CT 图像去噪方法取得了良好的去噪效果[4-5],随后经过加深网络结构和使用残差连接对AutoEncoder 进行改进设计出了RED-CNN[6],在模拟数据与临床数据上均取得了不错的实验效果;章港云等人利用空洞卷积扩大感受野并使用残差连接设计出卷积神经网络降低网络的复杂度,在加快训练速度的同时得到了十分有效的去噪效果[7];徐曾春等人利用改进型WGAN 在CT 去噪上也取得了十分不错的实验效果[8]。以上神经网络方法均在低剂量CT 图像去噪上取得了一定的实验效果,但是其对于一些重要的细节信息均有一定程度的丢失,故本文基于WGAN 设计的神经网络模型保留了更多的细节信息,同时取得了十分不错的去噪效果。
Chen H 等人在2017 年提出的RED-CNN,将传统的AutoEncoder 进行了改进,结构与传统的编码解码器结构类似,将快捷连接使用到对应的Encoder 与Decoder 之间,可以有效弥补结构信息的失真,并且可以有效提升神经网络的训练速度,RED-CNN 的网络结构如图1 所示,由5 层卷积层与5 层反卷基层组合而成,使用5×5 的卷积核有效地扩大神经网络的感受野,卷积核数为96 来获取更多的特征信息,最后一层使用卷积核数为1 的卷积层来获取和输入图像一样尺寸的图像,并且对应相同尺寸的卷积层与反卷积层之间还存在快捷连接,不仅可以提高深度神经网络的收敛速度,还可以减少信息的丢失。
图1 RED-CNN网络结构图
生成对抗网络(Generative Adversarial Network,GAN)[9]由生成器和判别器组成,生成器用于学习真实图像的分布,并生成真实分布的图像,判别器用于判别生成器生成的图像的真实性,判别器输出的是一个0-1的概率,用来判断图像的真实性,如果是1 则表示为真,0 表示为假。在训练过程中,生成器尽可能生成属于真实分布的图像,而判别器则给生成器生成的结果一个较低的分数,来不断提升生成器生成图像的质量,以此来进行生成器与判别器之间的相互博弈。生成对抗网络的目标函数如公式(1)所示:
其中G 为生成器,D 为判别器,x 为输入,y 为目标图像,在目标函数中,D(y)越大,D(G(x))越小,最终实现生成对抗网络的训练相对平衡。
本文主要是基于生成对抗网络的低剂量CT 图像去噪方法,由于传统的生成对抗网络训练十分困难,判别器如果训练的较好,则生成器将无法得到有效的梯度,否则若判别器训练的不好,生成器依然无法得到有效的梯度。原始GAN 容易产生训练不平衡以及梯度消失的问题,因此本文采用WGAN(Wasserstein GAN)[10]来进行训练,WGAN 通过引入Wassertein 距离作为新的距离衡量方式,来有效地约束生成器与判别器之间的关系,使生成器与判别器的训练过程趋于一致,更好地维系两者的零和博弈思想,可以有效、更好地进行生成对抗网络的训练。Wassertein 距离又称为Earth-Dis⁃tance,定义如下:
其中,其中inf 表示取下确界,Ω为联合分布的集合。
WGAN 网络模型由两部分组成,分别为生成器和判别器,WGAN 的工作原理是:首先生成器G 接受一个输入图像X,同时生成器学习真实图像Y 的分布以生成图像Y’,此时生成器相当于一个函数映射G(x)->Y’;然后将真实图像X 和生成器生成的图像Y’送入判别器D,判别器D 来判断生成的图像Y’是来自真实图像Y 还是生成的图像Y’。在训练过程中,生成器生成尽可能生成接近真实图像Y 的图像,而判别器则逐渐提高判别“真”“伪”的能力,从而实现一种生成对抗的关系。
生成器的主要功能是生成接近真实图像的图像,如图2 所示是本文所采用的生成器网络结构,根据特征图通道具有冗余性,部分特征图通道的信息对编码具有冗余性,本文所采用的生成器由三个连续的模块组成,如图3 所示,每个模块中,将一半的特征图通道进行下采样,以获得更大的感受野,同时保留一半的特征图通道以不丢失对编码有用的信息,之后将降采样的信息与原始的信息进行信息交互,之后再将其合并以恢复正常的图像尺寸。本文所采用的生成器的三个模块之间存在快捷连接,以为了减少信息的丢失,保留更多的原始信息。其中除了最后一个卷积层为了产生与输入图像相同的尺寸使用卷积核个数为1 的卷积层外,其余卷积层的参数均为3×3 的卷积核和64 的卷积核个数。
图2 生成器总体结构
图3 Block结构
为了更好地训练WGAN 生成器,除了GAN 的损失函数外,还加入了生成图像与正常剂量的CT 图像的L1 损失,最后生成器的损失函数为:
判别器的主要功能是为了区分生成图像和真实图像,本文所使用的判别器为PatchGAN[10],PatchGAN 将输入经过卷积层,分为不同的图像块来判断每一个图像块的真实性。本文所采用的判别器由7 层卷积层组成,其中奇数层的卷积层的步长为1,其余的卷积层步长为2,卷积层的卷积核数依次为64,64,128,128,256,256,1。除了第一层和最后一层卷积层外,其他的每次卷积层后都有ReLU 和batch normalization。判别器的网络结构如图4 所示。
图4 判别器网络结构
WGAN 通过引入Wassertein 距离来解决梯度消失或爆炸的问题,所以本文最终所使用的判别器如下所示:
其中λ为梯度惩罚项系数。
本文所采用数据集的是Mayo 数据集,该数据集是模拟的CT 数据集,原始数据集包括5936 对512×512的CT 图像,将其中526 对图片留作测试集,其他5410对图作为训练集,为了更好的实验效果,本文将训练数据其每隔16 个像素点切分为64×64 的CT 图像,最后得到86560 对CT 图像,使用如上所示的生成器和判别器,batch size 设为4,判别器梯度惩罚项系数λ设为10,使用随机梯度优化进行网络优化,学习率为0.0001,基于TensorFlow 在Windows 环境下进行训练,GPU 为NVIDIA GTX 2080Ti,训练迭代30000 步得到最后的训练结果。
为了更好地验证本文方法的去噪表现,实验将本文与K-SVD 方法和RED-CNN 方法进行比较,为了保证对比实验公平性,本文所使用的K-SVD 使用最优参数,而基于深度学习的RED-CNN 方法则采用与本文相同的训练数据,所有的实验结果如图5 所示。从实验结果可以看出,本文所使用的方法可以有效去除噪声,并且在感兴趣区域可以保留更多的细节信息,而K-SVD 的实验结果表明,其无法有效去除低剂量CT图像中的噪声,而RED-CNN 的结果显示RED-CNN可以有效去除噪声,但是导致了图像过平滑,并且RED-CNN 会丢失了一部分的细节信息,影响临床诊断。
图5 本文方法与对比方法的实验结果
本文提出了一种基于生成对抗网络的低剂量CT图像去噪方法,通过从低剂量有噪声的CT 图像来学习正常剂量清晰的CT 图像来实现函数映射过程。实验结果表明,本文所使用的方法,可以有效地实现低剂量CT 图像去噪,同时相比于其他方法,去噪效果明显,还能保留更多的细节信息,更好地帮助临床诊断。
前两行为不同方法的测试结果,最后一行为对感兴趣区域方法后的效果。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!