基于强化学习的B型主动脉夹层定位方法_《生物医学工程学杂志》

作者：

曾安 ¹ , 林先扬 ¹ , 赵靖亮 ¹ ,  潘丹 ² , 杨宝瑶 ¹ , 刘鑫 ¹

1. 广东工业大学计算机学院（广州 510006）;
2. 广东技术师范大学电子与信息学院（广州 510665）;

关键词：

主动脉夹层两阶段分割强化学习奖励函数

DOI：

10.7507/1001-5515.202309047

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

主动脉夹层分割中存在主动脉夹层与周围器官和血管的对比度低、夹层形态差异大以及背景噪声大等问题。针对以上问题，本文提出一种基于强化学习的B型主动脉夹层定位方法，借助两阶段分割模型，使用深度强化学习执行第一阶段的主动脉定位任务，保证定位目标的完整性；在第二阶段，使用第一阶段的粗分割结果作为输入，得到精细的分割结果。为了提高一阶段分割结果的召回率（Recall），使定位结果更完整地包含分割目标，本文设计了基于Recall变化方向的强化学习奖励函数；同时，将定位窗口与视野窗口分离，减少分割目标缺失的情况。本文选取Unet、TransUnet、SwinUnet以及MT-Unet作为基准分割模型，通过实验验证，本文的两阶段分割流程结果中多数指标均优于基准结果，其中Dice指标分别提高1.34%、0.89%、27.66%和7.37%。综上，将本文的B型夹层定位方法加入分割流程，最终的分割精度较基准模型结果有所提升，对于分割效果较差的模型提升效果更显著。

引用本文： 曾安, 林先扬, 赵靖亮, 潘丹, 杨宝瑶, 刘鑫. 基于强化学习的B型主动脉夹层定位方法. 生物医学工程学杂志, 2024, 41(5): 878-885. doi: 10.7507/1001-5515.202309047 复制

0 引言

主动脉夹层（aortic dissection，AD）是一种危险的心血管疾病^[1-2]，是由内膜撕裂或者腔内出血和血肿形成引起的内膜穿孔，使主动脉腔内的血液从主动脉内膜撕裂处进入主动脉中膜，从而形成主动脉壁的真假两腔分离的状态。Stanford分型根据是否累及升主动脉，将夹层分为AB两类，其中所有未累及升主动脉的夹层为B型主动脉夹层。在主动脉夹层的诊断和治疗中，手动分割主动脉夹层区域是一项繁琐、费时的任务，人的主观性会影响诊断准确性和治疗效果。即使是在同一部位，主动脉撕裂内膜的方向、主动脉横截面的形状位置以及主动脉弓的形态学属性均有一定差异，再加上主动脉内部的血液流速和血管壁的厚度等因素的影响，使得主动脉夹层图像分割^[3]具有挑战性。

基于主动脉夹层的传统分割方法，已经提出了多种策略，包括Hough变换法^[4]、基于空间连续性先验模型法^[5]、多尺度小波分析法^[6]以及基于图像去噪的方法^[7]等。这些方法在小规模数据集上展现了良好的分割效果，然而，它们都依赖于手动选择初始特征或者过多的人工处理，从而限制了其准确性和扩展性。因此，需要进一步研究和发展更准确、自动化且可靠的主动脉夹层分割方法。目前深度学习技术是应用于医学图像分割的主流方法。

主动脉图像存在各种噪声和伪影，如果直接作为深度学习网络的输入，网络需要分辨非分割目标信息，分散了对分割目标的专注学习，可能会减少分割细节的精确度。对于一些鲁棒性较差的分割网络，影响更为显著。针对以上问题，Zhu等^[8]提出了由粗到细的两阶段分割模型，两阶段方法可以有效减少输入图像的噪声和干扰信号。文献[8]使用深度学习提取感兴趣区域，文献[9]在此基础上增加了形态学处理方法，但这些方法在粗分割阶段缺乏有效的纠错机制，使得模型的定位结果往往不可靠，会影响最终的分割效果。

而深度强化学习通过自主学习和决策，可以适应各种复杂环境和任务、处理高维数据，可以解决基于深度学习带来的粗分割问题。Man等^[10]在粗分割阶段使用强化学习实现自主定位，提高了分割目标的定位效果。但文献[10]使用基于自然图像预训练的VGG^[11]网络进行特征提取，这种方式不能很好地利用医学图像特有的特征。同时它的奖励函数使用了强化学习在目标检测应用中的常规奖励函数^[12]，不能很好地适配粗分割阶段的任务目标，定位结果存在一定的目标缺失情况，Recall尚有较大的提升空间。针对上述问题，受文献[10]的启发，本文提出针对B型主动脉夹层图像的两阶段分割流程。首先，为了丰富医学切片图像的特征信息，本文将基于Resnet^[13]的修改网络作为特征提取网络，对主动脉切片数据进行特征提取；其次，使用深度强化学习训练自适应环境定位的智能体，减少主动脉夹层形态差异带来的影响，保证定位窗口尽可能包含分割目标的同时，减小窗口的尺寸，去除更多的冗余信息；最后，选取Unet^[14]、TransUnet^[15]、SwinUnet^[16]、MT-Unet^[17]作为细分割阶段模型，将经过粗分割的切片结果集合作为基准分割网络的输入，得到最终的分割结果，进一步提高基准分割网络的分割精度。

1 方法

1.1 整体流程

本文提出基于强化学习的B型主动脉夹层两阶段分割方法，整体流程如图1所示。本方法可分为特征提取、粗分割和细分割三个阶段。首先，对主动脉夹层数据进行特征提取，获取医学图像相关特征，与原图像组合得到强化学习网络的初始输入。其次，使用强化学习探索每个样本的粗分割定位序列，通过奖励信号驱动网络更新，将训练结束的强化学习网络应用于所有主动脉夹层数据得到粗分割结果集合。最后，将粗分割结果作为分割网络的输入得到细分割结果。

图1 B型主动脉夹层分割方法 Figure1. Segmentation method for type B aortic dissection

图选项

定位策略	IoU	Recall
R₁	0.572 2	0.818 6
R₁ + 窗口分离	0.456 0	0.902 7
R₂	0.432 4	0.921 9
R₂ + 窗口分离	0.339 3	0.969 1

方法	IoU	Dice	Precision	Recall₂
Unet^[14]	0.766 8	0.827 5	0.886 2	0.799 6
TransUnet^[15]	0.765 2	0.826 6	0.868 0	0.803 1
SwinUnet^[16]	0.277 7	0.399 2	0.435 6	0.403 1
MT-Unet^[17]	0.700 4	0.757 5	0.876 4	0.727 8
RL + Unet	0.775 9	0.840 9	0.887 2	0.814 6
RL + TransUnet	0.769 3	0.835 5	0.890 6	0.806 4
RL + SwinUnet	0.546 4	0.675 8	0.704 9	0.677 6
RL + MT-UNet	0.767 6	0.831 2	0.867 7	0.818 6

1.	Sayed A, Munir M, Bahbah EI. Aortic dissection: A review of the pathophysiology, management and prospective advances. Curr Cardiol Rev, 2021, 17(4): 87-101.
2.	陈永昆, 张石龙, 张顺利, 等. 主动脉夹层发病的影响因素分析. 临床医学进展, 2023, 13(6): 9541-9550.
3.	Hahn L D, Baeumler K, Hsiao A. Artificial intelligence and machine learning in aortic disease. Curr Opin Cardiol, 2021, 36(6): 695-703.
4.	Fetnaci N, Łubniewski P, Miguel B, et al. 3D segmentation of the true and false lumens on CT aortic dissection images// Three-Dimensional Image Processing (3DIP) and Applications 2013. Burlingame: SPIE, 2013, 8650: 176-190.
5.	Duan Xiaojie, Shi Meichen, Wang Jianming, et al. Segmentation of the aortic dissection from CT images based on spatial continuity prior model// 2016 8th International Conference on Information Technology in Medicine and Education (ITME). Fuzhou: IEEE, 2016: 275-280.
6.	Lee N, Tek H, Laine A F. True-false lumen segmentation of aortic dissection using multi-scale wavelet analysis and generative-discriminative model matching// Medical Imaging 2008: Computer-Aided Diagnosis. San Diego: SPIE, 2008, 6915: 878-888.
7.	呼亚萍, 孔韦韦, 李萌, 等. 基于边缘检测全变分模型的图像去噪方法. 现代电子技术, 2021, 44(5): 52-56.
8.	Zhu Z, Xia Y, Shen W, et al. A 3D coarse-to-fine framework for automatic pancreas segmentation. arXiv preprint arXiv: 2017: 1712.00201.
9.	吴春彪. 基于两阶段全卷积神经网络的冠状动脉分割研究. 计算机科学与应用, 2022, 12(4): 828-834.
10.	Man Y, Huang Y, Feng J, et al. Deep Q learning driven CT pancreas segmentation with geometry-aware U-Net. IEEE Trans Med Imaging, 2019, 38(8): 1971-1980.
11.	Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv, 2014: 1409.1556.
12.	Le N, Rathour V S, Yamazaki K, et al. Deep reinforcement learning in computer vision: a comprehensive survey. Artif Intell Rev, 2022, 55: 2733-2819.
13.	He K, Zhang X, Ren S, et al. Deep residual learning for image recognition// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 770-778.
14.	Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation// International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich: Springer International Publishing, 2015: 234-241.
15.	Chen J, Lu Y, Yu Q, et al. Transunet: Transformers make strong encoders for medical image segmentation. arXiv preprint arXiv, 2021: 2102.04306.
16.	Cao H, Wang Y, Chen J, et al. Swin-Unet: Unet-like pure transformer for medical image segmentation// European Conference on Computer Vision. Tel Aviv: Springer, Cham, 2022: 205-218.
17.	Wang H, Xie S, Lin L, et al. Mixed transformer U-net for medical image segmentation// ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Singapore: IEEE, 2022: 2390-2394.
18.	Wang X, Wang S, Liang X, et al. Deep reinforcement learning: A survey. IEEE Trans Neural Netw Learn Syst, 2022, 35(4): 5064-5078.
19.	Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning. Nature, 2015, 518(7540): 529-533.
20.	Zhao Z. Variants of Bellman equation on reinforcement learning problems// 2nd International Conference on Artificial Intelligence, Automation, and High-Performance Computing (AIAHPC 2022). Zhuhai: SPIE, 2022, 12348: 467-478.
21.	Hasselt H, Guez A, Silver D. Deep reinforcement learning with double Q-Learning// Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence. Phoenix: AAAI Press, 2016: 2094-2100.
22.	Wang Z, Schaul T, Hessel M, et al. Dueling network architectures for deep reinforcement learning// International Conference on Machine Learning. New York City: PMLR, 2016: 1995-2003.
23.	Hausknecht M, Stone P. Deep recurrent Q-learning for partially observable MDPs// 2015 AAAI Fall Symposium Series. Arlington: AAAI, 2015: 29-37.
24.	Xiong J, Po L M, Cheung K W, et al. Edge-sensitive left ventricle segmentation using deep reinforcement learning. Sensors, 2021, 21(7): 2375.
25.	Yao Z, Xie W, Zhang J, et al. ImageTBAD: A 3D computed tomography angiography image dataset for automatic segmentation of type-B aortic dissection. Front Physiol, 2021, 12: 732711.
26.	dos Santos Mignon A, da Rocha R L A. An adaptive implementation of ε-greedy in reinforcement learning. Procedia Comput Sci, 2017, 109: 1146-1151.

《生物医学工程学杂志》

基于强化学习的B型主动脉夹层定位方法

摘要 全文 图表 视频 参考文献 施引文献 补充材料

0 引言

1 方法

1.1 整体流程

1.2 强化学习介绍

1.3 特征提取模块

1.4 粗分割模块

1.4.1 深度强化学习模型

1.4.2 状态设计

1.4.3 窗口分离

1.4.4 动作设计

1.4.5 奖励函数设计

1.4.6 细分割模块

2 实验设计与分析

2.1 数据集

2.2 参数设置与评价指标

2.3 实验结果与分析

2.3.1 B型主动脉夹层定位过程

2.3.2 定位策略对比

2.3.3 分割方法对比

3 结论

0 引言

1 方法

1.1 整体流程

1.2 强化学习介绍

1.3 特征提取模块

1.4 粗分割模块

1.4.1 深度强化学习模型

1.4.2 状态设计

1.4.3 窗口分离

1.4.4 动作设计

1.4.5 奖励函数设计

1.4.6 细分割模块

2 实验设计与分析

2.1 数据集

2.2 参数设置与评价指标

2.3 实验结果与分析

2.3.1 B型主动脉夹层定位过程

2.3.2 定位策略对比

2.3.3 分割方法对比

3 结论

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料