核与辐射突发事件发生后,在体电子顺磁共振(in-vivo EPR)方法可对伤员辐射剂量进行现场、快速、无创检测。对in-vivo EPR波谱分析,目前常采用人工标记峰值并计算信号强度,存在工作量大、受主观因素干扰等问题。本研究利用支持向量机(SVM)技术,建立了一种对in-vivo EPR波谱进行自动分类识别的方法,可批量自动识别并筛除in-vivo EPR测量时因振动、牙表面水干扰而产生的无效波谱。本研究利用遗传算法优化神经网络(GA-BPNN)建立了一种波谱分析方法,可对in-vivo EPR波谱中的辐射诱发信号进行自动识别,并预测伤员受到辐射的剂量。实验结果表明,本研究建立的SVM和GA-BPNN波谱处理方法可有效地完成in-vivo EPR波谱自动分类和剂量预测,可满足核事故应急剂量评估的需求。本研究探索了机器学习方法在电子顺磁共振(EPR)波谱处理领域的应用,提高了EPR波谱处理的智能化水平,为提升大批量EPR波谱处理效率提供了支撑。
引用本文: 熊广为, 陈博, 马蕾, 贾泷澎, 陈淑年, 吴可, 宁静, 朱斌, 郭俊旺. 基于机器学习的在体电子顺磁共振波谱分类和辐射剂量预测方法研究. 生物医学工程学杂志, 2024, 41(5): 995-1002. doi: 10.7507/1001-5515.202302015 复制
0 引言
核与辐射突发事件可能导致在场人员受到电离辐射威胁,进而产生健康损伤;快速估算人员受照射剂量是核应急医学救援中确定救治方案和合理规划医疗资源配置的关键。利用电子顺磁共振(electron paramagnetic resonance,EPR)技术测量牙齿是一种经典的辐射剂量评估方法,具有准确、辐射特异性好等优势,在体(in-vivo)EPR技术(in-vivo EPR)进一步解决了取样测量牙齿EPR剂量的难题,在核应急医学救援中具有良好的应用前景。
EPR波谱处理包括拟合、寻峰标记、信号强度计算等流程[1-2],最终样品受到的辐射剂量根据信号强度和经验曲线获得。针对EPR波谱处理和辐射剂量评估方法,已有研究者开展了系列相关研究:Bordi等[3]在非线性最小二乘法拟合的基础上使用列文伯格—马夸尔特(Levenberg-Marquardt)算法对剂量进行估算;Chumak等[4]和D’Oca等[5]设计了附加剂量技术;Zhumadilov等[6]和Parlato等[7]采用了非线性最小二乘法拟合以及特定函数叠加的方法;Beshir[8]和Kwona等[9]探究了多次拟合方法在剂量评估中的效果;Vanhaelewyn等[10]采用了最大似然估计对EPR波谱进行反卷积和剂量评估;Grün等[11]研究了自然谱法用于信号强度评估;Ivanov等[12]提出了一种基于已知辐射诱发信号(radiation induced signal,RIS)强度的波谱拟合未知剂量波谱的方法;Boyau等[13]开发了基于贝叶斯框架的波谱拟合程序;Ciesielski等[14]和Zou等[15]在EPR波谱处理中利用标准样品二价锰离子(Mn2+)校正、本底波谱信号扣除、体积校正等方法进一步提高了剂量评估的准确性。上述研究中对EPR波谱处理和剂量评估的方法以拟合或者解析算法为主,目标是将EPR波谱转化为具有某种特征的曲线,并对特征值进行计算。该方法的优势是波谱解析性高、结果解释性好,但也存在波谱处理过程复杂、对特征识别具有人为主观性偏差等问题。in-vivo EPR波谱数量较大,且因被测人员生理振动、在体样品含水等特殊干扰导致无效波谱较多[16-20],用经典拟合或解析方法或将面临时间开销过大、波谱选择和处理中主观因素干扰多等问题。
支持向量机(support vector machines,SVM)是基于统计学习理论的一种有监督学习的机器学习方法,若在建模前结合主成分分析(principal component analysis,PCA)、线性判别分析(linear discriminant analysis,LDA)等降维方法,可很大程度上解决“维度灾难”和“过拟合”的问题,现已广泛应用于聚类分析、模式识别、机械故障诊断等领域中[21-23]。本研究采用该方法对大量in-vivo EPR波谱进行分类识别,解决在体测量中生理振动、样品含水等因素影响产生的无效波谱分类问题。反向传播神经网络(back propagation neural network,BPNN)具有较高的适应性、鲁棒性和拟合能力,通常应用于数据预测及分类识别中,本研究利用遗传算法(genetic algorithm,GA)优化BPNN的方法(GA-BPNN)对in-vivo EPR波谱进行分析处理,以实现辐射剂量预测,解决EPR波谱中辐射诱发信号特征点选取主观性强、人工计算速度慢等问题。
1 问题模型
1.1 in-vivo EPR波谱筛选分类
in-vivo EPR测量样品常为牙齿,受在体测量过程中生理振动、牙表面水等因素影响,波谱中经常会引入对辐射诱发信号产生显著干扰的噪声,严重情况下可能造成波谱失效。将in-vivo EPR波谱分为有效波谱(记为“0”类)、无信号波谱(记为“1”类)、受干扰波谱(记为“2”类),各类波谱示意如图1所示。有效波谱具有典型的RIS,可用于辐射剂量评估;人工判别方法是在波谱特定位置(图1中RIS框位置)观察是否有特征RIS。无信号波谱中无RIS,其原因是样品放置不到位或测量参数不当;对此,人工判别方法的依据是波谱特定位置不存在特征RIS。受干扰波谱是in-vivo EPR测量过程中因振动、牙表面水等因素引入显著干扰噪音的波谱,导致无法进行辐射剂量预测;其人工判别方法是在波谱中寻找是否存在除RIS和标样信号(standard reference signal,SRS)外的其他强信号。in-vivo EPR测量采用多次短时间重复扫描的策略,故波谱数量较大,依赖人工筛选有效波谱时间代价较大。为提高波谱筛选分类效率,本研究采用SVM方法进行波谱筛选分类。波谱分类准确率如式(1)和式(2)所示:

![]() |
![]() |
上式中,Ti为第i类波谱分类的准确率,TPi为第i类波谱分类准确的个数,FPij为将第i类波谱误分类为第j类波谱的个数,T总为所有波谱分类的准确率。
1.2 辐射剂量预测
牙齿样品辐射剂量与EPR波谱RIS强度正相关,一般采用人工寻峰的方式确定EPR波谱中的波峰和波谷,波峰波谷相对差值作为RIS强度,结合实验室建立的曲线推导计算样品受到照射的剂量。在波谱数量较多时,该方法时间开销较大且寻峰过程有一定的主观性。本研究采用GA-BPNN的方法对批量波谱进行辐射剂量预测,预测剂量与实际剂量的相对误差如式(3)所示:
![]() |
式中,E为实际剂量与预测剂量的相对误差,Dr为实际照射剂量,Ds为预测剂量。
1.3 EPR波谱处理流程
EPR波谱处理过程包括:① 采集一定数量的EPR波谱;② 导入波谱并显示;③ 将EPR波谱转化为以g值为横坐标的标准化波谱;④ 利用SVM算法进行波谱分类;⑤ 将分类后的有效波谱叠加平均处理;⑥ 利用GA-BPNN算法进行初步辐射剂量预测;⑦ 对预测辐射剂量进行体积因子校正。EPR波谱处理流程如图2所示。

2 in-vivo EPR波谱分类方法
2.1 SVM分类模型的建立
为便于SVM和GA-BPNN处理,首先将波谱转化为横坐标为g值的标准化波谱,每个波谱选取860个离散数据点。利用PCA方法降低至121个维度,再利用“核函数”将121个维度的in-vivo EPR波谱数据映射到更高维度的空间中,构建一个离训练样本点支持集最远的超平面,从而实现对in-vivo EPR波谱分类。由于in-vivo EPR波谱的形态复杂,可能会存在一些错分的现象,其求解目标表达式如式(4)所示[24-25]:
![]() |
式(4)中,w为权重向量,wT为权重向量的转置,b为偏置向量,c为惩罚系数,ξi为松弛变量,φ为从低维到高维的映射函数,xi为某个EPR波谱数据,yi为某个EPR波谱的标签。
2.2 波谱分类模型训练的分析
采集一批in-vivo EPR波谱用于波谱分类模型的建立,具体采集方法见后文4.1小节,本次共采集到7 356组波谱数据,其中前5 880组波谱用作模型训练,剩余波谱用作效果验证。本文选取高斯核函数作为SVM核函数,根据经验将SVM的c值设置为1,γ值为特征值的倒数即1/860[26]。实验验证所得SVM分类的准确率如表1所示,总准确率为97.56%。对于波谱分类错误的示例如图3所示:当辐射剂量较小时,有效波谱可能被错误地分类为无信号波谱;当本底信号过强时,无信号波谱可能被分类为有效波谱;当干扰信号叠加在RIS信号上时,受干扰波谱可能被错误地分类为有效波谱。


3 辐射剂量预测方法
3.1 GA-BPNN模型
BPNN由输入层、隐藏层和输出层构成,其关系如式(5)所示,网络可不断地通过反向传播来降低损失函数值,使自变量和因变量之间的关系无限逼近一个函数[27]。在利用in-vivo EPR波谱开展辐射剂量预测过程中,输入层为若干波谱数据,输出层为辐射剂量。
![]() |
![]() |
![]() |
式中,Ii为神经网络的输入层,xi为某个EPR波谱数据,n为输入层中节点的数量;Hj为网络的隐藏层,f1为隐藏层激活函数,w1ij为输入层到隐藏层之间的权值,b1j为输入层到隐藏层之间的阈值,m为隐藏层中节点的数量;Ok为网络的输出层,f2为输出层激活函数,w2jk为隐藏层到输出层之间的权值,hj为隐藏层的输出值,b2k为隐藏层到输出层之间的阈值,l为输出层中节点的数量。
针对BPNN在训练过程可能存在难以确定网络最优的权值和阈值、收敛时间过长及容易陷入局部寻优等问题[28],本研究采用GA方法来进一步优化BPNN。采用浮点数编码的形式对染色体进行编码,以变异操作对染色体中的某些基因进行变动,从而不断产生新的个体更新迭代,如式(6)所示:
![]() |
式中,Cij为第i个染色体的第j个基因,Cmax为基因Cij的上界,Cmin为基因Cij的下界,r为随机数,,e为迭代次数,Emax为算法的最大迭代次数。
GA-BPNN可分为GA和BPNN两部分,其核心算法为:将BPNN层与层之间的权值和阈值作为GA中的“种群个体”并进行编码,通过GA的遗传操作不断产生新的种群,最后以神经网络中的损失值作为评判标准计算个体适应度,从而获得最优的初始化权值和阈值并带到网络中进行训练[29-30]。最终辐射剂量预测GA-BPNN方法的具体结构如图4所示。

3.2 牙齿样品和体积因子校正
本研究中,被测量样品为33颗没有明显蛀龋、金属填充物或牙髓移植治疗史的门牙,牙齿样品采集于301医院、307医院和重庆医科大学附属第一医院。该牙齿作为常规医疗的一部分被移除且被做了匿名处理的患者废弃,本课题组与患者无任何接触,不涉及取牙处理,故不涉及伦理审批;且所有牙齿样品经上述医院授权,可用于本研究。
由于被测样品形状各异,导致样品进入谐振腔的有效体积存在一定差异,因此需根据样品被测体积对RIS强度进行校正,具体流程为:首先利用三维扫描仪(Aoralscan 3,先临三维,中国)对样品三维形态进行扫描,以获取牙齿样品的三维模型;然后,根据牙齿和谐振腔探测口三维模型确定样品和谐振腔的装配关系,计算牙齿进入谐振腔探测口部分的样品体积;最后,根据样品体积进行RIS校正。
3.3 剂量预测模型训练
将单个in-vivo EPR波谱数据的860个离散值作为神经网络输入层,隐藏层个数为32,采用线性整流函数(rectified linear unit,Relu)作为神经网络隐藏层和输出层之间的激活函数,最小平方误差作为损失函数,GA的种群规模大小为50,交叉概率为0.8,变异概率为0.005,迭代次数为50,最小平方误差的倒数作为适应度函数。采用循环交叉的方式,对辐照剂量为0~10 Gy的牙齿样品进行EPR波谱采集,共获得3 056组波谱数据,其中2 435组用作训练,其余621组用作验证。采用上述方法进行8 000次训练,经测试利用GA-BPNN方法的预测剂量与实际照射剂量相对误差如图5所示,预测剂量与实际照射剂量的平均相对误差为18.6%,其中相对误差在25%以内的有482组。

4 实验验证
4.1 牙齿EPR测量
将33颗牙齿样品分为11组,每组3颗,利用钴-60(Co-60)放射源分别给予0~10 Gy剂量γ射线照射,组间距为1 Gy。然后,将照射后的牙齿样品固定于口腔模型进行模拟in-vivo EPR测量实验。本研究牙齿样品和模拟in-vivo EPR测量情况,如图6所示。

4.2 基于SVM的波谱分类效果
再次采集一批in-vivo EPR波谱用于波谱分类效果评价,本次共采集到2 935组in-vivo EPR波谱人工分类,其中有效波谱975组,受干扰波谱1 004组,无信号波谱956组。对2 935组in-vivo EPR波谱利用上文所述SVM方法进行分类,结果如表2所示,总准确率为99.45%。

4.3 GA-BPNN的剂量预测效果
利用上文所述GA-BPNN方法对不同剂量照射牙齿样品的波谱进行处理和剂量预测,预测剂量与实际照射剂量关系曲线如图7所示,其中拟合趋势线公式为y = 0.928 6x + 0.085 8,线性相关系数R为0.992 5,平均相对误差为11.9%。

5 结论
in-vivo EPR测量用于核应急医学救援伤员剂量评估具有辐射特异性高、剂量响应较高等优势,对于核辐射伤员剂量评估具有良好的潜在应用价值。in-vivo EPR测量中所采用的短时间单次扫描、多次重复累加平均的工作模式会产生数量较多的波谱,同时受到生理振动和牙表面水等干扰因素的影响,往往产生较大比例的无信号波谱和受干扰波谱。依赖人工方法对上述波谱进行筛选分类和剂量评估往往存在时间开销大、主观性强等问题。本研究利用SVM方法建立了in-vivo EPR波谱筛选分类方法,实现了从大量波谱中快速自动筛选出具有辐射诱发信号的波谱;同时利用GA-BPNN建立了自动化的辐射剂量预测方法。经实验验证,SVM的分类准确率和GA-BPNN的剂量预测误差可满足in-vivo EPR波谱分析的需求,同时提高了波谱分析效率,降低了人为因素导致的误差。该方法不仅适用于in-vivo EPR波谱处理,经适当优化后也可用于通用EPR波谱处理。与现有的解析类波谱分析方法相比,本研究实现了将机器学习新方法用于EPR波谱分析领域,是对机器学习方法的创新应用和对波谱处理方法的拓展延伸。
本文实验中,发现个别牙齿剂量预测的相对误差较大,可能与该牙齿本底信号较强、波谱横坐标g值未对齐以及体积因子校正带来的误差有关。下一步算法优化主要包括波谱自动整备(g值对齐)、复杂测量条件下机器学习方法的优化改进,以及改良针对通用样品EPR波谱处理的神经网络方法等方面,以期进一步提高EPR剂量评估效率并扩展机器学习方法在EPR波谱处理领域的应用。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:熊广为,实现了本文所述算法、开展了EPR测量实验;陈博,优化了算法设计,补充完善了文章;马蕾、贾泷澎,参加了EPR测量实验;陈淑年,修改完善了论文;吴可,设计了in-vivo EPR测量系统;宁静,指导了γ射线照射和剂量计算;朱斌,指导了神经网络算法设计;郭俊旺,搭建了in-vivo EPR测量系统,指导了实验和数据处理,指导写作和修改了论文。
0 引言
核与辐射突发事件可能导致在场人员受到电离辐射威胁,进而产生健康损伤;快速估算人员受照射剂量是核应急医学救援中确定救治方案和合理规划医疗资源配置的关键。利用电子顺磁共振(electron paramagnetic resonance,EPR)技术测量牙齿是一种经典的辐射剂量评估方法,具有准确、辐射特异性好等优势,在体(in-vivo)EPR技术(in-vivo EPR)进一步解决了取样测量牙齿EPR剂量的难题,在核应急医学救援中具有良好的应用前景。
EPR波谱处理包括拟合、寻峰标记、信号强度计算等流程[1-2],最终样品受到的辐射剂量根据信号强度和经验曲线获得。针对EPR波谱处理和辐射剂量评估方法,已有研究者开展了系列相关研究:Bordi等[3]在非线性最小二乘法拟合的基础上使用列文伯格—马夸尔特(Levenberg-Marquardt)算法对剂量进行估算;Chumak等[4]和D’Oca等[5]设计了附加剂量技术;Zhumadilov等[6]和Parlato等[7]采用了非线性最小二乘法拟合以及特定函数叠加的方法;Beshir[8]和Kwona等[9]探究了多次拟合方法在剂量评估中的效果;Vanhaelewyn等[10]采用了最大似然估计对EPR波谱进行反卷积和剂量评估;Grün等[11]研究了自然谱法用于信号强度评估;Ivanov等[12]提出了一种基于已知辐射诱发信号(radiation induced signal,RIS)强度的波谱拟合未知剂量波谱的方法;Boyau等[13]开发了基于贝叶斯框架的波谱拟合程序;Ciesielski等[14]和Zou等[15]在EPR波谱处理中利用标准样品二价锰离子(Mn2+)校正、本底波谱信号扣除、体积校正等方法进一步提高了剂量评估的准确性。上述研究中对EPR波谱处理和剂量评估的方法以拟合或者解析算法为主,目标是将EPR波谱转化为具有某种特征的曲线,并对特征值进行计算。该方法的优势是波谱解析性高、结果解释性好,但也存在波谱处理过程复杂、对特征识别具有人为主观性偏差等问题。in-vivo EPR波谱数量较大,且因被测人员生理振动、在体样品含水等特殊干扰导致无效波谱较多[16-20],用经典拟合或解析方法或将面临时间开销过大、波谱选择和处理中主观因素干扰多等问题。
支持向量机(support vector machines,SVM)是基于统计学习理论的一种有监督学习的机器学习方法,若在建模前结合主成分分析(principal component analysis,PCA)、线性判别分析(linear discriminant analysis,LDA)等降维方法,可很大程度上解决“维度灾难”和“过拟合”的问题,现已广泛应用于聚类分析、模式识别、机械故障诊断等领域中[21-23]。本研究采用该方法对大量in-vivo EPR波谱进行分类识别,解决在体测量中生理振动、样品含水等因素影响产生的无效波谱分类问题。反向传播神经网络(back propagation neural network,BPNN)具有较高的适应性、鲁棒性和拟合能力,通常应用于数据预测及分类识别中,本研究利用遗传算法(genetic algorithm,GA)优化BPNN的方法(GA-BPNN)对in-vivo EPR波谱进行分析处理,以实现辐射剂量预测,解决EPR波谱中辐射诱发信号特征点选取主观性强、人工计算速度慢等问题。
1 问题模型
1.1 in-vivo EPR波谱筛选分类
in-vivo EPR测量样品常为牙齿,受在体测量过程中生理振动、牙表面水等因素影响,波谱中经常会引入对辐射诱发信号产生显著干扰的噪声,严重情况下可能造成波谱失效。将in-vivo EPR波谱分为有效波谱(记为“0”类)、无信号波谱(记为“1”类)、受干扰波谱(记为“2”类),各类波谱示意如图1所示。有效波谱具有典型的RIS,可用于辐射剂量评估;人工判别方法是在波谱特定位置(图1中RIS框位置)观察是否有特征RIS。无信号波谱中无RIS,其原因是样品放置不到位或测量参数不当;对此,人工判别方法的依据是波谱特定位置不存在特征RIS。受干扰波谱是in-vivo EPR测量过程中因振动、牙表面水等因素引入显著干扰噪音的波谱,导致无法进行辐射剂量预测;其人工判别方法是在波谱中寻找是否存在除RIS和标样信号(standard reference signal,SRS)外的其他强信号。in-vivo EPR测量采用多次短时间重复扫描的策略,故波谱数量较大,依赖人工筛选有效波谱时间代价较大。为提高波谱筛选分类效率,本研究采用SVM方法进行波谱筛选分类。波谱分类准确率如式(1)和式(2)所示:

![]() |
![]() |
上式中,Ti为第i类波谱分类的准确率,TPi为第i类波谱分类准确的个数,FPij为将第i类波谱误分类为第j类波谱的个数,T总为所有波谱分类的准确率。
1.2 辐射剂量预测
牙齿样品辐射剂量与EPR波谱RIS强度正相关,一般采用人工寻峰的方式确定EPR波谱中的波峰和波谷,波峰波谷相对差值作为RIS强度,结合实验室建立的曲线推导计算样品受到照射的剂量。在波谱数量较多时,该方法时间开销较大且寻峰过程有一定的主观性。本研究采用GA-BPNN的方法对批量波谱进行辐射剂量预测,预测剂量与实际剂量的相对误差如式(3)所示:
![]() |
式中,E为实际剂量与预测剂量的相对误差,Dr为实际照射剂量,Ds为预测剂量。
1.3 EPR波谱处理流程
EPR波谱处理过程包括:① 采集一定数量的EPR波谱;② 导入波谱并显示;③ 将EPR波谱转化为以g值为横坐标的标准化波谱;④ 利用SVM算法进行波谱分类;⑤ 将分类后的有效波谱叠加平均处理;⑥ 利用GA-BPNN算法进行初步辐射剂量预测;⑦ 对预测辐射剂量进行体积因子校正。EPR波谱处理流程如图2所示。

2 in-vivo EPR波谱分类方法
2.1 SVM分类模型的建立
为便于SVM和GA-BPNN处理,首先将波谱转化为横坐标为g值的标准化波谱,每个波谱选取860个离散数据点。利用PCA方法降低至121个维度,再利用“核函数”将121个维度的in-vivo EPR波谱数据映射到更高维度的空间中,构建一个离训练样本点支持集最远的超平面,从而实现对in-vivo EPR波谱分类。由于in-vivo EPR波谱的形态复杂,可能会存在一些错分的现象,其求解目标表达式如式(4)所示[24-25]:
![]() |
式(4)中,w为权重向量,wT为权重向量的转置,b为偏置向量,c为惩罚系数,ξi为松弛变量,φ为从低维到高维的映射函数,xi为某个EPR波谱数据,yi为某个EPR波谱的标签。
2.2 波谱分类模型训练的分析
采集一批in-vivo EPR波谱用于波谱分类模型的建立,具体采集方法见后文4.1小节,本次共采集到7 356组波谱数据,其中前5 880组波谱用作模型训练,剩余波谱用作效果验证。本文选取高斯核函数作为SVM核函数,根据经验将SVM的c值设置为1,γ值为特征值的倒数即1/860[26]。实验验证所得SVM分类的准确率如表1所示,总准确率为97.56%。对于波谱分类错误的示例如图3所示:当辐射剂量较小时,有效波谱可能被错误地分类为无信号波谱;当本底信号过强时,无信号波谱可能被分类为有效波谱;当干扰信号叠加在RIS信号上时,受干扰波谱可能被错误地分类为有效波谱。


3 辐射剂量预测方法
3.1 GA-BPNN模型
BPNN由输入层、隐藏层和输出层构成,其关系如式(5)所示,网络可不断地通过反向传播来降低损失函数值,使自变量和因变量之间的关系无限逼近一个函数[27]。在利用in-vivo EPR波谱开展辐射剂量预测过程中,输入层为若干波谱数据,输出层为辐射剂量。
![]() |
![]() |
![]() |
式中,Ii为神经网络的输入层,xi为某个EPR波谱数据,n为输入层中节点的数量;Hj为网络的隐藏层,f1为隐藏层激活函数,w1ij为输入层到隐藏层之间的权值,b1j为输入层到隐藏层之间的阈值,m为隐藏层中节点的数量;Ok为网络的输出层,f2为输出层激活函数,w2jk为隐藏层到输出层之间的权值,hj为隐藏层的输出值,b2k为隐藏层到输出层之间的阈值,l为输出层中节点的数量。
针对BPNN在训练过程可能存在难以确定网络最优的权值和阈值、收敛时间过长及容易陷入局部寻优等问题[28],本研究采用GA方法来进一步优化BPNN。采用浮点数编码的形式对染色体进行编码,以变异操作对染色体中的某些基因进行变动,从而不断产生新的个体更新迭代,如式(6)所示:
![]() |
式中,Cij为第i个染色体的第j个基因,Cmax为基因Cij的上界,Cmin为基因Cij的下界,r为随机数,,e为迭代次数,Emax为算法的最大迭代次数。
GA-BPNN可分为GA和BPNN两部分,其核心算法为:将BPNN层与层之间的权值和阈值作为GA中的“种群个体”并进行编码,通过GA的遗传操作不断产生新的种群,最后以神经网络中的损失值作为评判标准计算个体适应度,从而获得最优的初始化权值和阈值并带到网络中进行训练[29-30]。最终辐射剂量预测GA-BPNN方法的具体结构如图4所示。

3.2 牙齿样品和体积因子校正
本研究中,被测量样品为33颗没有明显蛀龋、金属填充物或牙髓移植治疗史的门牙,牙齿样品采集于301医院、307医院和重庆医科大学附属第一医院。该牙齿作为常规医疗的一部分被移除且被做了匿名处理的患者废弃,本课题组与患者无任何接触,不涉及取牙处理,故不涉及伦理审批;且所有牙齿样品经上述医院授权,可用于本研究。
由于被测样品形状各异,导致样品进入谐振腔的有效体积存在一定差异,因此需根据样品被测体积对RIS强度进行校正,具体流程为:首先利用三维扫描仪(Aoralscan 3,先临三维,中国)对样品三维形态进行扫描,以获取牙齿样品的三维模型;然后,根据牙齿和谐振腔探测口三维模型确定样品和谐振腔的装配关系,计算牙齿进入谐振腔探测口部分的样品体积;最后,根据样品体积进行RIS校正。
3.3 剂量预测模型训练
将单个in-vivo EPR波谱数据的860个离散值作为神经网络输入层,隐藏层个数为32,采用线性整流函数(rectified linear unit,Relu)作为神经网络隐藏层和输出层之间的激活函数,最小平方误差作为损失函数,GA的种群规模大小为50,交叉概率为0.8,变异概率为0.005,迭代次数为50,最小平方误差的倒数作为适应度函数。采用循环交叉的方式,对辐照剂量为0~10 Gy的牙齿样品进行EPR波谱采集,共获得3 056组波谱数据,其中2 435组用作训练,其余621组用作验证。采用上述方法进行8 000次训练,经测试利用GA-BPNN方法的预测剂量与实际照射剂量相对误差如图5所示,预测剂量与实际照射剂量的平均相对误差为18.6%,其中相对误差在25%以内的有482组。

4 实验验证
4.1 牙齿EPR测量
将33颗牙齿样品分为11组,每组3颗,利用钴-60(Co-60)放射源分别给予0~10 Gy剂量γ射线照射,组间距为1 Gy。然后,将照射后的牙齿样品固定于口腔模型进行模拟in-vivo EPR测量实验。本研究牙齿样品和模拟in-vivo EPR测量情况,如图6所示。

4.2 基于SVM的波谱分类效果
再次采集一批in-vivo EPR波谱用于波谱分类效果评价,本次共采集到2 935组in-vivo EPR波谱人工分类,其中有效波谱975组,受干扰波谱1 004组,无信号波谱956组。对2 935组in-vivo EPR波谱利用上文所述SVM方法进行分类,结果如表2所示,总准确率为99.45%。

4.3 GA-BPNN的剂量预测效果
利用上文所述GA-BPNN方法对不同剂量照射牙齿样品的波谱进行处理和剂量预测,预测剂量与实际照射剂量关系曲线如图7所示,其中拟合趋势线公式为y = 0.928 6x + 0.085 8,线性相关系数R为0.992 5,平均相对误差为11.9%。

5 结论
in-vivo EPR测量用于核应急医学救援伤员剂量评估具有辐射特异性高、剂量响应较高等优势,对于核辐射伤员剂量评估具有良好的潜在应用价值。in-vivo EPR测量中所采用的短时间单次扫描、多次重复累加平均的工作模式会产生数量较多的波谱,同时受到生理振动和牙表面水等干扰因素的影响,往往产生较大比例的无信号波谱和受干扰波谱。依赖人工方法对上述波谱进行筛选分类和剂量评估往往存在时间开销大、主观性强等问题。本研究利用SVM方法建立了in-vivo EPR波谱筛选分类方法,实现了从大量波谱中快速自动筛选出具有辐射诱发信号的波谱;同时利用GA-BPNN建立了自动化的辐射剂量预测方法。经实验验证,SVM的分类准确率和GA-BPNN的剂量预测误差可满足in-vivo EPR波谱分析的需求,同时提高了波谱分析效率,降低了人为因素导致的误差。该方法不仅适用于in-vivo EPR波谱处理,经适当优化后也可用于通用EPR波谱处理。与现有的解析类波谱分析方法相比,本研究实现了将机器学习新方法用于EPR波谱分析领域,是对机器学习方法的创新应用和对波谱处理方法的拓展延伸。
本文实验中,发现个别牙齿剂量预测的相对误差较大,可能与该牙齿本底信号较强、波谱横坐标g值未对齐以及体积因子校正带来的误差有关。下一步算法优化主要包括波谱自动整备(g值对齐)、复杂测量条件下机器学习方法的优化改进,以及改良针对通用样品EPR波谱处理的神经网络方法等方面,以期进一步提高EPR剂量评估效率并扩展机器学习方法在EPR波谱处理领域的应用。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:熊广为,实现了本文所述算法、开展了EPR测量实验;陈博,优化了算法设计,补充完善了文章;马蕾、贾泷澎,参加了EPR测量实验;陈淑年,修改完善了论文;吴可,设计了in-vivo EPR测量系统;宁静,指导了γ射线照射和剂量计算;朱斌,指导了神经网络算法设计;郭俊旺,搭建了in-vivo EPR测量系统,指导了实验和数据处理,指导写作和修改了论文。