李欣宇 王 雯 祝腾飞 孙广晨 耿 彧
摘 要:目前,心血管疾病已经成为重大的公共卫生问题,我国的心血管发病率呈持续长升趋势.对心血管疾病进行多因素关联分析可为临床决策提供指导作用.因此,通过加权似然函数法构建树,基于粒子群算法实现模型参数优化,选取具有最大加权似然函数值的路径为最优路径,从而实现疾病关联分析研究.通过仿真实验,充分表明基于粒子群算法的关联分析具有良好的稳定性.
关键词:心血管疾病;粒子群算法;关联分析
:/中图分类号:F24 文献标识码:A doi10.19311.cnki.1672G3198.2020.07.044j
性部分、粒子向历史最佳位置靠近趋势的个体贡献部分和所有粒子共同向总体最佳位置靠近趋势的群体贡献部分.
步骤3:将概率大于max(×k的结果分配qq0,1)给路径,逐层扩展树.
步骤4:按照步骤2-3迭代所有的测量指标属性,生成树T.
步骤5:计算每条路径的加权似然和值,选取值最大的一条路径完成致病因素的识别.
()锦州医科大学,辽宁锦州121000
0 引言
目前,中国心血管病的发病人数持续增长,且心血
管疾病占城乡居民总死亡原因的首位,从近年来中国心血管病(与其它疾病的死亡率对比统计分析情CVD)况中可以看出,以1农村与城市相对比,0万为基数,
其中心脏病死亡率CVD死亡率比为295.63:261.99,
比为1脑出血比为743.72:136.21、4.51:52.25和脑梗死比为4心脑血管疾病的防治5.30:41.99.由此可见,已成为重大的公共卫生问题.目前,尽管临床医生和研究者开展了与心血管疾病的大量相关研究,但更多地局限于某些指标的影响分析,缺乏普适的分析方法实现与疾病相关的致病因素研究.针对此问题,本文提出一种基于粒子群算法的疾病关联分析方法,为临床诊疗提供决策支持.
2 实验分析
采用仿真实验数据对方法进行验证.分别生成疾病组和对照组,设置1并分别设置与心00个指标属性,血管疾病相关的致病因素数量为50、60、70、80和90.在不同的人群风险度PAR下进行致病因素的识别.
、获得每组数据的四个性能指标,真阳性)假阳TP(FP(
、,性)真阴性)和F假阴性)取其均值进行如下TN(N(
(几个指标统计:识别致病因素的准确率(1)AccuraG
);();();(总体准确率(查全率(误报率c2TA)3CR)4)y(;();(相关系数φ.从实验结果可FPR)5F-Score6)见,在不同的P模型性能表现AR和致病因素设置下,较为一致,充分说明算法具有一定的稳定性.识别致病因素的准确率均值可达到9总体准确率接0%左右,近8查全率达到80%,0%以上,F1值为80%以上.但误报率相对较高,为2相关系数均值为0.0%~40%,5左右,说明此算法假阳性结果较高,仍有改善空间.
1 方法
模型中将患者的个人信息、血细胞分析、凝血、生
化全项、心肌组合等多种指标信息集成在一起,形成一个D维空间,第d维空间表示为某一个测量指标,d∈
第i个体表示为x[1..D].个体由向量X表示,i=
(,.参考每个指标的正常范围值,xxxi1,iD)id取值为0或1,分别表示正常范围值与异常值.每个个体都有一个对应的诊断结果,用向量Y表示,取值1表示诊断为心血管疾病,0表示诊断为非心血管疾病.
模型中基于加权似然函数法识别出一条由所有指
],标属性构成的最优路径参考文献[最优路径通过构2
建树后的剪枝处理最终获得.按照xd∈[1D])d(取值的不同,分别赋予两个权重q1和q0.具体步骤如下:
步骤1:初始化x并创建空树,设d∈[1D]),d(置分支概率k=0.9.
步骤2:基于粒子群算法最大化似然函数,更新参
︿
︿
︿
︿
︿
3 结论
本文方法采用粒子群算法优化模型参数,采用加
权似然函数值识别出各指标属性构建的最佳路径.实验表明所提方法具有一定的识别能力,但仍存在相对较高的误报率,且相关系数偏低,说明在稀疏矩阵中粒子群算法表现性能一般,仍需考虑进一步优化,降低误识率.在未来研究中,还应充分考虑指标属性间的关联影响.
参考文献
[]陈伟伟,]高润霖,刘力生,等.中国心血管病报告2中1013概要[J.
():国循环杂志,2014,7487G491.
[],,2BrandonCSaonliBSharmisthaG,etal.WeihtedScoreTestsg
Imlementinodel-AverainchemesinDetectionofRarepgMggSVariantsinCase-ControlStudies[J].PLOSONE,2015,10():10e0139355.
数值为q,,q0,1,0,c0,c1.βββ在粒子群算法中,首先随机生成一个大小为N的粒子群,每个粒子i的位置由个体x函数i来表示,
表示粒子的适应度.粒子i的速度可以表示为xf(i)
,,向量v该粒子已有的最优位置表示为vvi=(i1,iD),.整个种群已有的最优位置表向量pppi=(i1,iD)
,示为向量g=(确定粒子移动时的ggD).其次,1,
方向和长度,粒子i在第d维空间上的速度与位置vid由三个因素决定,分别是粒子维持当前速度趋势的惯
).基金项目:锦州医科大学2019年大学生创新创业训练计划项目(2019061
,,作者简介:李欣宇(女,辽宁辽阳人,锦州医科大学第一临床医学院,临床医学专业;耿彧(女,副教授,研究方1998-)1976-)
.向:生物信息计算和健康信息管理(通讯作者)
现代商贸工业
2020年第7期
91
因篇幅问题不能全部显示,请点此查看更多更全内容