基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型研究
来源:用户上传
作者:
【摘要】 目的 研究分析基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型。方法 300例确诊的2型糖尿病患者, 随机分为模型组(250例)和对照组(50例), 建立适合基层的“糖尿病风险因素评估+视网膜病变设备检测+血糖控制”预测模型。两组均进行免散瞳眼底彩色照相及相关化验等, 引用数据挖掘技术, 通过多因素Logistic回归分析研究视网膜病变关联因素。结果 检测600只眼, 视网膜病变眼数200只;重度非增生型眼数和增生型眼数分别为105、95只。对照组100只眼, 视网膜病变眼数32只, 重度非增生型眼数和增生型眼数分别为15、17只;模型组500只眼, 视网膜病变眼数168只, 重度非增生型眼数和增生型眼数分别为90、78只。单因素回归分析显示, 年龄、病程、糖化血红蛋白、尿蛋白、眼轴长度是2型糖尿病患者发生视网膜病变的影响因素(P<0.05)。多因素回归分析显示, 2型糖尿病视网膜病变的风险因素主要有眼轴长度、年龄、病程、糖化血红蛋白以及尿蛋白。构建ROC曲线, 对照组测算曲线下面积数值为0.800, 临界值结果为0.184, 简化回归方程分析诊断临界值结果为-1.479。对照组患者将相关的计算参数列入回归方程, 敏感性、特异性、曲线下面积数值分别为86.0%、58.0%、0.762, 伴随预测评分结果与视网膜病变患病率成正向关系, 若评分结果<-2.5, 则实际患病率为0。结论 2型糖尿病视网膜病变诱发因素很多, 主要与患者病程、眼轴长度、年龄、糖化血红蛋白、尿蛋白等因素有关, 同时验证了风险预测模型的有效性。
【关键词】 数据挖掘技术;2型糖尿病;视网膜病变;风险预测;模型
DOI:10.14163/j.cnki.11-5547/r.2019.02.107
视网膜病变作为慢性微血管病变, 具有隐匿性强、发病进程不可逆、治愈性差及高致盲率的特點, 是2型糖尿病最常见、最严重地并发症之一[1]。如何进行早期筛查、预防、干预, 提高治疗效果, 减少并发症的发生, 成为当前研究的重点。本文基于利用数据挖掘技术, 结合数理统计方法, 试图构建适宜基层应用的2型糖尿病视网膜病变风险预测模型, 以期为社区医疗机构提供糖尿病视网膜病变风险评估方法, 增强基层诊疗能力, 及时发现疾病风险, 指导患者及时调整血糖控制方案, 提高患者依从性, 降低并发症发生率, 全面提升生活质量。现报告如下。
1 资料与方法
1. 1 一般资料 选择2016年6月~2018年3月于本院就诊的2型糖尿病患者300例(600只眼)作为研究对象, 经过眼底检查和临床诊断确诊, 筛选建立数据框架, 根据基层条件确定和标准化数据测量和指标收集数据。随机分为模型组(250例, 500只眼)和对照组(50例, 100只眼)。模型组患者中男145例, 女105例;年龄31~89岁, 平均年龄(62.33±14.03)岁, 糖尿病病程2.0~38.0年, 平均糖尿病病程(9.56±9.48)年。对照组患者中男27例, 女23例;年龄33~90岁, 平均年龄(63.42±13.46)岁;糖尿病病程2.5~39.0年, 平均糖尿病病程(9.67±9.78)年。两组患者的一般资料对比, 差异无统计学意义(P>0.05), 具有可比性。
1. 2 方法
1. 2. 1 构建适宜基层的糖尿病视网膜病变的风险预测模型
通过文献搜集相关危险因素, 主要包括患者人口学特征、病史(病程及类型)、并发症、常见症状和体征、基层常用实验室检查指标、血糖控制(用药情况)、生活方式(运动、饮食、烟酒情况), 其他健康情况包括常见的与微血管相关心血管疾病及其他高度相关疾病情况。通过关系图法构建围绕糖尿病视网膜病变发生风险预测理论模型关系图, 进一步筛选出基层社区医疗机构容易获取、研究中效应显著以及联系性强的变量和≤20个的变量数, 建立出“糖尿病风险因素评估+视网膜病变设备检测+血糖控制”预测模型, 以此制定数据收集计划和数据收集指标, 将指标测量基层化, 符合基层数据收集客观条件。
1. 2. 2 构建新型糖尿病及糖尿病并发症的基层健康管理模式 结合前期调研情况, 利用大数据技术关联度分析, 找出相关病变风险关联因素, 构建专业数据模型, 通过在社区开展相关应用, 进一步验证模型有效性, 进行糖尿病视网膜病风险评估, 为不同风险患者提供不同诊疗建议, 如生化方式、药物、血糖管理调整, 眼底筛检建议及眼科转诊建议。
1. 3 观察指标 对患者进行免散瞳眼底彩色照相、测量眼轴长度、空腹血糖化验以及相关其他指标化验等, 对所有实验室检查结果以及患者临床基础资料进行观察记录, 全部纳入检查指标。
1. 4 统计学方法 应用统计软件SPSS18.0将所有的数据进行汇总处理, 应用多因素Logistic回归分析方法分析相关因素, 构建相应回归方程形成风险预测模型。根据工作特征曲线计算方程曲线下面积, 应用约登指数计算特异性和敏感性指标, 确定相应诊断临界值, 从而检验模型有效性。敏感性为预测结果视网膜病变眼数与实际眼数百分比值, 特异性为预测结果非视网膜病变的眼数和实际非视网膜病变的眼数的百分比值。应用评分结果进行ROC曲线绘制, 对风险预测模型的预测价值进行评估, 曲线下面积≤0.7, 视为较低;曲线下面积在0.8~0.9, 视为中等;曲线下面积>0.9, 视为较高。
2 结果
2. 1 两组一般情况分析 检测600只眼, 视网膜病变眼数200只;重度非增生型眼数和增生型眼数分别为105、95只。对照组100只眼, 视网膜病变眼数32只, 重度非增生型眼数和增生型眼数分别为15、17只;模型组500只眼, 视网膜病变眼数168只, 重度非增生型眼数和增生型眼数分别为90、78只。 2. 2 单因素分析 单因素回归分析显示, 年龄、病程、糖化血红蛋白、尿蛋白、眼轴长度是2型糖尿病患者发生视网膜病变的影响因素(P<0.05)。见表1。
2. 3 多因素回归分析 多因素回归分析显示, 2型糖尿病视网膜病变的风险因素主要有眼轴长度、年龄、病程、糖化血红蛋白以及尿蛋白。
2. 4 ROC曲线 构建ROC曲线, 对照组测算曲线下面积数值为0.800, 临界值结果为0.184, 简化回归方程分析诊断临界值结果为-1.479。对照组患者将相关的计算参数列入回归方程, 敏感性、特异性、曲线下面积数值分别为86.0%、58.0%、0.762, 伴随预测评分结果与视网膜病变患病率成正向關系, 若评分结果<-2.5, 则实际患病率为0。
3 讨论
3. 1 数据挖掘技术 主要包括Logistic回归分析法、随机森林法、神经网络、支持向量机等方法, 每种方法有其适用范围和计算法。此次通过构建回归分析模型, 筛选关联因素深入研究, 进一步验证视网膜病变相关影响因素预测模型的有效性, 结合临床统计结果, 将其用到社区患者管理中, 能为构建新型糖尿病及并发症防治社区健康管理提供理论参考[2-4]。
3. 2 风险预测模型可提高患者自我管理健康意识 通过构建糖尿病视网膜病变风险预测模型, 可通过立体直观具体的数据和风险几率, 使患者意识到视网膜病变严重性, 从而改变“知信行”, 提高自我管理意识和依从性。
3. 3 早期预防降低糖尿病并发症发生 一系列并发症源头都是血糖控制不好致血管病理性变化, 糖尿病视网膜病变是最常见的微血管并发症, 也是最常见的失明原因, 可通过早期规范管理即可早预防、早发现、早治疗, 降低致盲率, 预防多种并发症的发生。
3. 4 数据技术助力增强基层诊疗能力 简化基层诊疗程序, 降低对基层的人力和能力需求, 从而提升基层服务效率、质量和能力。
3. 5 基于基层需求, 构建风险预测模型 我国的预防和公共卫生任务主要有基层承担, 构建风险预测模型指标应该要符合基层采集条件, 否则难以在基层应用推广, 不能发挥预测功能。本次研究表明, 建立适合基层的“糖尿病风险因素评估+视网膜病变设备检测+血糖控制”预测模型, 能方便患者就医, 做到早期发现, 方便基层指导患者进行风险控制, 降低糖尿病致残率。
3. 6 风险预测模型构建注意事项 基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型构建过程中, 需要把握以下要点。
3. 6. 1 做好基础工作与实践的有效衔接 由于模型构建是一项系统工程, 需要做好糖尿病风险因素分析、视网膜病变设备检测以及血糖控制3个基础项目, 才能确保研究成效, 更好实际应用[5]。预测模型的构建, 进一步推动了流行病学研究成果与临床实践的有效衔接, 并通过高危筛检、临床循证指南等途径促进疾病的三级预防, 降低疾病发病率和死亡率。预测模型很重要的一个应用是对人群疾病发病风险按照几率大小进行分层, 如高、中和低危, 对风险几率不同的群体进行有针对性、强度不同的治疗, 在实际探索中, 应当基于为保证构建效果, 要对抽检样本进行分层处理, 才能为临床个体化治疗方案制定提供参考, 为未来进行“个体化治疗”迈出第一步。
3. 6. 2 引导基层医生掌握预测模型基本内涵 在实际中通过共同研究制定简易评分系统, 进而快速精准地判断高危群体, 提高治疗针对性和有效性。简易评分系统的制定可以参照临床相关病症划分标准, 寻找关键评分指标, 衡量权重, 经专家论证确定最终指标库, 划分高、中和低危区间, 结合实际动态调整。
3. 6. 3 视网膜病变检测设备的选择 由于视网膜病变检测设备较多, 基于基层实际角度, 选择更加适宜的设备, 提高专业技术人员操作技能, 才能确保检验模型更好地加以应用。综上所述, 此次研究对2型糖尿病患者临床视网膜病变相关因素进行总结分析和研究, 找出了相应病变风险因素及基础预测模型, 该研究成果具有一定的理论和实践支撑, 在基层值得参考应用。当然由于调研样本数量相对较少, 今后要进一步提高研究成果的适用性, 还可结合普查, 及时排查早期微血管并发症, 构建更加科学完善的风险控制模型, 为降低糖尿病致残率等提供有益借鉴。
参考文献
[1] Murthy GVS, Johnson G. Prevalence, incidence and distribution of visual impairment//The Epidemiology of Eye Disease. Singapore:World Scientific Publishing, 2003:3-61.
[2] 吕喆, 陈亦棋, 沈丽君, 等. 2型糖尿病患者糖尿病视网膜病变风险预测模型的建立和初步验证. 中华眼底病杂志, 2017, 33(3):257-261.
[3] 董冰清. 基于腹部CT指标的2型糖尿病风险模型的建立及初步验证. 东南大学, 2017.
[4] 刘沫言. 2型糖尿病肾病鉴别诊断模型的验证及新方程的建立. 中国人民解放军医学院, 2013.
[5] 曹文哲, 应俊, 陈广飞, 等. 基于Logistic回归和随机森林算法的2型糖尿病并发视网膜病变风险预测及对比研究. 中国医疗设备, 2016, 31(3):33-38.
[收稿日期:2018-09-19]
转载注明来源:https://www.xzbu.com/6/view-14888367.htm