《用于多种慢性病早期预测的可解释的疾病监测系统》一文介绍了一种基于电子病历数据的可解释人工智能系统,旨在对八种常见慢性病进行早期风险预测。该系统通过提前一年预测患者患病风险,帮助医生采取预防措施,降低医疗成本并提高医疗服务的价值。研究背景指出,现有模型存在依赖检验检查结果、缺乏可解释性及样本量小等问题。为解决这些问题,研究者利用CureMD公司的匿名电子病历数据构建了预测模型,数据包括人口统计学信息、生命体征、既往诊断等。为了处理数据不平衡问题,研究人员进行了欠采样,并预处理数据以去除噪声和依赖性特征。最终,他们使用随机森林模型对每种慢性病在未来3个月、6个月和12个月内的患病风险进行预测,评估指标包括准确率、精确率、召回率、AUC和F1分数。结果显示,该系统在多种慢性病的早期预测中表现出良好的性能。