基于机器学习的全国布鲁氏菌病重复报告分析方法研究

Journal of Public Health and Preventive Medicine(2022)

引用 0|浏览14
暂无评分
摘要
目的 研究利用机器学习的方法识别布鲁氏菌病重复报告卡(重卡).方法 利用2005—2017年中国疾病预防控制信息系统中报告的499577张布鲁氏菌病个案卡,参考人工识别法,重卡为3785张,建立数据集并构建特征后进行机器学习,选择KNN(K Nearest Neighbor)、支持向量机(Support Vector Machine,SVM)和随机森林三种模型进行训练,所得模型进行分类预测,最后评估分类结果.结果 KNN、SVM和随机森林三种模型的分类效果AUC(Area Under Curve)值分别为0.97、0.97、0.98.结论 KNN、SVM和随机森林三种模型识别效果均较好,其中随机森林模型重卡识别效果最好,其次为SVM.机器学习方法能够很好识别布鲁氏菌病累计重卡,对传染病报告数据分析和报告管理有一定实用价值.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要