面向网络安全不平衡数据的特征学习和分类研究应用

HAN Feng-dong,ZONG Xue-jun,HE Kan,LIAN Lian

wf（2023）

引用 0|浏览1

暂无评分

摘要

网络数据的正确分类对于网络环境的监控和维护具有重要作用.在数据不平衡状态下解决数据分类和处理复杂的特征关系尤为重要,为此提出一种改进SMOTE(synthetic minority over-sampling technique)+GA-XGBoost(genetic algorithm-ex-treme gradient boosting)的机器学习分类方法.将局部离群因子引入SMOTE插值过程,对少数类样本过采样,并对多数类样本随机欠采样,从而实现样本再平衡;同时,在模型训练过程中为增加模型拟合度,将具有进化迭代优势的遗传算法与XGBoost相结合,解决XGBoost参数众多、特征学习收敛较慢等问题.实验采用UNSW_NB15数据集,选择多层感知机、K近邻、决策树等机器学习算法及SMOTE+XGBoost等不平衡数据训练方法进行试验对比,结果表明该方法具有较好的分类预测准确率(97.40％)及较高的平均召回率(70.2％)和平均F1-score(68.8％).并在本实验室工业信息安全平台采集的数据进行实验研究,分类准确率为99％,进一步验证了该方法的有效性和可行性.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要