CatBoost-Based Network Intrusion Detection on Imbalanced CIC-IDS-2018 Dataset

The Journal of Korean Institute of Communications and Information Sciences(2021)

引用 6|浏览0
暂无评分
摘要
증가하는 인터넷 트래픽의 양과 속도는 악의적인 공격자에게 전례 없는 공격 기회를Tempo 제공한다. 예를 들어 악의적인 침입 네트워크 트래픽을 감지하기 위한 네트워크 침입 감지 시스템(NIDS)에 과부하가 발생할 수 있다. 현재 NIDS 솔루션의 대부분은 flow 정보(예: 패킷 수, 평균 도착 간 시간)가 포함된 flow 기록을 활용하며, 이러한 flow 정보를 기반으로 트리 기반 ML 모델을 활용한다. 그러나 최근 CatBoost와 같은 Gradient Boosting Machine 방법은 Kaggle 대회와 같은 표 형식 데이터 셋에서 기존의 트리 기반 솔루션보다 우수한 성능을 보여주었다. 이 논문에서 우리는 네트워크 침입 탐지 작업을 위한 CatBoost의 적용 가능성을 탐구한다. 또한 데이터 불균형을 해결하여 얻은 성능 향상을 시연한다. 또한 다양한 유형의 최근 실제 사이버 공격이 포함된 최신 CIC-IDS-2018 데이터 세트를 활용한다. 우리의 실험에 따르면 단순한 오버샘플링 기술로 데이터 불균형을 해결하면 CatBoost의 경우 88.84%에서 92.41%로 정확도가 크게 향상되었으며, 의사 결정 트리(88.34%) 및 랜덤 포레스트(89.88%)의 정확도를 능가했다.
更多
查看译文
关键词
intrusion,catboost-based,cic-ids
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要