CatBoost-Based Network Intrusion Detection on Imbalanced CIC-IDS-2018 Dataset
The Journal of Korean Institute of Communications and Information Sciences(2021)
摘要
증가하는 인터넷 트래픽의 양과 속도는 악의적인 공격자에게 전례 없는 공격 기회를Tempo 제공한다. 예를 들어 악의적인 침입 네트워크 트래픽을 감지하기 위한 네트워크 침입 감지 시스템(NIDS)에 과부하가 발생할 수 있다. 현재 NIDS 솔루션의 대부분은 flow 정보(예: 패킷 수, 평균 도착 간 시간)가 포함된 flow 기록을 활용하며, 이러한 flow 정보를 기반으로 트리 기반 ML 모델을 활용한다. 그러나 최근 CatBoost와 같은 Gradient Boosting Machine 방법은 Kaggle 대회와 같은 표 형식 데이터 셋에서 기존의 트리 기반 솔루션보다 우수한 성능을 보여주었다. 이 논문에서 우리는 네트워크 침입 탐지 작업을 위한 CatBoost의 적용 가능성을 탐구한다. 또한 데이터 불균형을 해결하여 얻은 성능 향상을 시연한다. 또한 다양한 유형의 최근 실제 사이버 공격이 포함된 최신 CIC-IDS-2018 데이터 세트를 활용한다. 우리의 실험에 따르면 단순한 오버샘플링 기술로 데이터 불균형을 해결하면 CatBoost의 경우 88.84%에서 92.41%로 정확도가 크게 향상되었으며, 의사 결정 트리(88.34%) 및 랜덤 포레스트(89.88%)의 정확도를 능가했다.
更多查看译文
关键词
intrusion,catboost-based,cic-ids
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要