Método rápido de preprocesamiento para clasificación en conjuntos de datos no balanceados

Research in Computing Science(2014)

引用 24|浏览2
暂无评分
摘要
Resumen. El problema de desbalance en clasificacion se presenta en conjuntos de datos que tienen una cantidad grande de datos de cierto tipo (clase mayoritaria), mientras que el numero de datos del tipo contrario es considerablemente menor (clase minoritaria). En este escenario, practicamente todos los metodos de clasificacion presentan un bajo desempeno. En este articulo se propone un nuevo metodo de preprocesamiento, que utiliza un enfoque similar a las tecnicas de basadas en enlaces Tomek, pero cuyo tiempo de ejecucion es dramaticamente reducido con respecto al calculo por fuerza bruta, comunmente utilizado en dichas tecnicas. Los resultados obtenidos en los experimentos demuestran la efectividad del metodo propuesto para mejorar las areas de las curvas ROC y PRC de metodos de clasificacion aplicados a conjuntos de datos reales no balanceados.
更多
查看译文
关键词
preprocesamiento para clasificación,balanceados
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要