Medición del desempeño de clasificadores usando atributos sintéticos polinomiales y selección de atributos con MrMR

Autores/as

  • Autor RiiM

Palabras clave:

Clasificador, Atributos sintéticos, MrMR, Métricas de desempeño

Resumen

Las diferentes complejidades presentes en los datos perjudican el desempeño de los modelos predictivos. Entre las complejidades más comunes en los datos se encuentra el desbalance de clases, la presencia de casos atípicos traslape de clases, y alta dimensionalidad. Una de las formas de tratar con este problema es la creación y adición de atributos sintéticos a los datos, con la finalidad de mejorar el desempeño. En este artículo, se realiza una comparativa del comportamiento (en términos de la métrica F1-score) de seis clasificadores cuando se agregan atributos sintéticos de tipo polinomial. El objetivo de los experimentos es verificar si la creación de atributos sintéticos ayuda a lograr un mejor desempeño en comparación con los atributos originales.

Citas

A. C. Lorena, A. I. Maciel, P. B. C. de Miranda, I. G. Costa, and R. B. C. Prudêncio, “Data complexity

meta-features for regression problems,” Mach Learn, vol. 107, no. 1, pp. 209–246, Jan. 2018, doi:

1007/s10994-017-5681-1.

J. Cervantes, F. Garcia-Lamont, L. Rodríguez-Mazahua, and A. Lopez, “A comprehensive survey on

support vector machine classification: Applications, challenges and trends,” Neurocomputing, 2020, doi:

1016/j.neucom.2019.10.118.

S. Xiang, Y. Fu, G. You, and T. Liu, “Attribute analysis with synthetic dataset for person re-identification,”

Jun. 2020, [Online]. Available: http://arxiv.org/abs/2006.07139

J. Brownlee, “Imbalanced Classification with Python Choose Better Metrics, Balance Skewed Classes, and

Apply Cost-Sensitive Learning,” 2020.

A. J. Larner, The 2x2 Matrix. Springer International Publishing, 2021. doi: 10.1007/978-3-030-74920-0.

H. Dalianis, Clinical text mining: Secondary use of electronic patient records. Springer International

Publishing, 2018. doi: 10.1007/978-3-319-78503-5.

A. H. Alsaffar, “Empirical study on the effect of using synthetic attributes on classification algorithms,”

International Journal of Intelligent Computing and Cybernetics, vol. 10, no. 2, pp. 111–129, 2017, doi:

1108/IJICC-08-2016-0029.

Mazzanti Samuele, “‘MRMR’ Explained Exactly How You Wished Someone Explained to You | by

Samuele Mazzanti | Towards Data Science,” Feb. 12, 2021. https://towardsdatascience.com/mrmr-

explained-exactly-how-you-wished-someone-explained-to-you-9cf4ed27458b (accessed Jul. 15, 2022).

M. Billah and S. Waheed, “Minimum redundancy maximum relevance (mRMR) based feature selection

from endoscopic images for automatic gastrointestinal polyp detection,” Multimed Tools Appl, vol. 79, no.

–34, pp. 23633–23643, Sep. 2020, doi: 10.1007/s11042-020-09151-7.

D. Dua and C. Graff, “UCI Machine Learning Repository.” 2017. [Online]. Available:

http://archive.ics.uci.edu/ml

Descargas

Publicado

2024-10-06