Medición del desempeño de clasificadores usando atributos sintéticos polinomiales y selección de atributos con MrMR
Palabras clave:
Clasificador, Atributos sintéticos, MrMR, Métricas de desempeñoResumen
Las diferentes complejidades presentes en los datos perjudican el desempeño de los modelos predictivos. Entre las complejidades más comunes en los datos se encuentra el desbalance de clases, la presencia de casos atípicos traslape de clases, y alta dimensionalidad. Una de las formas de tratar con este problema es la creación y adición de atributos sintéticos a los datos, con la finalidad de mejorar el desempeño. En este artículo, se realiza una comparativa del comportamiento (en términos de la métrica F1-score) de seis clasificadores cuando se agregan atributos sintéticos de tipo polinomial. El objetivo de los experimentos es verificar si la creación de atributos sintéticos ayuda a lograr un mejor desempeño en comparación con los atributos originales.
Citas
A. C. Lorena, A. I. Maciel, P. B. C. de Miranda, I. G. Costa, and R. B. C. Prudêncio, “Data complexity
meta-features for regression problems,” Mach Learn, vol. 107, no. 1, pp. 209–246, Jan. 2018, doi:
1007/s10994-017-5681-1.
J. Cervantes, F. Garcia-Lamont, L. Rodríguez-Mazahua, and A. Lopez, “A comprehensive survey on
support vector machine classification: Applications, challenges and trends,” Neurocomputing, 2020, doi:
1016/j.neucom.2019.10.118.
S. Xiang, Y. Fu, G. You, and T. Liu, “Attribute analysis with synthetic dataset for person re-identification,”
Jun. 2020, [Online]. Available: http://arxiv.org/abs/2006.07139
J. Brownlee, “Imbalanced Classification with Python Choose Better Metrics, Balance Skewed Classes, and
Apply Cost-Sensitive Learning,” 2020.
A. J. Larner, The 2x2 Matrix. Springer International Publishing, 2021. doi: 10.1007/978-3-030-74920-0.
H. Dalianis, Clinical text mining: Secondary use of electronic patient records. Springer International
Publishing, 2018. doi: 10.1007/978-3-319-78503-5.
A. H. Alsaffar, “Empirical study on the effect of using synthetic attributes on classification algorithms,”
International Journal of Intelligent Computing and Cybernetics, vol. 10, no. 2, pp. 111–129, 2017, doi:
1108/IJICC-08-2016-0029.
Mazzanti Samuele, “‘MRMR’ Explained Exactly How You Wished Someone Explained to You | by
Samuele Mazzanti | Towards Data Science,” Feb. 12, 2021. https://towardsdatascience.com/mrmr-
explained-exactly-how-you-wished-someone-explained-to-you-9cf4ed27458b (accessed Jul. 15, 2022).
M. Billah and S. Waheed, “Minimum redundancy maximum relevance (mRMR) based feature selection
from endoscopic images for automatic gastrointestinal polyp detection,” Multimed Tools Appl, vol. 79, no.
–34, pp. 23633–23643, Sep. 2020, doi: 10.1007/s11042-020-09151-7.
D. Dua and C. Graff, “UCI Machine Learning Repository.” 2017. [Online]. Available: