Interpretable Binary Classification Under Constraints for Financial Compliance Modeling

Álex Paz; Broderick Crawford; Eric Monfroy; Eduardo Rodriguez-Tello; José Barrera-García; Felipe Cisternas-Caneo; Benjamín López Cortés; Yoslandy Lazo; Andrés Yáñez; Álvaro Peña Fritz; Ricardo Soto

doi:10.3390/math14030429

,

…

¹

Escuela de Ingeniería en Construcción y Transporte, Pontificia Universidad Católica de Valparaíso, Avenida Brasil 2147, Valparaíso 2362804, Chile

²

Laboratoire d’Étude et de Recherche en Informatique d’Angers (LERIA), Université d’ Angers, UFR Sciences, 2 Bd de Lavoisier, 49000 Angers, France

³

Escuela de Ingeniería Informática, Pontificia Universidad Católica de Valparaíso, Avenida Brasil 2241, Valparaíso 2362807, Chile

⁴

Cinvestav Unidad Tamaulipas, Km. 5.5 Carretera Victoria-Soto La Marina, Victoria 87130, Tamaulipas, Mexico

Mathematics2026, 14(3), 429;https://doi.org/10.3390/math14030429

This article belongs to the Special Issue Modeling, Analysis and Optimization for Mathematical Finance, Economics and Risks, 2nd Edition

Version Notes

Order Reprints

Abstract

This study addresses an interpretable supervised binary classification problem under constrained feature availability and class imbalance. The objective is to evaluate whether reliable predictive performance can be achieved using exclusively pre-event administrative variables while preserving transparency and analytical traceability of model decisions. A comparative framework is developed using linear and ensemble-based classifiers, combined with resampling strategies and exhaustive hyperparameter optimization embedded within cross-validation. Model performance is evaluated using standard classification metrics, with particular emphasis on the Matthews correlation coefficient as a robust measure under imbalance. In addition to predictive accuracy, the analysis incorporates global, structural, and local interpretability mechanisms, including permutation feature importance, explicit decision paths derived from tree-based models, and additive local explanations. Experimental results show that optimized ensemble models achieve consistent performance gains over linear baselines while maintaining a balanced error structure across classes. Importantly, the most influential predictors exhibit stable rankings across models and explanation methods, indicating a concentrated and robust discriminative signal within the constrained feature space. The interpretability analysis demonstrates that complex classifiers can be decomposed into verifiable decision rules and locally coherent feature contributions. Overall, the findings confirm that interpretable supervised classification can be reliably conducted under administrative data constraints, providing a reproducible modeling framework that balances predictive performance, error analysis, and explainability in applied mathematical settings.

Keywords:

binary classification; supervised learning; class imbalance; error analysis; Matthews correlation coefficient; model interpretability; higher education finance

Article Metrics

Citations

Article Access Statistics

Journal Statistics

Article metric data becomes available approximately 24 hours after publication online.