25 juillet 2025

La modélisation pour prédire le niveau de résistance aux antibiotiques : le modèle XGBoost est performant

Contexte. La résistance aux antimicrobiens (RAM) est l’une des principales menaces pour la santé mondiale. Pouvoir prédire son évolution future, à l’échelle nationale et de manière agrégée par hôpital, pourrait contribuer à mieux cibler les interventions de prévention et de contrôle. En utilisant l’apprentissage automatique, nous exploitons les données historiques de RAM et d’usage des antimicrobiens pour prédire la RAM future. Méthode. L’utilisation des antimicrobiens et la prévalence de la RAM dans les infections sanguines ont été recueillies, par groupe hospitalier et année financière (AF, d’avril à mars), en Angleterre, pour 22 couples pathogène-antibiotique (de l’AF2016-2017 à l’AF2021-2022). Les prédictions du modèle Extreme Gradient Boosting (XGBoost) ont été comparées à celles de trois approches : la valeur précédente reconduite, la différence entre les deux années précédentes reconduite, et la projection par tendance linéaire (LTF). Les importances des variables explicatives dans XGBoost ont été calculées pour améliorer l’interprétabilité. Résultats. Nous montrons ici que les modèles XGBoost atteignent les meilleures performances prédictives. La variabilité relativement faible d’une année sur l’autre de la prévalence de la RAM au sein des combinaisons groupe hospitalier-pathogène-antibiotique fait que la reconduction de la valeur précédente présente également une faible erreur absolue moyenne (MAE), proche ou légèrement supérieure à celle de XGBoost. Les approches basées sur la différence entre les deux années précédentes ou la projection linéaire présentent des performances systématiquement inférieures. XGBoost surpasse nettement toutes les autres méthodes dans les groupes hospitaliers ayant connu une variation importante de la prévalence de la RAM entre l’AF2020-2021 (dernière année d’apprentissage) et l’AF2021-2022 (jeu de test non inclus dans l’apprentissage). Les valeurs d’importance des variables indiquent que, outre la résistance historique du même couple pathogène-antibiotique que celui de la variable à prédire, les relations complexes entre les résistances de pathogènes différents à un même antibiotique ou une même classe d’antibiotiques, ainsi que leur usage, sont exploitées pour la prédiction. Ces variables figurent généralement parmi les dix premières selon leurs valeurs SHAP absolues moyennes. Conclusion. La résistance d’une année sur l’autre a généralement peu varié au sein des combinaisons groupe hospitalier-pathogène-antibiotique. Dans les cas de variations plus marquées, les modèles XGBoost permettent d’améliorer la précision des prédictions, ouvrant la voie à des décisions éclairées, une allocation efficiente des ressources et des interventions ciblées.

Vihta KD, Pritchard E, Pouwels KB, et al. Predicting future hospital antimicrobial resistance prevalence using machine learning. Commun Med. 2024;4(1):197. Doi : 10.1038/s43856-024-00606-8.