Méta-analyse : choisir une démarche appropriée – Partie II

Auteurs: Ludwig-Serge Aho-Glélé 1, Simon Aho 2


Affiliations :

  • 1 - Service d’épidémiologie et hygiène hospitalière – Centre hospitalier universitaire (CHU) de Dijon – 5 boulevard Jeanne d’Arc – 21000 Dijon – France
  • 2 - Institut de cancérologie de Lorraine – Vandœuvre-lès-Nancy – France

Auteur principal : Dr - Ludwig-Serge Aho-Glélé - Service d’épidémiologie et hygiène hospitalière – Centre hospitalier universitaire (CHU) de Dijon – 5 boulevard Jeanne d’Arc – 21000 Dijon – France - Email : ludwig.aho@chu-dijon.fr

Résumé

Adapter la méthode selon le type d’étude : approche statistique

Les aspects statistiques sont relatifs à l’agrégation ou non des données (Méta-analyse [MA] sur données individuelles) [1,2] et les aspects statistiques : MA multivariée [3,4], dont la MA en réseau [5,6], les approches bayésiennes [7], séquentielles [8,9]. L’application à des domaines particuliers de la médecine est relative à la typologie « clinique » des études : prévalence (ou incidence), indices diagnostiques, facteurs pronostiques, thérapeutique (efficacité1, sécurité2), relation dose-effet… Certains aspects ne seront pas abordés tels que la MA avec un critère de jugement quantitatif (moyenne, médiane, coefficient de corrélation), la MA « dose-réponse »3 [11,12].

2020 Méta-analyse

Article

Méta-analyse sur données individuelles

Ce type de MA est réalisé directement à partir des informations concernant les individus et non pas à partir de données agrégées [1,2]. C’est la méthode de référence, par rapport à la MA sur données agrégées (MA-DA). La méta-analyse sur données individuelles (MA-DI) est plus longue à mettre en œuvre qu’une MA-DA. Il est en effet nécessaire de récupérer la totalité des données individuelles (en prenant contact avec les auteurs des différentes études que l’on souhaite inclure dans la MA). Mais les résultats sont plus fiables et procurent des réponses plus détaillées. Les principaux avantages sont : un contrôle de la qualité des données ; une standardisation des analyses de toutes les études ; une analyse statistique plus approfondie, y compris l’exploration des facteurs de confusion potentiels dans les études d’observation et les facteurs pronostiques ; une augmentation de la puissance statistique ; une actualisation possible des données (par exemple, date des dernières nouvelles des patients). Dans de nombreux cas, les résultats et les conclusions des deux types de MA sont similaires. Ainsi, Tudur Smith et al. [13] ont noté que des conclusions similaires pouvaient être obtenues, quatre fois sur cinq. Ces résultats sont conformes à ceux retrouvés par Tierney et al. [14], plus récemment (2020). Ils ont constaté que les hazard ratios (HR) estimés par les MA-DA publiés étaient susceptibles d’être concordants avec ceux des MA-DI, lorsque la taille de l’information était importante. En particulier, les différences entre MA-DA et MA-DI se réduisaient avec l’augmentation du nombre de participants ou d’événements dans la MA-DA. En moyenne, les HR des MA-DA avaient légèrement tendance à favoriser les interventions de recherche. Tudur Smith et al. [13] recommandent qu’une MA-DA soit réalisée, avant de réaliser une MA-DI. Lorsque la MA-DA a des lacunes, il faut considérer les éventuels bénéfices liés à la réalisation d’une MA-DI, en prenant en compte le travail supplémentaire nécessaire. Le détail des conditions de mises en œuvre des MA-DI figure dans les articles de Riley et al. [1] et Tierney et al. [15].

Méta-analyse multivariée

La MA multivariée ou MA-MV [3,4] n’est pas une méta-régression multivariée… (i. e. un seul critère de jugement et plusieurs facteurs potentiellement explicatifs d’une hétérogénéité). Dans de nombreux domaines cliniques, il n’existe pas de critère de jugement (CJ) unique largement accepté. La MA-MV permet de prendre en compte simultanément plusieurs CJ (en pratique deux). On peut, par exemple, prendre simultanément en compte colonisation et infection, infection et mortalité, etc. Il est possible de déterminer l’importance de la corrélation des deux CJ. La MA diagnostiques4 ou la MA en réseau5 sont analysées statistiquement par l’intermédiaire d’une MA-MV. Une des difficultés de la MA-MV est que les covariances intra études (corrélations intra études)6 ne sont pas souvent disponibles dans les études. Il est possible de réaliser une analyse de sensibilité, en faisant varier les coefficients de corrélation entre les CJ. D’autres méthodes, telles que celle de Hong [16] ont été proposées. La prise en compte de la corrélation des CJ peut conduire à des estimations plus précises C’est ce qu’on appelle l’emprunt de force (Borrowing of strength ou BoS) [17] : sous réserve des hypothèses de modélisation, il est possible d’utiliser des informations supplémentaires pour chaque CJ en utilisant des informations connexes (ou indirectes) provenant d’autres CJ corrélés dans la même analyse. Ceci est particulièrement important lorsque certaines des études disponibles ne rapportent pas tous les CJ inclus dans la MA-MV. Ce type d’information indirecte s’est avéré utile pour réduire l’impact du biais de déclaration.

Méta-analyse en réseau (ou Network Meta-analysis) Définition et principe

De nombreux synonymes existent : Network Meta-­Analysis (NMA) ; Multiple Treatments Comparison (MTC) ; Mixed Treatment Comparison (MTC, également) ; Indirect Treatment Comparison (ITC)… Historiquement, la méta-analyse en réseau (MA-R) a été développée dans le cadre des essais médicamenteux. Dans certaines pathologies, il est fréquent de disposer de nombreux essais traitement versus placebo et de peu de comparaisons de traitements entre eux. La MA-R [6] a pour objectif d’estimer l’effet d’une intervention A par rapport à une intervention B, à partir des résultats des essais de A et de B versus un même contrôle. L’hypothèse fondamentale est que les effets qu’auraient A et B versus l’intervention contrôle dans les conditions d’un essai « face à face » (i.e. comparaison directe) sont identiques à ceux observés dans les essais à la base de la comparaison indirecte. Les résultats des comparaisons directes sont combinés avec ceux des comparaisons indirectes via approche mixte (Mixed Treatment Comparison ou MTC).

Étapes pour réaliser une méta-analyse en réseau

Elles figurent dans le Tableau I.

Analyse statistique

Une méthode simple de comparaison indirecte de traitements a été introduite pour la première fois par Bucher et al. en 1997 [21]. Elle peut être utilisée lorsque toutes les études ne comparent que deux interventions. Des méthodes bayésiennes ont été publiées par Lu et Ades en 2004 [22]. Elles permettent de prendre en compte les études comportant plus de deux interventions. Depuis, l’utilisation de la MA-R a augmenté régulièrement et de nombreuses agences d’évaluation des technologies de la santé acceptent désormais la MA-R, notamment le National Institute of Health and Care Excellence (NICE) au Royaume Uni, mais aussi l’Organisation mondiale de la santé [23] dans le cadre du développement de recommandations. On peut utiliser l’approche « contrast-based » ou l’approche « arm-based ». Différentes méthodes d’estimation sont disponibles7 : MCMC8 ou INLA9. Des méthodes fréquentistes ont aussi été proposées. Elles sont basées sur un modèle de MA-MV [3,24] ou sur un modèle dérivé des réseaux électriques [25]. La NMA est un cas particulier des modèles linéaires mixtes généralisés [26]. Il est possible de réaliser une MA, sur données individuelles, en réseau [27]. En pratique, le score Sucra10 (ou son équivalent dans l’approche fréquentiste) permet de classer les interventions. La formule est décrite dans Salanti et al. [28].

Hypothèses

Hypothèses spécifiques à la méta-analyse en réseau

Les deux principales hypothèses spécifiques à la MA-R sont la transitivité et la cohérence. Dans un essai randomisé, une interprétation de l’hypothèse de transitivité est que les patients inclus dans le réseau à trois interventions (bras), auraient pu en principe être randomisés dans n’importe quel bras de traitement, A, B ou C. L’hypothèse de transitivité n’est pas respectée si les interventions ont des indications différentes (biais d’indication). La seconde hypothèse spécifique est la cohérence. Elle repose sur l’absence de discordance entre les résultats issus de comparaisons directes des interventions (i. e. deux à deux) et ceux issus de comparaisons indirectes. Plusieurs tests statistiques sont disponibles pour vérifier si le réseau est cohérent ; mais ils manquent de puissance11. Comme toujours, une violation des hypothèses sous-jacentes à un modèle, ici celui de la MA-R, risque d’entraîner des biais dans les estimations des paramètres (odds ratio, risque relatif, Tau…).

Un exemple

L’article de Lefebvre et al. [29] concerne l’efficacité des modalités de dépilation préopératoire, pour la prévention des infections du site opératoire (ISO). En résumé : une MA-R a été réalisée, afin de combiner les preuves directes et indirectes et comparer l’épilation chimique à la tonte. Des MA par paires et en réseau ont été réalisées. Dix-neuf études ont satisfait aux critères d’inclusion. Aucune étude n’a comparé la tonte à la dépilation chimique. Les MA-R avec le rasage comme référence ont montré un nombre significativement inférieur d’ISO avec la tonte, la dépilation chimique ou l’absence de dépilation [risque relatif 0,55, intervalle de confiance à 95% 0,38-0,79 ; 0,60, 0,36-0,97 ; et 0,56, 0,34-0,96, respectivement]. Aucune différence significative n’a été observée entre l’absence de dépilation et la dépilation chimique ou la tonte (1,05, 0,55-2,00 ; 0,97, 0,51-1,82, respectivement) ou entre la dépilation chimique et la tonte (1,09, 0,59-2,01). Cette MA a confirmé l’absence de tout bénéfice de la dépilation pour prévenir l’ISO, et le risque plus élevé d’ISO en cas de rasage. L’épilation chimique et la tonte ont été comparées pour la première fois. Le risque d’ISO semble être similaire avec les deux méthodes (Figure 1).

La méta-analyse séquentielle

La MA séquentielle est l’application de l’approche séquentielle des essais cliniques à la MA12. La plupart des MA, y compris celles de Cochrane, n’ont pas une puissance statistique suffisante. C’est pourquoi une MA doit être considérée comme une analyse intermédiaire. Les résultats des MA devraient mettre en relation le nombre total de participants randomisés avec la taille estimée de l’information méta-analytique requise. Lorsque le nombre de participants et le nombre correspondant d’essais dans une MA sont insuffisants, l’utilisation de l’intervalle de confiance traditionnel de 95% ou du seuil de signification statistique de 5% peuvent conduire à de fausses conclusions positives (erreurs de type I) et à de fausses conclusions négatives (erreurs de type II) [9]. La MA séquentielle met en œuvre, via une MA cumulative, un ajustement des niveaux de signification. Elle permet d’évaluer le risque d’erreurs aléatoires et de conclusions fallacieuses dû à la répétition des tests statistiques dans les MA cumulatives. La TSA13 élargit l’intervalle de confiance et quantifie le niveau de preuve, en calculant la taille des informations requise pour une MA concluante. Considérant donc que la plupart des MA ne disposent pas de la puissance ad hoc, Imberger et al. [31] ont passé en revue 4 736 revues systématiques et retenu 100 MA qui répondaient à leurs critères d’inclusion. En utilisant la MA cumulative classique, des faux positifs ont été constatés dans sept des méta-analyses (7%, 95% IC 3% à 14%), se produisant plus d’une fois sur trois. Le nombre total de faux positifs était de 14 et la TSA en a empêché 13 (93%, 95% IC 68% à 98%). Dans une analyse post hoc, ils ont constaté que les MA Cochrane qui étaient négatives avaient 1,67 fois plus de chance d’être mises à jour (95% IC 0,92 à 2,68) que celles qui sont positives. Ils concluent que, en raison des limites de la validité externe et de la probabilité réduite de mise à jour des MA positives, la proportion réelle de faux positifs dans les MA est probablement plus élevée. La TSA a permis d’éviter 93% des faux positifs (95% IC 68% à 98%).

Méta-analyse bayésienne

La MA-B est l’application de l’inférence bayésienne à la MA ! Rappelons que l’inférence « classique » est fréquentiste14. Nous n’aborderons pas les éléments épistémologiques concernant les deux approches de la statistique, bayésienne ou fréquentiste [34]. Donc, tous les domaines de la MA peuvent être abordés sous l’angle bayésien. La MA conventionnelle repose sur plusieurs hypothèses de distribution intra-étude et interétudes, des estimateurs (OR, RR…). Il est difficile de réaliser une MA avec un faible taux d’événements ou avec peu d’études, car certaines méthodes standard ne sont pas bien adaptées. Par exemple, il est difficile d’estimer l’hétérogénéité interétudes dans cette situation et une estimation inexacte de l’hétérogénéité peut conduire à des intervalles de confiance trop étroits. Différentes méthodes peuvent donner des résultats différents. En ce qui concerne la MA sur petits échantillons (nombre d’études incluses et taille des études), certains modèles fréquentistes peuvent conduire à une importante sous-estimation de la variance de l’hétérogénéité τ² [35]. La MA-B réduit ce biais et, de plus, permet la prise en compte de résultats préexistants (par exemple ceux issus d’études observationnelles, en cas de MA d’études randomisées) via les a priori informatifs concernant l’hétérogénéité de la variance.

Aspects liés aux « petits échantillons »

Il s’agit de MA incluant un faible nombre d’études, ayant de faibles effectifs ou un nombre limité d’événements (parfois, aucun événement)… Elles posent quelques problèmes méthodologiques15, notamment en présence de nombreuses « cellules vides » (zéro événement dans de nombreux bras des études incluses dans la MA). Dans l’approche statistique fréquentiste, en présence de « cellules vides », plusieurs approches ont été proposées : correction dite de continuité avec ajout d’une « petite » quantité aux cellules vides (ou non), le plus souvent 0,5 ; méthode de Peto ou de Mantel-Haenszel16, mise en œuvre d’une méthode exacte [37], etc. d’autres approches consistent à ne pas inclure les études contenant des « cellules » vides dans les bras. Rappelons que les études avec deux bras sans événement apportent de l’information via leur effectif total. L’approche bayésienne s’affranchit de tout ceci en permettant une modélisation basée sur différentes lois de probabilité autres que la loi normale. Muthukumarana et al. [38] ont montré qu’il était possible de prendre en compte la totalité de l’information procurée par ces études, par l’intermédiaire d’un modèle binomial spécifique17. D’autres approches vont dans le même sens, avec par exemple l’utilisation d’un modèle hiérarchique binomial-normal (avec des a priori peu informatifs) [39]. À titre d’exemple, on peut citer l’analyse de Aho Glélé et al. [40], relative au travail de Flynn et al. [41] concernant l’efficacité de la décontamination des connecteurs avec des lingettes imprégnées de divers désinfectants…, pour prévenir les bactériémies liées aux cathéters (voir Annexe).

Adapter la méthode selon le type d’étude : approche clinique18

Méta-analyse d’études diagnostiques

L’application de la MA aux études sur la précision des tests de diagnostic n’est pas simple [42]. La précision d’un test de diagnostic se résume le plus souvent à deux indices, par exemple la sensibilité et la spécificité, qui ne peuvent être considérés comme indépendants et doivent donc être estimés simultanément. Ceci s’apparente à une MA multivariée (cf. 1.2 Méta-analyse multivariée [MA-MV]), chaque étude incluse contenant ces deux critères. Une source notable d’hétérogénéité résulte de « l’effet de seuil » (threshold effect). De nombreux tests diagnostiques comparent un résultat ou une mesure à un seuil prédéfini. Le choix du seuil affecte à la fois la sensibilité et la spécificité du test. Afin d’examiner cette hétérogénéité, les sensibilités et spécificités estimées peuvent être représentées graphiquement les unes par rapport aux autres. Une courbe ROC19 peut alors être tracée et l’aire sous cette courbe estimée. Deux modèles statistiques sont utilisés : modèle HSROC (hierarchical summary receiver operating characteristic) de Rutter et Gatsonis [43] et le modèle bivarié de Reitsma et al. [44]. Un exemple de MA diagnostique est présenté dans l’article de Saliba et al. [45] qui ont étudié les valeurs diagnostiques de la PCR dans les infections à BHR. En résumé : les tests moléculaires sont fiables pour la détection rapide des entérobactéries productrices de carbapénémase (EPC) directement à partir d’hémocultures positives, ce qui réduit considérablement le temps d’identification. L’objectif de l’étude était d’examiner et d’évaluer la précision globale du test de diagnostic de l’amplification en chaîne par polymérase pour la détection des EPC dans les prélèvements rectaux. Au total, 143 articles ont été examinés et 16 études ont été incluses. Cinq (31%) des études ont été menées dans le contexte d’une épidémie d’EPC ; une étude (6%) a inclus des patients pré-identifiés comme présentant un EPC dans des échantillons cliniques (sang ou sécrétions trachéales), tandis que les autres (63%) ont recueilli des prélèvements rectaux sur des patients considérés comme présentant un risque élevé de colonisation. Les tests moléculaires évalués avaient une sensibilité relativement bonne de 0,95 (intervalle de confiance (IC) à 95% : 0,902-0,989), et une excellente spécificité de 0,994 (IC à 95% : 0,965-1).

Méta-analyse d’études pronostiques (« survie »)

Pour les données de survie, en cas de données agrégées, il est nécessaire d’extraire un hazard ratio (HR) ou des paramètres permettant de l’estimer [46]. En effet, l’extraction d’un simple nombre d’événements ne permettrait d’estimer qu’un odds ratio. Celui-ci est un estimateur biaisé des données de survie [47]. Différentes méthodes ont été proposées [48]. La MA sur données individuelles permet d’éviter ces difficultés d’extraction du HR.

Méta-analyse d’études de prévalence (ou d’incidence)

La MA de prévalence [49], peut poser des problèmes d’estimation lorsque les événements sont rares. Dans ce cas, l’approximation normale ne peut être utilisée. Différentes transformations ont été proposées dont la double transformation arc sinus20. Après avoir transformé les données, il faut les « retransformer » pour revenir à l’original (« backtransform ») : ce processus n’est parfois pas simple [52]. La MA bayésienne permet de s’affranchir de tout ceci, au prix d’une analyse de sensibilité sur les a priori… Un exemple de MA de prévalence est présenté dans l’article Pivot et al. [53] qui a estimé la prévalence des ISO en chirurgie ambulatoire. En résumé : l’objectif était d’estimer la prévalence globale des ISO après une chirurgie d’un jour, quel que soit le type de chirurgie. Un modèle à effets aléatoires regroupés utilisant l’approche DerSimonian et Laird a été utilisé pour estimer la prévalence globale. Une double transformation arc sinus a été utilisée pour stabiliser la variance des proportions. Des méta-régressions univariées et multivariées ont été utilisées pour tester l’effet de la date de publication, du pays d’étude, de la population étudiée, du type de spécialité, de la classe de contamination, du moment de la visite postopératoire du patient après la chirurgie de jour et de la durée des soins hospitaliers. Quatre-vingt-dix articles ont été analysés. La prévalence globale estimée des ISO chez les patients ayant subi une chirurgie d’un jour était de 1,36% (intervalle de confiance de 95% 1,1-1,6), avec une probabilité bayésienne de 1 à 2% de 96,5%. La date de publication était associée à la prévalence des ISO.

Conditions de réussite d’une méta-analyse21

Plus que le nombre d’études retenues pour une MA, c’est la qualité qui prime. Celle-ci doit être évaluée. De nombreuses grilles sont disponibles voir par exemple la méthode Grade [19]. Un appui statistique peut être utile, en raison de la sophistication croissante des modèles utilisés.

Conclusion

La méta-analyse (MA) est un outil important dans l’élaboration des recommandations, en particulier lorsque le but est d’aboutir à une gradation de celles-ci. En effet, la MA, contrairement à la revue narrative apporte une réponse quantifiée aux questions, permettant entre autres la transparence et la reproductibilité du processus22. L’objectif de la MA peut être simple, mais les techniques statistiques utilisables peuvent être complexes23.

Notes :

1- Voir la première partie de cet article, déjà publiée dans Hygiènes : Aho Glélé LS, Aho S. Méta-analyse : les bases méthodologiques – Partie I. Hygiènes 2020;28(1):61-68. Doi : 10.25329/hy_xxviii_1-6. Pour une MA d’essais randomisés dans le domaine de la prévention des infections, voir par exemple Fournel et al. [10].
2- Cf. MA et effets secondaires des thérapeutiques. Des problèmes méthodologiques peuvent survenir si les effectifs sont faibles (nombre d’études et taille d’échantillon).
3- La MA « dose-réponse » permet de prendre en compte une exposition non binaire.
4- Voir le paragraphe « Méta-analyse d’études diagnostiques ».
5- Voir le paragraphe « Méta-analyse en réseau ou Network Meta-analysis »
6- La covariance mesure la relation linéaire entre deux variables. La covariance est similaire à la corrélation entre deux variables, néanmoins : (i) les valeurs du coefficient de corrélation sont normalisées (-1 à +1) ; (ii) les valeurs de covariance ne sont pas normalisées (de -∞ à +∞).
7- Voir le paragraphe sur Méta-analyse bayésienne (MA-B).
8- Markov Chain Monte Carlo : méthodes d’échantillonnage, à partir de distributions de probabilité.
9- INLA : integrated nested Laplace approximations. MCMC est une méthode asymptotiquement exacte, alors qu’INLA est une approximation. MCMC est lent et, pour certains modèles complexes, peut échouer (le modèle ne converge pas). Des logiciels plus récents (JAGS, Stan) ont tenté de relever ces défis.
10- Sucra : surface under the cumulative ranking curve.
11- Rappel : la puissance est la probabilité de mettre en évidence une différence si elle existe.
12- « In most randomized clinical trials, patient entry is sequential so that the results become available sequentially. Both medical ethics and the natural curiosity of investigators require an ongoing assessment of the accumulating data to see if a treatment difference is sufficient to stop the trial. » Pocock (1977), in : [30], Chapter 13. A Brief Review of Sequential Testing Methods. pp. 365 et suivantes.
13- Trial sequential analysis (Essai clinique séquentiel).
14- Cf. « Ronald Aylmer Fisher », In : [32], p. 389-97.R.A. Fisher transformed the statistics of his day from a modest collection of useful and ad hoc techniques into a powerful and systematic body of theoretical concepts and pratical methods… Voir aussi « Fisher Triumphant », In : [33], p. 61-71.
15- Un exemple célèbre concerne l’évaluation des effets secondaires de la Rosiglitazone [36].
16- Cf. première partie de cet article.
17- Modèle « A zero inflated binomial model with excessive zero parameters ».
18- Quelles que soient les questions pratiques posées, l’approche clinique met en œuvre des méthodes statistiques.
19- Receiver operating characteristic (La courbe ROC permet d’évaluer les performances d’un test diagnostique, en mettant en relation sa sensibilité [en ordonnée] et sa spécificité [en abscisse]).
20- Transformation arc sinus : asin(sqrt(x / (n + 1))) + asin(sqrt((x + 1)/(n + 1))) ; avec x, effectif (numérateur) et n, effectif total (dénominateur). D’autres transformations sont possibles : log (i.e, log de la prévalence), logit (i. e., logit de la proportion)… rappelons que le logit d’une proportion p est log(p/1-p). Si p=0, log(0) n’existe pas et des approches comme la correction de continuité doivent être mises en œuvre. Quand p=0, arc sinus existe et vaut zéro. La double transformation arc sinus permet aussi de stabiliser la variance des proportions. Néanmoins, même cette transformation peut conduire à des résultats biaisés [50]. Certains proposent d’utiliser une différence de transformation arc sinus [51].
21- Voir : le chapitre « La méta-analyse : une méthode nécessaire », de la première partie de cet article : Aho Glélé LS, Aho S. Méta-analyse : les bases méthodologiques – Partie I. Hygiènes 2020;28(1):61-68. Doi : 10.25329/hy_xxviii_1-6.
22- Sans remonter à Galilée, voir par exemple Wilks, 1961 [54].
23- Tout comme l’épidémiologie, la MA ne se résume pas uniquement à une suite de tableaux 2X2…

Références

1- Riley RD, Lambert PC, Abo-Zaid G. Meta-analysis of individual participant data: rationale, conduct, and reporting. BMJ 2010;340. Doi : 10.1136/bmj.c221.

2- Simmonds M, Stewart G, Stewart L. A decade of individual participant data meta-analyses: A review of current practice. Contemp Clin Trials 2015;45:76-83. Doi : 10.1016/j.cct.2015.06.012.

3- Jackson D, Riley R, White IR. Multivariate meta-analysis: Potential and promise. Stat Med 2011;30:2481-2498. Doi : 10.1002/sim.4172.

4- Mavridis D, Salanti G. A practical introduction to multivariate meta-analysis: Stat Methods Med Res 2013;2:133-158. Doi : 10.1177/0962280211432219.

5- Biondi-Zoccai G. Network Meta-Analysis: Evidence Synthesis with Mixed Treatment Comparison. Nova Science Publishers, Incorporated; 2014, 406 p.

6- Dias S, Ades AE, Welton NJ, et al. Network Meta-Analysis for Decision-Making. John Wiley & Sons; 2018, 488 p.

7- Sutton AJ, Abrams KR. Bayesian methods in meta-analysis and evidence synthesis. Stat Methods Med Res 2001;10:277-303.
Doi : 10.1177/096228020101000404.

8- Kulinskaya E, Wood J. Trial sequential methods for meta-analysis. Res Synth Methods 2014;5:212-220. Doi : 10.1002/jrsm.1104.

9- Wetterslev J, Jakobsen JC, Gluud C. Trial Sequential Analysis in systematic reviews with meta-analysis. BMC Med Res Methodol 2017;17:39. Doi : 10.1186/s12874-017-0315-7.

10- Fournel I, Tiv M, Soulias M, et al. Meta-analysis of intraoperative povidone-iodine application to prevent surgical-site infection. Br J Surg 2010;97:1603-1613.

11- Berlin JA, Longnecker MP, Greenland S. Meta-analysis of epidemiologic dose-response data. Epidemiology. 1993;4:218-228. Accessible à : https://journals.lww.com/epidem/Abstract/1993/05000/Meta_analysis_of_Epidemiologic_Dose_Response_Data.5.aspx (Consulté le 17-12-2020).

12- Zhang C, Jia P, Yu L, Xu C. Introduction to methodology of dose-response meta-analysis for binary outcome: With application on software. J Evid Based Med 2018;11:125-129. Doi : 10.1111/jebm.12267.

13- Tudur Smith C, Marcucci M, Nolan SJ, et al. Individual participant data meta-analyses compared with meta-analyses based on aggregate data. Cochrane Database Syst Rev 2016;9:MR000007. Doi : 10.1002/14651858.MR000007.pub3.

14- Tierney JF, Fisher DJ, Burdett S, et al. Comparison of aggregate and individual participant data approaches to meta-analysis of randomised trials: An observational study. PLoS Med 2020;17:e1003019. Doi : 10.1371/journal.pmed.1003019.

15- Tierney JF, Vale C, Riley R, et al. Individual Participant Data (IPD) Meta-analyses of Randomised Controlled Trials: Guidance on Their Use. PLOS Medicine 2015;12:e1001855. Doi : 10.1371/journal.pmed.1001855.

16- Hong C, D Riley R, Chen Y. An improved method for bivariate meta-analysis when within-study correlations are unknown. Res Synth Methods 2018;9:73-88. Doi :  10.1002/jrsm.1274.

17- Jackson D, White IR, Price M, et al. Borrowing of strength and study weights in multivariate and network meta-analysis. Stat Methods Med Res 2017;26:2853-2868. Doi : 10.1177/0962280215611702.

18- Rouse B, Chaimani A, Li T. Network Meta-Analysis: An Introduction for Clinicians. Intern Emerg Med 2017;12:103-111. Doi : 10.1007/s11739-016-1583-7.

19- Aho Glélé LS, Aho S. Élaboration de recommandations : comment utiliser la méthode Grade ? Hygienes 2018;5:213-218. Doi : 10.25329/hy_xxvi_5-8.

20- The Prisma Extension Statement for Reporting of Systematic Reviews Incorporating Network Meta-analyses of Health Care Interventions: Checklist and Explanations | The Equator Network. Accessible à : https://www.equator-network.org/reporting-guidelines/prisma-extension-network-meta-analyses/ (Consulté le 17-12-2020)

21- Bucher HC, Guyatt GH, Griffith LE, et al. The results of direct and indirect treatment comparisons in meta-analysis of randomized controlled trials. J Clin Epidemiol 1997;50:683-691. Doi : 10.1016/S0895-4356(97)00049-8.

22- Lu G, Ades AE. Combination of direct and indirect evidence in mixed treatment comparisons. Stat Med 2004;23:3105-3124. Doi : 10.1002/sim.1875.

23- Kanters S, Ford N, Druyts E, et al. Use of network meta-analysis in clinical guidelines. Bull World Health Organ 2016;94:782–784. Doi : 10.2471/BLT.16.174326.

24- Riley RD, Jackson D, Salanti G, et al. Multivariate and network meta-analysis of multiple outcomes and multiple treatments: rationale, concepts, and examples. BMJ 2017;358:j3932. Doi : 10.1136/bmj.j3932.

25- Rücker G. Network meta-analysis, electrical networks and graph theory. Res Synth Methods 2012;3:312-324. Doi : 10.1002/jrsm.1058.

26- Tu Y-K. Use of generalized linear mixed models for network meta-analysis. Med Decis Making 2014;34: 911-918. Doi : 10.1177/0272989X14545789.

27- Debray T, Schuit E, Efthimiou O, et al. An overview of methods for network meta-analysis using individual participant data: when do benefits arise? Stat Methods Med Res 2016;27. Doi : 10.1177/0962280216660741.

28- Salanti G, Ades AE, Ioannidis JPA. Graphical methods and numerical summaries for presenting results from multiple-treatment meta-analysis: an overview and tutorial. J Clin Epidemiol 2011;64:163-171. Doi : 10.1016/j.jclinepi.2010.03.016.

29- Lefebvre A, Saliou P, Lucet JC, et al. Preoperative hair removal and surgical site infections: network meta-analysis of randomized controlled trials. J Hosp Infect 2015;91:100-108. Doi : 10.1016/j.jhin.2015.06.020.

30- Vexler A, Hutson AD, Chen X. Statistical Testing Strategies in the Health Sciences. Boca Raton, FL: Chapman and Hall/CRC; 2016.

31- Imberger G, Thorlund K, Gluud C, et al. False-positive findings in Cochrane meta-analyses with and without application of trial sequential analysis: an empirical review. BMJ Open 2016;6:e011890. Doi : 10.1136/bmjopen-2016-011890.

32- Heyde CC, Seneta E, editors. Statisticians of the centuries. New York: Springer; 2001, 500 p.

33- Salsburg D. The lady tasting tea: how statistics revolutionized science in the twentieth century. New York: W.H. Freeman; 2001, 352 p.

34- Vallverdú J. Bayesians versus frequentists: A philosophical debate on statistical reasoning. 1st ed. 2016. Springer; 2015, 110 p.

35- Jackson D, Law M, Stijnen T, et al. A comparison of seven random-effects models for meta-analyses that estimate the summary odds ratio. Stat Med 2018;37:1059-1085. Doi : 10.1002/sim.7588.

36- Friedrich JO, Beyene J, Adhikari NK. Rosiglitazone: can meta-analysis accurately estimate excess cardiovascular risk given the available data? Re-analysis of randomized trials using various methodologic approaches. BMC Research Notes 2009;2:5. Doi : 10.1186/1756-0500-2-5.

37- Tian L, Cai T, Pfeffer MA, et al. Exact and efficient inference procedure for meta-analysis and its application to the analysis of independent 2×2 tables with all available data but without artificial continuity correction. Biostatistics 2009;10:275-281. Doi : 10.1093/biostatistics/kxn034.

38- Muthukumarana S, Martell D, Tiwari R. Meta analysis of binary data with excessive zeros in two-arm trials. J Stat Distrib App 2019;6:10. Doi : 10.1186/s40488-019-0099-x.

39- Günhan BK, Röver C, Friede T. Random-effects meta-analysis of few studies involving rare events. Res Synth Methods 2020;11:74-90. Doi : 10.1002/jrsm.1370.

40- Aho Glélé LS, Guilloteau A, Astruc K, et al. “Methods for microbial needleless connector decontamination: A systematic review and meta-analysis” – Interpret results with caution. Am J Infect Control 2019;47:1520-1521. Doi : 10.1016/j.ajic.2019.06.030.

41- Flynn JM, Larsen EN, Keogh S, et al. Methods for microbial needleless connector decontamination: A systematic review and meta-analysis. Am J Infect Control 2019;47:956-962. Doi : 10.1016/j.ajic.2019.01.002.

42- Biondi-Zoccai G. Diagnostic meta-analysis: a useful tool for clinical decision-making. Springer International Publishing; 2018. Doi : 10.1007/978-3-319-78966-8.

43- Rutter CM, Gatsonis CA. A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations. Stat Med 2001;20:2865-2884. Doi : 10.1002/sim.942.

44- Reitsma JB, Glas AS, Rutjes AWS, et al. Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews. J Clin Epidemiol 2005;58:982-990. Doi : 10.1016/j.jclinepi.2005.02.022.

45- Saliba R, Aho-Glélé LS, Karam-Sarkis D, et al. Evaluation of polymerase chain reaction assays for direct screening of carbapenemase-producing Enterobacteriaceae from rectal swabs: a diagnostic meta-analysis. J Hosp Infect 2020;104:381-389. Doi : 10.1016/j.jhin.2019.11.017.

46- Parmar MK, Torri V, Stewart L. Extracting summary statistics to perform meta-analyses of the published literature for survival endpoints. Stat Med 1998;17:2815-2834. Doi : 10.1002/(sici)1097-0258(19981230)17:24<2815::aid-sim110>3.0.co;2-8.

47- Michiels S, Piedbois P, Burdett S, et al. Meta-analysis when only the median survival times are known: a comparison with individual patient data results. Int J Technol Assess Health Care 2005;21:119-125. Doi : 10.1017/S0266462305050154.

48- Tierney JF, Stewart LA, Ghersi D, et al. Practical methods for incorporating summary time-to-event data into meta-analysis. Trials 2007;8:16. Doi : 10.1186/1745-6215-8-16.

49- Barendregt JJ, Doi SA, Lee YY, et al. Meta-analysis of prevalence. J Epidemiol Commun H 2013;67:974-978. Doi : 10.1136/jech-2013-203104.

50- Schwarzer G, Chemaitelly H, Abu-Raddad LJ, et al. Seriously misleading results using inverse of Freeman-Tukey double arcsine transformation in meta-analysis of single proportions. Res Synth Methods 2019;10:476-483. Doi : 10.1002/jrsm.1348.

51- Rücker G, Schwarzer G, Carpenter J, et al. Why add anything to nothing? The arcsine difference as a measure of treatment effect in meta-analysis with zero cells. Stat Med 2009;28:721-738. Doi : 10.1002/sim.3511.

52- Miller JJ. The inverse of the freeman – Tukey double arcsine transformation. Am Stat 1978;32:138. Doi : 10.1002/jrsm.1348.

53- Pivot D, Hoch G, Astruc K, et al. A systematic review of surgical site infections following day surgery: a frequentist and a Bayesian meta-analysis of prevalence. J Hosp Infect 2019;101:196-209. Doi : 10.1016/j.jhin.2018.07.035.

54- Wilks SS. Some aspects of quantification in science. Isis 1961;52:135-142. Accessible à : https://www.jstor.org/stable/228676 (Consulté le 17-12-2020).