Quel test statistique choisir pour une thèse de médecine ?
Une grille de décision pour choisir la famille de test statistique adaptée à une thèse de médecine, sans partir du logiciel ni de la p-value.
Choisir un test statistique pour une thèse de médecine ne consiste pas à chercher le nom d’un test dans un logiciel. Le test dépend d’abord de la question de recherche, du type de variable, du nombre de groupes, du caractère indépendant ou apparié des données, et de la façon dont les résultats seront interprétés.
Le piège est de commencer trop tard : tableur terminé, logiciel ouvert, puis question “quel test dois-je utiliser ?”. À ce stade, certaines erreurs sont déjà difficiles à corriger : variable mal codée, groupes trop petits, données appariées non identifiées, critère principal absent.
Cet article s’inscrit dans la section Statistiques du guide complet de la thèse de médecine. Il donne une méthode de tri pour choisir la famille de test adaptée, puis renvoie vers les articles spécialisés quand la situation demande plus de détail.
La réponse courte
Avant de choisir un test, répondez à cinq questions :
- Quelle est la question : décrire, comparer, associer, prédire, suivre dans le temps ?
- Quelle est la variable principale : qualitative, quantitative, ordinale, délai jusqu’à événement ?
- Combien de groupes ou de temps de mesure comparez-vous ?
- Les observations sont-elles indépendantes ou appariées ?
- Faut-il seulement un test ou plutôt une estimation avec IC95, un modèle ou une analyse de survie ?
Le bon test statistique est celui qui répond à la question principale, pas celui qui donne la plus petite p-value.
Commencer par la question, pas par le test
Un même tableau peut donner lieu à plusieurs analyses selon la question.
Exemple : vous avez une cohorte de patients hospitalisés et une variable réhospitalisation à 30 jours.
Questions possibles :
- Quelle est la proportion de réhospitalisations à 30 jours ?
- La réhospitalisation est-elle plus fréquente dans un groupe que dans l’autre ?
- Quels facteurs sont associés à la réhospitalisation ?
- Le délai avant réhospitalisation diffère-t-il selon les groupes ?
- Peut-on prédire le risque de réhospitalisation ?
Ces questions ne conduisent pas toutes au même test.
| Question | Analyse souvent discutée |
|---|---|
| Estimer une fréquence | proportion avec IC95 |
| Comparer deux proportions | Chi2 ou Fisher, avec différence de proportions, RR ou OR selon le cas |
| Identifier des facteurs associés | régression logistique si critère binaire |
| Étudier un délai jusqu’à événement | Kaplan-Meier, log-rank, modèle de Cox |
| Construire un score | modèle prédictif, validation, calibration |
Si la question de recherche est floue, le choix du test le sera aussi. Revenez d’abord au protocole de thèse de médecine.
Étape 1 : décrire ou tester ?
Toutes les thèses n’ont pas besoin d’un test statistique partout.
Une étude descriptive peut répondre à sa question avec :
- effectifs ;
- pourcentages ;
- moyennes et écarts-types ;
- médianes et intervalles interquartiles ;
- intervalles de confiance ;
- tableaux et figures.
Exemple :
Décrire les caractéristiques des patients hospitalisés pour insuffisance cardiaque dans un service entre 2023 et 2025.
Ici, l’analyse principale peut être descriptive. Ajouter une p-value à chaque ligne de la table ne rend pas automatiquement la thèse plus scientifique.
Un test statistique devient utile si vous avez une question de comparaison ou d’association :
- un groupe diffère-t-il d’un autre ?
- une exposition est-elle associée à un événement ?
- une mesure change-t-elle après une intervention ?
- un facteur est-il associé à un score ?
Les SAMPL guidelines rappellent l’importance de décrire clairement les méthodes statistiques et de ne pas réduire les résultats à des p-values isolées. Dans une thèse, l’estimation et l’intervalle de confiance sont souvent aussi importants que le test.
Étape 2 : identifier le type de variable
Le type de variable guide fortement le choix du test.
| Type de variable | Exemples | Résumé habituel |
|---|---|---|
| Qualitative binaire | complication oui/non, sexe, décès | effectif et pourcentage |
| Qualitative nominale | groupe sanguin, spécialité, type de traitement | effectif et pourcentage |
| Ordinale | stade 1-4, satisfaction faible/moyenne/forte | effectif par niveau, médiane parfois |
| Quantitative continue | âge, CRP, durée de séjour, score | moyenne/ET ou médiane/IQR |
| Délai jusqu’à événement | temps jusqu’à décès, récidive, réhospitalisation | courbe de survie, médiane de survie, HR |
Le piège classique est de traiter une variable ordinale comme une variable quantitative simplement parce qu’elle est codée 1, 2, 3, 4. Le code numérique ne suffit pas à rendre les écarts entre niveaux équivalents.
Exemple : un score de satisfaction de 1 à 5 peut être résumé et comparé, mais son interprétation n’est pas identique à une glycémie ou une durée d’hospitalisation.
Étape 3 : vérifier l’indépendance ou l’appariement
Deux groupes sont indépendants si les sujets d’un groupe ne sont pas liés aux sujets de l’autre.
Exemples :
- patients traités par A vs patients traités par B ;
- exposés vs non exposés ;
- complications vs absence de complication.
Des données sont appariées si les observations sont liées.
Exemples :
- même patient avant/après ;
- œil droit et œil gauche chez le même patient ;
- cas et témoin appariés ;
- mesures répétées à J0, J7, J30 ;
- plusieurs séjours pour un même patient.
Si les données sont appariées, les tests pour groupes indépendants ne sont pas adaptés. L’article sur les données appariées dans une thèse de médecine détaille ces situations.
La grille rapide de choix
Cette table donne une orientation. Elle ne remplace pas un plan d’analyse statistique.
| Question | Situation | Analyse souvent discutée |
|---|---|---|
| Décrire une variable qualitative | un seul groupe | effectifs, pourcentages, IC95 si utile |
| Décrire une variable quantitative | un seul groupe | moyenne/ET ou médiane/IQR |
| Comparer deux proportions indépendantes | variable binaire, deux groupes | Chi2 ou Fisher |
| Comparer plus de deux proportions | variable qualitative, plusieurs groupes | Chi2, parfois test exact |
| Comparer deux moyennes indépendantes | variable quantitative, deux groupes | Welch/Student |
| Comparer deux distributions indépendantes | variable quantitative asymétrique ou ordinale | Mann-Whitney |
| Comparer plus de deux moyennes | variable quantitative, plusieurs groupes | ANOVA |
| Comparer plus de deux distributions | variable quantitative asymétrique ou ordinale | Kruskal-Wallis |
| Comparer avant/après une variable quantitative | mêmes sujets | test t apparié ou Wilcoxon signé-rang |
| Comparer avant/après une variable binaire | mêmes sujets | McNemar |
| Étudier deux variables quantitatives | relation linéaire ou monotone | corrélation de Pearson ou Spearman |
| Ajuster sur plusieurs facteurs avec critère binaire | événement oui/non | régression logistique |
| Ajuster sur plusieurs facteurs avec critère quantitatif | score, durée, mesure continue | régression linéaire si conditions compatibles |
| Étudier le temps jusqu’à événement | suivi dans le temps | Kaplan-Meier, log-rank, modèle de Cox |
| Étudier un test diagnostique | sensibilité, spécificité | Se/Sp, VPP/VPN, courbe ROC, AUC |
| Étudier l’accord entre deux mesures | deux observateurs ou méthodes | kappa, ICC, Bland-Altman selon le cas |
Pour les comparaisons simples de groupes, l’article comparer deux groupes ou plus donne une grille plus détaillée.
Variables qualitatives : Chi2 ou Fisher ?
Si vous comparez une variable qualitative entre groupes, les tests souvent discutés sont le Chi2 et le test exact de Fisher.
Exemple :
| Groupe | Complication | Pas de complication |
|---|---|---|
| A | 12 | 88 |
| B | 25 | 75 |
Le choix dépend surtout des effectifs attendus et de la structure du tableau.
En pratique :
- Chi2 si les effectifs attendus sont suffisants ;
- Fisher si les effectifs sont faibles, surtout en tableau 2x2 ;
- prudence si le tableau a beaucoup de modalités et peu de sujets.
Dans le manuscrit :
Les variables qualitatives ont été comparées par test du Chi2 ou test exact de Fisher selon les effectifs attendus.
Ne choisissez pas Fisher uniquement parce qu’une case observée contient moins de 5 sujets. Ce sont les effectifs attendus qui comptent, et la décision doit rester cohérente avec le plan d’analyse.
Variables quantitatives : Student, Welch ou Mann-Whitney ?
Pour comparer une variable quantitative entre deux groupes indépendants, on discute souvent :
- test de Welch ou Student pour comparer des moyennes ;
- test de Mann-Whitney si l’approche par rangs est plus adaptée.
Le test de Welch est souvent préférable au Student strict, car il ne suppose pas l’égalité des variances entre groupes.
Le test de Mann-Whitney est souvent présenté comme un test de comparaison de médianes. C’est une simplification. Il compare les rangs et peut refléter une différence plus globale de distribution.
Plus de deux groupes : test global puis comparaisons ciblées
Quand vous comparez trois groupes ou plus, un test global répond souvent à la première question :
Existe-t-il une différence entre au moins deux groupes ?
Exemples :
- Chi2 pour une variable qualitative ;
- ANOVA pour une variable quantitative si les conditions sont compatibles ;
- Kruskal-Wallis pour une variable quantitative asymétrique ou ordinale.
Si le test global est significatif, il ne dit pas quels groupes diffèrent. Il faut ensuite discuter des comparaisons post-hoc, idéalement prévues à l’avance.
Attention aux comparaisons multiples : plus vous testez, plus vous augmentez le risque d’obtenir un résultat significatif par hasard. Dans une thèse, distinguez clairement :
- comparaison principale ;
- comparaisons secondaires ;
- analyses exploratoires.
Données appariées : ne pas utiliser les tests indépendants
Pour des données appariées simples :
| Situation | Test souvent discuté |
|---|---|
| Variable quantitative avant/après | test t apparié ou Wilcoxon signé-rang |
| Variable binaire avant/après | McNemar |
| Variable ordinale avant/après | Wilcoxon signé-rang ou approche spécifique |
| Cas-témoins appariés | méthode tenant compte des paires, parfois régression logistique conditionnelle |
| Mesures répétées multiples | modèle mixte, GEE ou méthode spécifique |
Le point essentiel : l’identifiant d’appariement doit être présent dans votre base. Sans lui, l’analyse correcte peut devenir impossible.
Corrélation : attention à l’interprétation
La corrélation mesure une relation entre deux variables quantitatives ou ordinales.
Exemples :
- âge et durée d’hospitalisation ;
- score de douleur et dose d’antalgique ;
- CRP et durée de fièvre.
Tests souvent discutés :
- Pearson si la relation est approximativement linéaire et les conditions compatibles ;
- Spearman si la relation est monotone, ordinale ou marquée par des valeurs extrêmes.
Une corrélation ne prouve pas une causalité. Elle ne suffit pas non plus si vous devez ajuster sur des facteurs de confusion.
Exemple :
L’âge est corrélé à la durée de séjour.
Cela ne signifie pas automatiquement que l’âge cause la durée de séjour. La gravité, les comorbidités ou l’autonomie peuvent expliquer une partie de l’association.
Régression : quand le test simple ne suffit plus
Un test simple compare souvent deux variables à la fois.
Un modèle de régression devient utile si vous voulez :
- ajuster sur l’âge, le sexe ou la gravité ;
- tenir compte de facteurs de confusion ;
- estimer une association entre plusieurs variables et un critère ;
- produire un OR, RR, HR ou coefficient ajusté ;
- explorer des facteurs associés à un événement.
Repères pratiques :
| Critère étudié | Modèle souvent discuté |
|---|---|
| événement oui/non | régression logistique |
| variable quantitative | régression linéaire si conditions compatibles |
| délai jusqu’à événement | modèle de Cox |
| variable ordinale | modèle ordinal |
| comptage | modèle de Poisson ou binomial négatif selon le cas |
Si vous utilisez une régression, ne choisissez pas les variables uniquement sur les p-values. Les variables doivent être justifiées par la question, la littérature, la clinique et la structure des données.
Pour interpréter OR, RR, HR et IC95, consultez l’article comprendre p-value, IC95, OR, RR et HR.
Analyse de survie : quand le temps compte
Si votre critère est un délai jusqu’à événement, un test classique peut être insuffisant.
Exemples :
- délai jusqu’au décès ;
- délai jusqu’à récidive ;
- délai jusqu’à réhospitalisation ;
- temps avant complication ;
- survie sans progression.
Les méthodes souvent discutées sont :
- courbes de Kaplan-Meier pour décrire la survenue dans le temps ;
- test du log-rank pour comparer des courbes ;
- modèle de Cox pour estimer un hazard ratio ajusté.
Ces analyses tiennent compte du suivi incomplet, c’est-à-dire des patients qui n’ont pas encore présenté l’événement à la fin du suivi ou qui sont perdus de vue. Si votre thèse repose sur ce type de critère, demandez un avis statistique tôt.
Tests diagnostiques : ne pas se limiter à une p-value
Pour évaluer un test diagnostique, la question n’est pas seulement “le test est-il associé à la maladie ?”.
Les indicateurs utiles sont souvent :
- sensibilité ;
- spécificité ;
- valeur prédictive positive ;
- valeur prédictive négative ;
- rapport de vraisemblance ;
- courbe ROC ;
- aire sous la courbe, ou AUC.
Exemple : si vous évaluez un score de dépistage, une p-value ne suffit pas. Il faut savoir combien de malades sont détectés, combien de non-malades sont correctement exclus, et quel seuil est utilisable en pratique.
Accord entre deux mesures : kappa, ICC ou Bland-Altman
Si votre thèse compare deux observateurs, deux appareils ou deux méthodes de mesure, il ne suffit pas toujours de tester s’il existe une différence moyenne.
Exemples :
- deux radiologues classent une lésion ;
- deux appareils mesurent une pression ;
- un score est calculé par deux examinateurs ;
- une mesure automatique est comparée à une mesure de référence.
Méthodes souvent discutées :
- kappa pour l’accord sur des variables qualitatives ;
- coefficient de corrélation intraclasse, ou ICC, pour certaines mesures quantitatives ;
- méthode de Bland-Altman pour comparer deux mesures quantitatives et visualiser les écarts.
Ce type d’analyse nécessite souvent un cadrage spécifique avant le recueil.
Les erreurs fréquentes
Choisir le test après avoir regardé les résultats
Le test doit être prévu autant que possible avant l’analyse. Changer de test parce qu’un résultat devient significatif fragilise la thèse.
Confondre variable de groupe et variable analysée
Dans “comparer l’âge entre deux groupes”, le groupe est la variable explicative, l’âge est la variable comparée. C’est le type de l’âge qui guide le choix du test principal.
Utiliser un test indépendant pour des données appariées
Avant/après chez les mêmes patients, deux yeux d’un même patient, cas-témoins appariés : ces situations doivent être analysées avec des méthodes qui respectent l’appariement.
Transformer toutes les variables en oui/non
Dichotomiser une variable quantitative simplifie le tableau, mais fait perdre de l’information. Un seuil doit être justifié cliniquement ou prévu à l’avance.
Faire une p-value pour chaque ligne du tableau
Une table descriptive n’a pas besoin d’une p-value partout. Les tests doivent répondre à une question, pas décorer le tableau.
Oublier les effectifs disponibles
Un test peut exister en théorie mais être peu interprétable avec un effectif trop faible ou trop peu d’événements.
Quand demander de l’aide ?
Demandez un avis statistique si :
- le critère principal est complexe ;
- les données sont appariées ou répétées ;
- il y a plusieurs groupes avec petits effectifs ;
- vous prévoyez un modèle multivarié ;
- vous étudiez un délai jusqu’à événement ;
- vous évaluez un test diagnostique ;
- vous construisez un score ;
- les données manquantes sont nombreuses ;
- l’analyse doit soutenir une publication.
Le bon moment est avant le recueil, au moment du protocole. L’article statistiques de thèse : les faire soi-même ou demander de l’aide détaille cette décision.
Si votre thèse coche plusieurs de ces situations, il peut être plus efficace de faire valider le plan d’analyse avant de lancer les tests. C’est particulièrement vrai si votre base est déjà constituée, si le critère principal est important pour la validité de la thèse, ou si les résultats doivent être intégrés proprement dans le manuscrit.
La prestation d’analyse statistique pour thèse de médecine permet de vérifier la base, choisir les tests adaptés, produire les tableaux de résultats et proposer une rédaction exploitable pour la partie Résultats.
Checklist avant de lancer les analyses
Avant de choisir définitivement vos tests, vérifiez :
- la question principale est écrite ;
- le critère principal est identifié ;
- chaque variable a un type clair ;
- les groupes sont définis ;
- l’appariement éventuel est documenté ;
- l’unité d’analyse est claire : patient, séjour, consultation, œil, prélèvement ;
- les données manquantes sont codées ;
- les effectifs par groupe sont connus ;
- les analyses principales sont distinguées des analyses exploratoires ;
- les tests choisis sont justifiables dans la partie Méthodes ;
- les résultats pourront être présentés avec estimation et IC95 si possible.
Une fois les analyses réalisées, la question suivante est de comprendre ce que les résultats veulent dire. Commencez par l’article sur p-value, IC95, OR, RR et HR dans une thèse, puis utilisez le guide sur la présentation des résultats pour rédiger le manuscrit.
Questions fréquentes
Quel test statistique utiliser pour comparer deux groupes ?
Cela dépend de la variable comparée et du lien entre les groupes. Pour une variable qualitative indépendante, on discute Chi2 ou Fisher. Pour une variable quantitative indépendante, on discute Welch/Student ou Mann-Whitney. Si les données sont appariées, il faut utiliser un test apparié.
Faut-il toujours faire un test statistique dans une thèse ?
Non. Une thèse descriptive peut surtout présenter des effectifs, pourcentages, moyennes, médianes et intervalles de confiance. Un test est utile s’il répond à une question de comparaison ou d’association prévue.
Faut-il tester la normalité avant de choisir Student ou Mann-Whitney ?
La normalité ne doit pas être décidée uniquement par un test automatique. Il faut regarder la distribution, les effectifs, les valeurs extrêmes, le type de variable et l’objectif. Le test de Welch est souvent plus robuste qu’un Student strict lorsque les variances diffèrent.
Quel test utiliser pour des données appariées ?
Pour deux mesures quantitatives appariées, on discute test t apparié ou Wilcoxon signé-rang. Pour une variable binaire appariée, on discute McNemar. Les mesures répétées ou appariements complexes nécessitent souvent un avis statistique.
Quand faut-il demander de l’aide pour choisir un test statistique ?
Demandez de l’aide si l’analyse implique un modèle multivarié, des données appariées complexes, un suivi dans le temps, de petits effectifs, beaucoup de données manquantes ou un objectif de publication. Il vaut mieux demander tôt que découvrir après le recueil que la base ne permet pas l’analyse prévue.