Quel test statistique choisir ? Arbre de décision pour une thèse de médecine

Un arbre de décision pour choisir la famille de test statistique adaptée à une thèse de médecine, sans partir du logiciel ni de la p-value.

Choisir un test statistique pour une thèse de médecine ne consiste pas à chercher le nom d’un test dans un logiciel. Le test dépend d’abord de la question de recherche, du type de variable, du nombre de groupes, du caractère indépendant ou apparié des données, et de la façon dont les résultats seront interprétés.

Le piège est de commencer trop tard : tableur terminé, logiciel ouvert, puis question “quel test dois-je utiliser ?”. À ce stade, certaines erreurs sont déjà difficiles à corriger : variable mal codée, groupes trop petits, données appariées non identifiées, critère principal absent.

Cet article s’inscrit dans la section Statistiques du guide complet de la thèse de médecine. Il donne un arbre de décision pour choisir la famille de test adaptée, puis renvoie vers les articles spécialisés quand la situation demande plus de détail.

Si votre besoin est seulement de trouver un test statistique pour comparer deux groupes ou plus, commencez par l’article dédié aux comparaisons de groupes. Si vous hésitez plus largement entre description, comparaison, association, régression ou analyse de survie, restez sur cette page.

Quel test statistique choisir : la réponse courte

Avant de choisir un test, répondez à cinq questions :

Quelle est la question : décrire, comparer, associer, prédire, suivre dans le temps ?
Quelle est la variable principale : qualitative, quantitative, ordinale, délai jusqu’à événement ?
Combien de groupes ou de temps de mesure comparez-vous ?
Les observations sont-elles indépendantes ou appariées ?
Faut-il seulement un test ou plutôt une estimation avec IC95, un modèle ou une analyse de survie ?

Le bon test statistique est celui qui répond à la question principale, pas celui qui donne la plus petite p-value.

Votre question	Point de départ
Décrire une population	Descriptifs, pourcentages, moyennes, médianes, IC95
Comparer deux groupes ou plus	Comparer deux groupes ou plus
Comparer avant/après ou des sujets liés	Données appariées
Étudier une association ajustée	Régression adaptée au type de critère
Étudier un délai jusqu’à événement	Analyse de survie : Kaplan-Meier, log-rank, Cox
Interpréter un OR, RR, HR ou IC95	Comprendre p-value, IC95, OR, RR et HR

Commencer par la question, pas par le test

Un même tableau peut donner lieu à plusieurs analyses selon la question.

Exemple : vous avez une cohorte de patients hospitalisés et une variable réhospitalisation à 30 jours.

Questions possibles :

Quelle est la proportion de réhospitalisations à 30 jours ?
La réhospitalisation est-elle plus fréquente dans un groupe que dans l’autre ?
Quels facteurs sont associés à la réhospitalisation ?
Le délai avant réhospitalisation diffère-t-il selon les groupes ?
Peut-on prédire le risque de réhospitalisation ?

Ces questions ne conduisent pas toutes au même test.

Question	Analyse souvent discutée
Estimer une fréquence	proportion avec IC95
Comparer deux proportions	Chi2 ou Fisher, avec différence de proportions, RR ou OR selon le cas
Identifier des facteurs associés	régression logistique si critère binaire
Étudier un délai jusqu’à événement	Kaplan-Meier, log-rank, modèle de Cox
Construire un score	modèle prédictif, validation, calibration

Si la question de recherche est floue, le choix du test le sera aussi. Revenez d’abord au protocole de thèse de médecine.

Étape 1 : décrire ou tester ?

Toutes les thèses n’ont pas besoin d’un test statistique partout.

Une étude descriptive peut répondre à sa question avec :

effectifs ;
pourcentages ;
moyennes et écarts-types ;
médianes et intervalles interquartiles ;
intervalles de confiance ;
tableaux et figures.

Exemple :

Décrire les caractéristiques des patients hospitalisés pour insuffisance cardiaque dans un service entre 2023 et 2025.

Ici, l’analyse principale peut être descriptive. Ajouter une p-value à chaque ligne de la table ne rend pas automatiquement la thèse plus scientifique.

Un test statistique devient utile si vous avez une question de comparaison ou d’association :

un groupe diffère-t-il d’un autre ?
une exposition est-elle associée à un événement ?
une mesure change-t-elle après une intervention ?
un facteur est-il associé à un score ?

Les SAMPL guidelines rappellent l’importance de décrire clairement les méthodes statistiques et de ne pas réduire les résultats à des p-values isolées. Dans une thèse, l’estimation et l’intervalle de confiance sont souvent aussi importants que le test.

Étape 2 : identifier le type de variable

Le type de variable guide fortement le choix du test.

Type de variable	Exemples	Résumé habituel
Qualitative binaire	complication oui/non, sexe, décès	effectif et pourcentage
Qualitative nominale	groupe sanguin, spécialité, type de traitement	effectif et pourcentage
Ordinale	stade 1-4, satisfaction faible/moyenne/forte	effectif par niveau, médiane parfois
Quantitative continue	âge, CRP, durée de séjour, score	moyenne/ET ou médiane/IQR
Délai jusqu’à événement	temps jusqu’à décès, récidive, réhospitalisation	courbe de survie, médiane de survie, HR

Le piège classique est de traiter une variable ordinale comme une variable quantitative simplement parce qu’elle est codée 1, 2, 3, 4. Le code numérique ne suffit pas à rendre les écarts entre niveaux équivalents.

Exemple : un score de satisfaction de 1 à 5 peut être résumé et comparé, mais son interprétation n’est pas identique à une glycémie ou une durée d’hospitalisation.

Étape 3 : vérifier l’indépendance ou l’appariement

Deux groupes sont indépendants si les sujets d’un groupe ne sont pas liés aux sujets de l’autre.

Exemples :

patients traités par A vs patients traités par B ;
exposés vs non exposés ;
complications vs absence de complication.

Des données sont appariées si les observations sont liées.

Exemples :

même patient avant/après ;
œil droit et œil gauche chez le même patient ;
cas et témoin appariés ;
mesures répétées à J0, J7, J30 ;
plusieurs séjours pour un même patient.

Si les données sont appariées, les tests pour groupes indépendants ne sont pas adaptés. L’article sur les données appariées dans une thèse de médecine détaille ces situations.

La grille rapide de choix

Cette table donne une orientation. Elle ne remplace pas un plan d’analyse statistique.

Question	Situation	Analyse souvent discutée
Décrire une variable qualitative	un seul groupe	effectifs, pourcentages, IC95 si utile
Décrire une variable quantitative	un seul groupe	moyenne/ET ou médiane/IQR
Comparer deux proportions indépendantes	variable binaire, deux groupes	Chi2 ou Fisher
Comparer plus de deux proportions	variable qualitative, plusieurs groupes	Chi2, parfois test exact
Comparer deux moyennes indépendantes	variable quantitative, deux groupes	Welch/Student
Comparer deux distributions indépendantes	variable quantitative asymétrique ou ordinale	Mann-Whitney
Comparer plus de deux moyennes	variable quantitative, plusieurs groupes	ANOVA
Comparer plus de deux distributions	variable quantitative asymétrique ou ordinale	Kruskal-Wallis
Comparer avant/après une variable quantitative	mêmes sujets	test t apparié ou Wilcoxon signé-rang
Comparer avant/après une variable binaire	mêmes sujets	McNemar
Étudier deux variables quantitatives	relation linéaire ou monotone	corrélation de Pearson ou Spearman
Ajuster sur plusieurs facteurs avec critère binaire	événement oui/non	régression logistique
Ajuster sur plusieurs facteurs avec critère quantitatif	score, durée, mesure continue	régression linéaire si conditions compatibles
Étudier le temps jusqu’à événement	suivi dans le temps	Kaplan-Meier, log-rank, modèle de Cox
Étudier un test diagnostique	sensibilité, spécificité	Se/Sp, VPP/VPN, courbe ROC, AUC
Étudier l’accord entre deux mesures	deux observateurs ou méthodes	kappa, ICC, Bland-Altman selon le cas

Pour les comparaisons simples de groupes, l’article comparer deux groupes ou plus donne une grille plus détaillée.

Variables qualitatives : Chi2 ou Fisher ?

Si vous comparez une variable qualitative entre groupes, les tests souvent discutés sont le Chi2 et le test exact de Fisher.

Exemple :

Groupe	Complication	Pas de complication
A	12	88
B	25	75

Le choix dépend surtout des effectifs attendus et de la structure du tableau.

En pratique :

Chi2 si les effectifs attendus sont suffisants ;
Fisher si les effectifs sont faibles, surtout en tableau 2x2 ;
prudence si le tableau a beaucoup de modalités et peu de sujets.

Dans le manuscrit :

Les variables qualitatives ont été comparées par test du Chi2 ou test exact de Fisher selon les effectifs attendus.

Ne choisissez pas Fisher uniquement parce qu’une case observée contient moins de 5 sujets. Ce sont les effectifs attendus qui comptent, et la décision doit rester cohérente avec le plan d’analyse.

Variables quantitatives : Student, Welch ou Mann-Whitney ?

Pour comparer une variable quantitative entre deux groupes indépendants, on discute souvent :

test de Welch ou Student pour comparer des moyennes ;
test de Mann-Whitney si l’approche par rangs est plus adaptée.

Le test de Welch est souvent préférable au Student strict, car il ne suppose pas l’égalité des variances entre groupes.

Le test de Mann-Whitney est souvent présenté comme un test de comparaison de médianes. C’est une simplification. Il compare les rangs et peut refléter une différence plus globale de distribution.

Plus de deux groupes : test global puis comparaisons ciblées

Quand vous comparez trois groupes ou plus, un test global répond souvent à la première question :

Existe-t-il une différence entre au moins deux groupes ?

Exemples :

Chi2 pour une variable qualitative ;
ANOVA pour une variable quantitative si les conditions sont compatibles ;
Kruskal-Wallis pour une variable quantitative asymétrique ou ordinale.

Si le test global est significatif, il ne dit pas quels groupes diffèrent. Il faut ensuite discuter des comparaisons post-hoc, idéalement prévues à l’avance.

Attention aux comparaisons multiples : plus vous testez, plus vous augmentez le risque d’obtenir un résultat significatif par hasard. Dans une thèse, distinguez clairement :

comparaison principale ;
comparaisons secondaires ;
analyses exploratoires.

Données appariées : ne pas utiliser les tests indépendants

Pour des données appariées simples :

Situation	Test souvent discuté
Variable quantitative avant/après	test t apparié ou Wilcoxon signé-rang
Variable binaire avant/après	McNemar
Variable ordinale avant/après	Wilcoxon signé-rang ou approche spécifique
Cas-témoins appariés	méthode tenant compte des paires, parfois régression logistique conditionnelle
Mesures répétées multiples	modèle mixte, GEE ou méthode spécifique

Le point essentiel : l’identifiant d’appariement doit être présent dans votre base. Sans lui, l’analyse correcte peut devenir impossible.

Corrélation : attention à l’interprétation

La corrélation mesure une relation entre deux variables quantitatives ou ordinales.

Exemples :

âge et durée d’hospitalisation ;
score de douleur et dose d’antalgique ;
CRP et durée de fièvre.

Tests souvent discutés :

Pearson si la relation est approximativement linéaire et les conditions compatibles ;
Spearman si la relation est monotone, ordinale ou marquée par des valeurs extrêmes.

Une corrélation ne prouve pas une causalité. Elle ne suffit pas non plus si vous devez ajuster sur des facteurs de confusion.

Exemple :

L’âge est corrélé à la durée de séjour.

Cela ne signifie pas automatiquement que l’âge cause la durée de séjour. La gravité, les comorbidités ou l’autonomie peuvent expliquer une partie de l’association.

Régression : quand le test simple ne suffit plus

Un test simple compare souvent deux variables à la fois.

Un modèle de régression devient utile si vous voulez :

ajuster sur l’âge, le sexe ou la gravité ;
tenir compte de facteurs de confusion ;
estimer une association entre plusieurs variables et un critère ;
produire un OR, RR, HR ou coefficient ajusté ;
explorer des facteurs associés à un événement.

Repères pratiques :

Critère étudié	Modèle souvent discuté
événement oui/non	régression logistique
variable quantitative	régression linéaire si conditions compatibles
délai jusqu’à événement	modèle de Cox
variable ordinale	modèle ordinal
comptage	modèle de Poisson ou binomial négatif selon le cas

Si vous utilisez une régression, ne choisissez pas les variables uniquement sur les p-values. Les variables doivent être justifiées par la question, la littérature, la clinique et la structure des données.

Pour interpréter OR, RR, HR et IC95, consultez l’article comprendre p-value, IC95, OR, RR et HR.

Analyse de survie : quand le temps compte

Si votre critère est un délai jusqu’à événement, un test classique peut être insuffisant.

Exemples :

délai jusqu’au décès ;
délai jusqu’à récidive ;
délai jusqu’à réhospitalisation ;
temps avant complication ;
survie sans progression.

Les méthodes souvent discutées sont :

courbes de Kaplan-Meier pour décrire la survenue dans le temps ;
test du log-rank pour comparer des courbes ;
modèle de Cox pour estimer un hazard ratio ajusté.

Ces analyses tiennent compte du suivi incomplet, c’est-à-dire des patients qui n’ont pas encore présenté l’événement à la fin du suivi ou qui sont perdus de vue. Si votre thèse repose sur ce type de critère, demandez un avis statistique tôt.

Tests diagnostiques : ne pas se limiter à une p-value

Pour évaluer un test diagnostique, la question n’est pas seulement “le test est-il associé à la maladie ?”.

Les indicateurs utiles sont souvent :

sensibilité ;
spécificité ;
valeur prédictive positive ;
valeur prédictive négative ;
rapport de vraisemblance ;
courbe ROC ;
aire sous la courbe, ou AUC.

Exemple : si vous évaluez un score de dépistage, une p-value ne suffit pas. Il faut savoir combien de malades sont détectés, combien de non-malades sont correctement exclus, et quel seuil est utilisable en pratique.

Accord entre deux mesures : kappa, ICC ou Bland-Altman

Si votre thèse compare deux observateurs, deux appareils ou deux méthodes de mesure, il ne suffit pas toujours de tester s’il existe une différence moyenne.

Exemples :

deux radiologues classent une lésion ;
deux appareils mesurent une pression ;
un score est calculé par deux examinateurs ;
une mesure automatique est comparée à une mesure de référence.

Méthodes souvent discutées :

kappa pour l’accord sur des variables qualitatives ;
coefficient de corrélation intraclasse, ou ICC, pour certaines mesures quantitatives ;
méthode de Bland-Altman pour comparer deux mesures quantitatives et visualiser les écarts.

Ce type d’analyse nécessite souvent un cadrage spécifique avant le recueil.

Les erreurs fréquentes

Choisir le test après avoir regardé les résultats

Le test doit être prévu autant que possible avant l’analyse. Changer de test parce qu’un résultat devient significatif fragilise la thèse.

Confondre variable de groupe et variable analysée

Dans “comparer l’âge entre deux groupes”, le groupe est la variable explicative, l’âge est la variable comparée. C’est le type de l’âge qui guide le choix du test principal.

Utiliser un test indépendant pour des données appariées

Avant/après chez les mêmes patients, deux yeux d’un même patient, cas-témoins appariés : ces situations doivent être analysées avec des méthodes qui respectent l’appariement.

Transformer toutes les variables en oui/non

Dichotomiser une variable quantitative simplifie le tableau, mais fait perdre de l’information. Un seuil doit être justifié cliniquement ou prévu à l’avance.

Faire une p-value pour chaque ligne du tableau

Une table descriptive n’a pas besoin d’une p-value partout. Les tests doivent répondre à une question, pas décorer le tableau.

Oublier les effectifs disponibles

Un test peut exister en théorie mais être peu interprétable avec un effectif trop faible ou trop peu d’événements.

Quand demander de l’aide ?

Demandez un avis statistique si :

le critère principal est complexe ;
les données sont appariées ou répétées ;
il y a plusieurs groupes avec petits effectifs ;
vous prévoyez un modèle multivarié ;
vous étudiez un délai jusqu’à événement ;
vous évaluez un test diagnostique ;
vous construisez un score ;
les données manquantes sont nombreuses ;
l’analyse doit soutenir une publication.

Le bon moment est avant le recueil, au moment du protocole. L’article statistiques de thèse : les faire soi-même ou demander de l’aide détaille cette décision.

Si votre thèse coche plusieurs de ces situations, il peut être plus efficace de faire valider le plan d’analyse avant de lancer les tests. C’est particulièrement vrai si votre base est déjà constituée, si le critère principal est important pour la validité de la thèse, ou si les résultats doivent être intégrés proprement dans le manuscrit.

La prestation d’analyse statistique pour thèse de médecine permet de vérifier la base, choisir les tests adaptés, produire les tableaux de résultats et proposer une rédaction exploitable pour la partie Résultats.

Checklist avant de lancer les analyses

Avant de choisir définitivement vos tests, vérifiez :

la question principale est écrite ;
le critère principal est identifié ;
chaque variable a un type clair ;
les groupes sont définis ;
l’appariement éventuel est documenté ;
l’unité d’analyse est claire : patient, séjour, consultation, œil, prélèvement ;
les données manquantes sont codées ;
les effectifs par groupe sont connus ;
les analyses principales sont distinguées des analyses exploratoires ;
les tests choisis sont justifiables dans la partie Méthodes ;
les résultats pourront être présentés avec estimation et IC95 si possible.

Une fois les analyses réalisées, la question suivante est de comprendre ce que les résultats veulent dire. Commencez par l’article sur p-value, IC95, OR, RR et HR dans une thèse, puis utilisez le guide sur la présentation des résultats pour rédiger le manuscrit.

Questions fréquentes

Quel test statistique utiliser pour comparer deux groupes ?

Cela dépend de la variable comparée et du lien entre les groupes. Pour une variable qualitative indépendante, on discute Chi2 ou Fisher. Pour une variable quantitative indépendante, on discute Welch/Student ou Mann-Whitney. Si les données sont appariées, il faut utiliser un test apparié.

Faut-il toujours faire un test statistique dans une thèse ?

Non. Une thèse descriptive peut surtout présenter des effectifs, pourcentages, moyennes, médianes et intervalles de confiance. Un test est utile s’il répond à une question de comparaison ou d’association prévue.

Faut-il tester la normalité avant de choisir Student ou Mann-Whitney ?

La normalité ne doit pas être décidée uniquement par un test automatique. Il faut regarder la distribution, les effectifs, les valeurs extrêmes, le type de variable et l’objectif. Le test de Welch est souvent plus robuste qu’un Student strict lorsque les variances diffèrent.

Quel test utiliser pour des données appariées ?

Pour deux mesures quantitatives appariées, on discute test t apparié ou Wilcoxon signé-rang. Pour une variable binaire appariée, on discute McNemar. Les mesures répétées ou appariements complexes nécessitent souvent un avis statistique.

Quand faut-il demander de l’aide pour choisir un test statistique ?

Demandez de l’aide si l’analyse implique un modèle multivarié, des données appariées complexes, un suivi dans le temps, de petits effectifs, beaucoup de données manquantes ou un objectif de publication. Il vaut mieux demander tôt que découvrir après le recueil que la base ne permet pas l’analyse prévue.

Rédaction et responsabilité éditoriale

Dr Jeremy Pasco

Médecin de santé publique, statisticien, méthodologiste et développeur des outils de these-medecine.fr.

these-medecine.fr est un service développé par PRAXLR SAS, entreprise fondée par deux médecins pour accélérer les pratiques et la recherche dans le monde médical.

Qui sommes-nous