Statistiques

Comment calculer le nombre de sujets nécessaires pour une thèse ?

Une méthode pratique pour comprendre ce que signifie le nombre de sujets nécessaires, quand le calculer, quelles informations préparer et comment l'utiliser sans perdre de vue la faisabilité.

Le nombre de sujets nécessaires est l’une des questions les plus pratiques d’une thèse de médecine : combien de patients, dossiers, questionnaires ou observations faut-il recueillir pour que le résultat ait une chance raisonnable d’être interprétable ?

La réponse courte : il n’existe pas un chiffre magique. Le calcul dépend de votre question de recherche, du critère principal, de l’effet que vous voulez mettre en évidence, du risque d’erreur accepté et de la faisabilité du recueil.

L’objectif de cet article n’est pas de remplacer un biostatisticien. Il est de vous aider à comprendre les paramètres du calcul, à préparer les bonnes informations, et à éviter les projets où l’effectif nécessaire est manifestement incompatible avec une thèse.

Si votre sujet n’est pas encore stabilisé, commencez par clarifier votre question de recherche et votre protocole de thèse de médecine. Le nombre de sujets nécessaires se calcule après ces choix, pas avant.

À quoi sert le nombre de sujets nécessaires dans une thèse ?

Calculer le nombre de sujets nécessaires, c’est vérifier si votre étude peut répondre à sa question principale avec une précision suffisante.

En pratique, cela sert à trois choses.

Savoir si le projet est faisable avant de commencer le recueil.
Éviter une étude trop petite, qui risque de ne rien conclure même si l’idée est bonne.
Justifier la méthode dans le protocole, le manuscrit ou un futur article.

Le calcul est particulièrement utile si votre thèse compare deux groupes, cherche une association, évalue une différence avant/après, ou veut estimer une fréquence avec une précision donnée.

Par exemple :

comparer le taux de complication entre deux techniques ;
comparer une moyenne de durée d’hospitalisation entre deux groupes ;
estimer la proportion de patients correctement informés ;
évaluer la sensibilité d’un score ou d’un test ;
rechercher les facteurs associés à un événement.

À l’inverse, certaines thèses n’ont pas toujours besoin d’un calcul formel. Une série de cas rare, une étude purement descriptive ou une étude exploratoire peut surtout nécessiter une justification claire de l’effectif disponible et de ses limites.

La question à poser avant toute formule

Avant de parler de puissance, d’alpha ou de logiciel, il faut formuler la question principale.

Une mauvaise question donne un mauvais calcul, même avec le meilleur outil.

Demandez-vous :

quelle est la population étudiée ?
quel est le critère principal ?
est-ce que je veux estimer une fréquence, comparer deux groupes, comparer avant/après, ou étudier une association ?
quelle différence minimale serait cliniquement intéressante ?
combien de sujets puis-je raisonnablement inclure ?

Le nombre de sujets nécessaires ne se calcule pas pour “une thèse” en général. Il se calcule pour une hypothèse principale.

Les paramètres qui déterminent l’effectif

Le calcul du nombre de sujets nécessaires repose sur quelques paramètres. Ils peuvent sembler techniques, mais ils correspondent à des décisions concrètes.

Le risque alpha

Le risque alpha correspond au risque de conclure à une différence alors qu’il n’y en a pas réellement.

En recherche médicale, on utilise souvent un risque alpha de 5 %. C’est le seuil classique associé à la p-value inférieure à 0,05.

Cela ne veut pas dire que 5 % est obligatoire dans tous les cas. Cela veut dire que c’est une convention fréquente, à discuter si le contexte le justifie.

La puissance

La puissance est la probabilité de détecter une différence si cette différence existe réellement.

Une puissance de 80 % signifie que, si l’effet attendu existe, l’étude a 80 % de chances de le mettre en évidence dans les conditions prévues.

Plus la puissance demandée est élevée, plus le nombre de sujets nécessaires augmente. Une puissance de 90 % est plus exigeante qu’une puissance de 80 %, mais elle demande souvent beaucoup plus de patients.

L’effet attendu

L’effet attendu est la différence que vous pensez observer, ou la différence minimale qui aurait un intérêt clinique.

C’est souvent le paramètre le plus difficile.

Exemples :

une diminution du taux de complications de 20 % à 10 % ;
une différence moyenne de 2 jours de durée d’hospitalisation ;
une amélioration de 8 points sur un score ;
une augmentation du taux de réponse de 55 % à 70 %.

Plus l’effet attendu est petit, plus il faut de sujets pour le détecter. Une différence très modeste peut être importante, mais elle demande souvent une étude plus grande.

La variabilité du critère

Pour une variable quantitative, comme une durée, un score ou une valeur biologique, il faut aussi tenir compte de la dispersion des valeurs.

Une différence de 2 points n’a pas le même sens si les valeurs sont très homogènes ou très dispersées.

En pratique, le calcul demande souvent une estimation de l’écart-type, obtenue à partir :

d’une étude publiée proche de votre sujet ;
d’une base locale déjà existante ;
d’une phase pilote ;
d’un avis méthodologique.

Le type de comparaison

Le calcul n’est pas le même selon le schéma de l’étude.

Situation	Ce qu’il faut préparer
Comparaison de deux proportions	proportion attendue dans chaque groupe
Comparaison de deux moyennes	différence attendue et écart-type
Étude avant/après	différence attendue et variabilité des différences
Étude appariée	structure des paires et différence attendue
Estimation d’une fréquence	fréquence attendue et précision souhaitée
Modèle multivarié	nombre d’événements attendus et nombre de variables envisagées

Si votre projet compare plusieurs groupes, commencez par lire le guide sur la comparaison de deux groupes ou plus. Si les mêmes patients sont mesurés deux fois, ou si les sujets sont regroupés par paires, l’article sur les données appariées vous aidera à cadrer le problème.

Exemple simple : comparer deux proportions

Imaginons une thèse qui compare deux stratégies de prise en charge.

Le critère principal est la proportion de patients avec une complication à 30 jours.

Vous pensez que :

le taux de complication est d’environ 20 % dans le groupe habituel ;
il pourrait être de 10 % dans le nouveau groupe ;
vous acceptez un risque alpha de 5 % ;
vous souhaitez une puissance de 80 %.

Le calcul d’effectif va estimer combien de patients sont nécessaires dans chaque groupe pour détecter une différence entre 20 % et 10 %.

Mais la vraie question méthodologique est souvent avant le calcul :

cette différence de 10 points est-elle réaliste ?
est-elle cliniquement importante ?
existe-t-il assez de patients dans le service ?
les groupes seront-ils comparables ?
le recueil permettra-t-il vraiment de connaître le critère à 30 jours ?

Si le calcul donne 200 patients par groupe et que votre service voit 40 patients par an, le problème n’est pas le logiciel. Le sujet doit être adapté.

Exemple simple : estimer une fréquence

Toutes les thèses ne cherchent pas à comparer deux groupes.

Vous pouvez vouloir estimer la proportion de patients ayant reçu une information conforme, ou la fréquence d’un événement dans une population.

Dans ce cas, le raisonnement change. Il ne s’agit plus de détecter une différence, mais d’obtenir une estimation assez précise.

Vous devez alors préciser :

la proportion attendue ;
la largeur acceptable de l’intervalle de confiance ;
la population réellement accessible.

Par exemple, estimer une fréquence autour de 50 % avec une précision de plus ou moins 5 points demande beaucoup plus de sujets qu’une estimation grossière à plus ou moins 10 points.

Dans une thèse descriptive, cet élément est souvent plus utile qu’un test statistique artificiel.

Le nombre calculé n’est pas toujours le nombre à recueillir

Le chiffre obtenu par un calculateur n’est pas forcément le nombre final à inclure.

Il faut souvent l’ajuster pour tenir compte :

des données manquantes ;
des exclusions secondaires ;
des patients perdus de vue ;
des questionnaires incomplets ;
des dossiers inexploitables ;
d’un déséquilibre entre les groupes.

Si vous pensez perdre 10 % des observations, il faut prévoir une marge.

Par exemple, si le calcul indique 180 sujets analysables et que vous anticipez 10 % de dossiers incomplets, il faudra plutôt viser environ 200 sujets à inclure ou à sélectionner.

Le sujet des données incomplètes est détaillé dans l’article sur les valeurs manquantes dans un tableur.

Comment préparer un calcul d’effectif avant de demander de l’aide

Si vous contactez un statisticien avec seulement “combien de patients me faut-il ?”, il manquera presque tout.

Préparez plutôt ces informations.

La fiche pratique à remplir

Question	Votre réponse
Quel est l’objectif principal ?
Quelle est la population étudiée ?
Quel est le critère principal ?
Le critère est-il binaire, quantitatif, ordinal, délai, score ?
Comparez-vous des groupes ? Si oui, lesquels ?
Quelle différence minimale serait intéressante ?
Quelle valeur attendue dans le groupe de référence ?
Quelle variabilité attendue si le critère est quantitatif ?
Combien de sujets sont accessibles en pratique ?
Combien de données manquantes sont plausibles ?

Cette fiche suffit souvent à transformer une discussion confuse en choix méthodologique clair.

Les sources utiles pour estimer les hypothèses

Pour choisir une proportion, une moyenne, un écart-type ou une différence attendue, vous pouvez vous appuyer sur :

des articles proches du sujet ;
des données locales anonymisées ou agrégées ;
un registre ou une base existante ;
une phase pilote ;
l’expérience du service, si elle est explicitement présentée comme une estimation.

Évitez de choisir l’effet attendu uniquement pour obtenir un effectif faisable. C’est tentant, mais dangereux. Un effet irréaliste donne un calcul rassurant et une étude fragile.

Que faire si le nombre de sujets nécessaires est trop élevé ?

C’est fréquent en thèse de médecine.

Le calcul peut montrer qu’il faudrait 600 patients, alors que vous pouvez raisonnablement recueillir 120 dossiers.

Dans ce cas, plusieurs options existent.

Élargir le recueil

Vous pouvez augmenter la période d’inclusion, ajouter un centre, ou utiliser une base déjà constituée.

Mais cette option augmente aussi la complexité : autorisations, harmonisation des données, qualité du recueil, coordination, délais.

Revoir le critère principal

Un critère trop rare demande souvent un effectif très important.

Parfois, un critère composite, un score continu ou un critère plus fréquent peut être plus réaliste. Ce choix doit rester cliniquement pertinent, pas seulement statistiquement pratique.

Transformer l’objectif

Si l’étude comparative n’est pas faisable, une étude descriptive bien menée peut être plus honnête.

Par exemple, au lieu de chercher à démontrer une différence impossible à mettre en évidence, vous pouvez décrire les pratiques, estimer une fréquence, construire une base locale, ou générer une hypothèse pour un futur travail.

Demander un avis tôt

Quand le calcul d’effectif bloque le projet, demandez conseil avant de lancer le recueil.

L’article faut-il faire ses statistiques soi-même ou faire appel à un expert ? détaille les situations où un avis statistique précoce évite de perdre plusieurs mois.

Les erreurs fréquentes

Calculer l’effectif après avoir fini le recueil

Le calcul du nombre de sujets nécessaires sert d’abord à planifier.

Le faire après coup pour justifier un effectif déjà fixé est rarement convaincant. Dans ce cas, il vaut mieux expliquer l’effectif disponible, présenter les intervalles de confiance, et reconnaître les limites.

Utiliser un effet attendu trop optimiste

Plus l’effet attendu est grand, plus l’effectif calculé diminue.

Mais si l’effet choisi est irréaliste, l’étude risque d’être sous-dimensionnée pour l’effet réel.

Multiplier les objectifs principaux

Un calcul d’effectif se fait sur un objectif principal.

Si vous avez cinq objectifs principaux, vous risquez de ne pas savoir quelle hypothèse structure vraiment votre thèse.

Ignorer la faisabilité

Un calcul peut être statistiquement correct et pratiquement inutilisable.

La faisabilité doit être discutée dès le protocole : nombre de patients disponibles, délai de recueil, qualité des dossiers, outils de recueil, temps nécessaire.

Oublier les données manquantes

Dans une étude rétrospective, tous les dossiers ne seront pas exploitables.

Dans un questionnaire, tous les répondants ne répondront pas à toutes les questions.

Un effectif calculé sans marge peut donc devenir insuffisant une fois les exclusions appliquées.

Où placer le calcul dans le protocole ?

Dans le protocole, le nombre de sujets nécessaires se place généralement dans la méthode, après :

l’objectif principal ;
le critère principal ;
la population ;
le type d’étude ;
le plan d’analyse.

La formulation peut ressembler à ceci :

Le nombre de sujets nécessaires a été estimé pour détecter une différence de X entre les groupes, avec un risque alpha de 5 % et une puissance de 80 %. En tenant compte d’une proportion attendue de données manquantes de Y %, l’effectif cible est de Z sujets.

Cette phrase doit être adaptée à votre situation. L’important est de rendre les hypothèses visibles, pas seulement d’indiquer un chiffre.

En pratique : le bon raisonnement

Pour une thèse, le bon raisonnement tient en quatre étapes.

Définir la question principale et le critère principal.
Choisir le type de calcul adapté : estimation, comparaison, avant/après, association.
Estimer les hypothèses : alpha, puissance, effet attendu, variabilité, données manquantes.
Vérifier la faisabilité et ajuster le projet si nécessaire.

Si vous êtes dans une phase de cadrage, vous pouvez avancer avec le guide complet de la thèse de médecine ou les ressources de la catégorie Statistiques.

Une fois le projet clarifié, les outils statistiques deviennent utiles. Pour les analyses courantes, vous pouvez aussi consulter l’article sur TablR, l’app de statistiques de These-Medecine.fr. Pour les décisions méthodologiques plus délicates, un avis humain reste souvent préférable.

Questions fréquentes

Faut-il toujours calculer un nombre de sujets nécessaires pour une thèse ?

Non. Le calcul est surtout utile quand la thèse teste une hypothèse principale ou compare des groupes. Pour une étude descriptive, une étude exploratoire ou une série de cas, il faut plutôt justifier l’effectif attendu et ses limites.

Quel niveau de puissance faut-il choisir pour une thèse ?

Le choix classique est souvent 80 %, parfois 90 % pour un projet plus exigeant. Une puissance plus élevée demande plus de sujets. Le choix doit rester cohérent avec la question, l’effet attendu et la faisabilité.

Peut-on calculer le nombre de sujets nécessaires après avoir recueilli les données ?

Ce n’est pas l’usage principal. Le calcul sert surtout à planifier l’étude avant le recueil. Après coup, il vaut mieux présenter l’effectif disponible, les intervalles de confiance et les limites de puissance de l’étude.

Que faire si le nombre de sujets nécessaires est impossible à atteindre ?

Il faut revoir le projet : élargir la période ou les centres, choisir un critère plus fréquent, simplifier l’objectif, transformer l’étude en étude descriptive ou demander un avis méthodologique.

Un calculateur en ligne suffit-il pour déterminer l’effectif d’une thèse ?

Un calculateur peut aider à explorer des scénarios, mais il ne remplace pas le raisonnement méthodologique. Il faut d’abord définir la question, le critère principal, la comparaison, l’effet attendu et les hypothèses statistiques.