Étude par questionnaire pour une thèse de médecine : méthode, diffusion, CNIL et analyse
Une méthode concrète pour construire, tester, diffuser et analyser un questionnaire de thèse de médecine sans découvrir trop tard un problème méthodologique ou réglementaire.
Une étude par questionnaire paraît souvent simple : créer un formulaire, l’envoyer largement, récupérer des réponses, puis faire quelques graphiques. En pratique, beaucoup de thèses se compliquent à ce stade : questions impossibles à analyser, population cible floue, doublons, faible taux de réponse, outil inadapté, ou recueil de données de santé sans cadre clair.
Le bon réflexe est de traiter le questionnaire comme un vrai outil de recherche, pas comme un simple sondage. Il doit répondre à une question précise, produire des variables exploitables, respecter les personnes interrogées et préparer l’analyse statistique dès le départ.
Cet article s’inscrit dans la section recueil de données du guide complet de la thèse de médecine. Il couvre deux situations fréquentes : les questionnaires adressés à des patients et les questionnaires adressés à des professionnels de santé, internes, médecins ou soignants.
Avant de créer le formulaire : définir ce que le questionnaire doit prouver
Un questionnaire de thèse ne sert pas seulement à “recueillir des avis”. Il doit produire des données qui permettent de répondre à un objectif.
Avant d’écrire la première question, formulez :
- la population cible ;
- l’objectif principal ;
- le critère principal ou la variable centrale ;
- les objectifs secondaires ;
- les comparaisons prévues ;
- les variables nécessaires pour décrire les répondants ;
- les variables nécessaires pour interpréter les réponses.
Exemple : “évaluer les pratiques des médecins généralistes concernant le dépistage de la fibrillation atriale” est encore trop large. Il faut préciser si vous cherchez surtout :
- une fréquence déclarée de dépistage ;
- les outils utilisés ;
- les obstacles rencontrés ;
- les facteurs associés à une pratique ;
- une comparaison selon le mode d’exercice, l’ancienneté ou la formation.
Ces choix doivent apparaître dans le protocole de thèse de médecine. Sinon, le questionnaire risque de devenir une accumulation de questions intéressantes mais difficiles à exploiter.
Deux familles de questionnaires à distinguer
La méthode change selon la population interrogée et la nature des données recueillies.
| Situation | Exemple | Risque principal |
|---|---|---|
| Questionnaire auprès de professionnels | Pratiques de prescription chez des médecins, avis d’internes, organisation d’un service | Biais de sélection, faible taux de réponse, réponses déclaratives |
| Questionnaire auprès de patients sans donnée de santé identifiable | Satisfaction globale anonyme, expérience non médicale très générale | Anonymat réel, information, périmètre des questions |
| Questionnaire auprès de patients avec données de santé | Symptômes, diagnostic, traitement, qualité de vie, antécédents | Données de santé, outil de recueil, hébergement, information, qualification réglementaire |
| Questionnaire mixte | Réponses patient + données extraites du dossier | Chaînage des sources, pseudonymisation, accès aux données |
Le questionnaire auprès de professionnels de santé n’est pas automatiquement “sans risque”. Il peut contenir des données personnelles : âge, sexe, spécialité, lieu d’exercice, ancienneté, opinions, coordonnées pour relance. Il faut donc rester sobre et informer les participants.
Le questionnaire auprès de patients demande une vigilance plus forte dès qu’il porte sur leur santé. Une réponse sur un symptôme, un traitement, un diagnostic, une qualité de vie, un handicap ou un parcours de soins peut constituer une donnée de santé.
Le cas particulier des données de santé patient
La CNIL rappelle que les données de santé sont des données personnelles sensibles et particulièrement protégées. Pour une thèse de médecine, le problème n’est donc pas seulement le choix entre Google Forms, LimeSurvey ou REDCap. Le vrai sujet est : quelles données sont recueillies, par qui, où sont-elles hébergées, qui y accède, et comment les personnes sont informées ?
La page CNIL dédiée aux formalités pour une thèse de médecine indique notamment que les personnes concernées doivent être informées du traitement de leurs données, et que les formalités doivent être accomplies par l’université ou l’établissement de rattachement, pas par le doctorant en son nom propre.
En pratique, si votre questionnaire patient recueille des données de santé identifiantes ou pseudonymisées, ne créez pas un Google Forms personnel pour commencer “en attendant”. Discutez d’abord l’outil et le circuit de validation avec votre directeur, votre DPO, votre structure de recherche, votre université ou l’établissement responsable du traitement.
L’Agence du Numérique en Santé rappelle que l’hébergement de données de santé personnelles doit être réalisé dans des conditions de sécurité adaptées, et que les hébergeurs concernés doivent être agréés ou certifiés. Un outil grand public choisi individuellement n’est donc pas un choix neutre pour un recueil patient sensible.
Peut-on utiliser Google Forms pour un questionnaire de thèse ?
Google Forms peut être utile pour un questionnaire simple, anonyme, non sensible, adressé par exemple à des professionnels de santé sur des pratiques générales, à condition que le cadre local l’autorise.
Il n’est pas adapté par défaut à un questionnaire patient recueillant des données de santé identifiantes ou pseudonymisées. Le problème n’est pas que l’interface soit mauvaise. Le problème est l’hébergement, la gestion des accès, la localisation et les conditions de traitement des données, la traçabilité, les droits des personnes et la conformité au cadre retenu.
Même Google, dans sa documentation sur les données de santé protégées au sens HIPAA pour Google Workspace, indique que les clients doivent déterminer s’ils traitent ce type de données et que ceux qui n’ont pas signé l’accord requis ne doivent pas utiliser ces données dans les services Google Workspace. Ce texte ne règle pas le droit français, mais il illustre un point important : les données de santé ne doivent pas être déposées dans un service généraliste sans cadre contractuel et institutionnel clair.
Pour choisir un outil, partez de cette grille :
| Type de questionnaire | Outil envisageable | À vérifier |
|---|---|---|
| Professionnels, anonyme, non sensible | Google Forms, LimeSurvey, outil institutionnel | Information, absence de données sensibles, droits d’accès |
| Professionnels avec données personnelles détaillées | Outil validé localement | Minimisation, durée de conservation, export sécurisé |
| Patients sans donnée de santé et sans identification | Outil validé selon le projet | Anonymat réel, information, absence de données indirectement identifiantes |
| Patients avec données de santé | Outil institutionnel, e-CRF ou solution validée | DPO, responsable de traitement, hébergement, information, cadre CNIL/CPP si applicable |
L’article sur le choix de l’outil de recueil de données détaille les options : tableur, e-CRF, questionnaire en ligne, extraction ou papier.
Construire les questions pour obtenir des variables analysables
Une bonne question est compréhensible pour le répondant et exploitable pour l’analyse.
Évitez les questions qui mélangent plusieurs idées :
- “Connaissez-vous et utilisez-vous les recommandations ?”
- “Êtes-vous satisfait de l’information et du suivi ?”
- “Avez-vous changé vos pratiques par manque de temps ou de formation ?”
Dans chaque cas, le répondant peut vouloir répondre “oui” à une partie et “non” à l’autre. Séparez les concepts.
Préférez les formulations :
- “Connaissez-vous les recommandations X ?”
- “Les utilisez-vous dans votre pratique ?”
- “À quelle fréquence les utilisez-vous ?”
- “Quel est le principal obstacle à leur utilisation ?”
Chaque question doit avoir un rôle :
- décrire la population ;
- mesurer le critère principal ;
- explorer un objectif secondaire ;
- expliquer une réponse ;
- filtrer les répondants ;
- préparer une comparaison.
Si vous ne savez pas comment une réponse sera utilisée dans la thèse, la question est probablement inutile.
Choisir le bon format de réponse
Le format de réponse conditionne directement l’analyse.
| Format | Utile pour | Point de vigilance |
|---|---|---|
| Oui/non | Variable binaire simple | Trop pauvre si la situation est nuancée |
| Choix unique | Catégorie principale | Prévoir “autre” seulement si vous saurez l’analyser |
| Choix multiple | Pratiques, obstacles, sources d’information | Chaque modalité devient une variable oui/non |
| Échelle de Likert | Accord, fréquence, confiance, satisfaction | Définir clairement les extrêmes |
| Nombre | Âge, années d’exercice, volume d’activité | Préciser l’unité |
| Texte libre | Nuances, suggestions, exploration | Analyse plus longue, codage nécessaire |
Les échelles de Likert sont fréquentes dans les questionnaires de thèse. Elles peuvent être utiles, mais elles doivent être cohérentes. Évitez de changer l’ordre des réponses d’une question à l’autre. Si 1 signifie “pas du tout d’accord”, gardez cette logique jusqu’au bout.
Pour une première thèse quantitative, limitez les questions ouvertes. Elles peuvent enrichir la discussion, mais elles ne remplacent pas une variable construite proprement.
Prévoir les questions de description sans identifier inutilement les répondants
Les variables de description sont nécessaires : âge, sexe, spécialité, année d’internat, mode d’exercice, type de structure, région, ancienneté. Elles permettent de décrire l’échantillon et parfois d’explorer des facteurs associés.
Mais chaque variable augmente le risque d’identification, surtout dans une petite population.
Exemples :
- “âge exact + spécialité rare + ville + fonction précise” peut rendre un répondant reconnaissable ;
- “interne de phase 3 dans un petit DES d’une région donnée” peut suffire à identifier une personne ;
- “patient de 87 ans avec pathologie rare dans un centre unique” peut être indirectement identifiable.
La règle pratique : recueillez le niveau de détail nécessaire, pas le niveau de détail maximal.
Vous pouvez regrouper certaines réponses :
- âge en classes plutôt qu’âge exact ;
- région plutôt que ville ;
- ancienneté en catégories ;
- type de structure plutôt que nom de l’établissement ;
- spécialité regroupée si les effectifs sont faibles.
Tester le questionnaire avant diffusion
Un questionnaire non testé produit presque toujours des surprises.
Avant diffusion large, faites un test sur quelques personnes proches de la population cible :
- un ou deux internes ;
- un médecin de la spécialité concernée ;
- un patient partenaire ou une personne non médicale si le questionnaire est destiné aux patients ;
- votre directeur ou un méthodologiste ;
- la personne qui vous aidera à analyser les données, si elle est identifiée.
Le test doit répondre à des questions concrètes :
- Les consignes sont-elles comprises ?
- Certaines questions sont-elles ambiguës ?
- Le questionnaire est-il trop long ?
- Les choix de réponse couvrent-ils les situations réelles ?
- Les filtres fonctionnent-ils ?
- L’export produit-il un fichier exploitable ?
- Les variables ont-elles des noms clairs ?
- Les valeurs manquantes sont-elles gérées ?
Chronométrez le remplissage. Un questionnaire annoncé en “5 minutes” mais rempli en 18 minutes perdra des répondants et créera des abandons.
Diffuser le questionnaire sans perdre la méthode
La diffusion doit être décrite dès le protocole, puis rapportée dans le manuscrit.
Précisez :
- qui est éligible ;
- qui ne l’est pas ;
- par quels canaux le questionnaire sera diffusé ;
- pendant combien de temps ;
- combien de relances sont prévues ;
- comment les doublons seront évités ou repérés ;
- si le questionnaire est ouvert à tous ou diffusé à une liste définie ;
- comment vous estimerez le nombre de personnes sollicitées.
Un lien diffusé sur les réseaux sociaux ne produit pas le même niveau de preuve qu’un questionnaire envoyé à une liste exhaustive de médecins d’un territoire. Cela ne veut pas dire qu’il est interdit, mais il faut l’assumer dans la méthode et la discussion.
Les recommandations de reporting peuvent aider. La checklist STROBE est utile pour les études observationnelles transversales. Pour les questionnaires en ligne, la checklist CHERRIES insiste notamment sur le type d’enquête, le mode de contact, les questionnaires incomplets, les doublons et les indicateurs de participation.
Préparer l’analyse dès la construction du questionnaire
Le fichier exporté doit pouvoir être analysé comme un tableur de recherche : une ligne par répondant, une colonne par variable, des réponses codées de manière stable.
Avant diffusion, exportez une version test et vérifiez :
- le nom des colonnes ;
- le codage des réponses ;
- les questions à choix multiple ;
- les dates ;
- les questions conditionnelles ;
- les réponses manquantes ;
- les doublons ;
- les accents et caractères spéciaux ;
- les textes libres ;
- le format d’export.
Les choix multiples sont souvent piégeux. Selon l’outil, une question “cochez toutes les réponses applicables” peut être exportée dans une seule cellule avec plusieurs réponses séparées par des virgules. Pour l’analyse, il faudra souvent transformer chaque modalité en variable oui/non.
Exemple :
| id | obstacles |
|---|---|
| 001 | manque de temps, manque de formation |
devient plus exploitable sous la forme :
| id | obstacle_temps | obstacle_formation |
|---|---|---|
| 001 | oui | oui |
Pour les bases issues d’un questionnaire, les mêmes règles que pour un tableur s’appliquent : noms de variables courts, unités explicites, codage stable et documentation. L’article sur la préparation du tableur de recueil détaille ces principes.
Gérer les réponses manquantes et les abandons
Toutes les questions ne doivent pas forcément être obligatoires. Un questionnaire trop contraignant peut forcer des réponses fausses ou augmenter les abandons.
À l’inverse, si une variable est indispensable pour l’objectif principal, elle doit être rendue obligatoire ou faire l’objet d’une stratégie claire.
Distinguez :
- question non affichée à cause d’un filtre ;
- question affichée mais non répondue ;
- répondant non concerné ;
- abandon du questionnaire ;
- réponse incohérente.
Ces situations n’ont pas la même signification. Elles doivent être anticipées dans le questionnaire et dans le fichier d’analyse.
Pour harmoniser les conventions, vous pouvez vous appuyer sur l’article dédié aux valeurs manquantes dans un tableur de thèse.
Erreurs fréquentes dans une étude par questionnaire
Diffuser avant d’avoir validé le protocole
Une fois le lien envoyé, il devient difficile de corriger une question mal posée. Validez le questionnaire, l’outil et la stratégie d’analyse avant la diffusion.
Poser trop de questions “au cas où”
Chaque question doit avoir une fonction. Un questionnaire trop long diminue le taux de complétion et augmente les réponses rapides ou imprécises.
Mélanger enquête de satisfaction et étude scientifique
Une enquête de satisfaction peut être utile localement, mais une thèse doit expliquer sa population, sa méthode, ses biais et ses limites. Le questionnaire doit être construit pour répondre à une question de recherche.
Utiliser un outil grand public pour des données patient sensibles
Un formulaire grand public peut sembler pratique, mais il n’est pas adapté par défaut à un recueil de données de santé patient. Ce point doit être validé avant toute diffusion.
Ne pas prévoir les doublons
Si un lien est public, une même personne peut répondre plusieurs fois. Si le questionnaire est anonyme, il peut être difficile de l’empêcher sans recueillir des informations supplémentaires. Il faut donc choisir et décrire une stratégie réaliste.
Oublier le dénominateur
Pour interpréter un taux de réponse, il faut savoir combien de personnes ont été sollicitées. Si vous diffusez seulement via réseaux sociaux, ce dénominateur est souvent inconnu. La portée des résultats doit alors être discutée autrement.
Checklist avant diffusion
Avant d’envoyer le lien, vérifiez que vous pouvez répondre “oui” à ces points :
- l’objectif principal est écrit ;
- la population cible est définie ;
- les critères d’inclusion et d’exclusion sont clairs ;
- chaque question a une utilité ;
- les données patient sensibles ont été discutées avec les interlocuteurs compétents ;
- l’outil de recueil est validé pour le type de données recueillies ;
- le texte d’information est prêt ;
- la durée de remplissage a été testée ;
- l’export a été testé ;
- les variables principales sont analysables ;
- les questions à choix multiple sont gérables ;
- les valeurs manquantes sont anticipées ;
- la stratégie de diffusion et les relances sont documentées ;
- le canal de diffusion permet d’interpréter les biais de sélection ;
- les limites prévisibles sont déjà identifiées.
Si votre questionnaire est déjà diffusé et que vous vous interrogez sur l’analyse, rassemblez le protocole, le formulaire, le fichier exporté et la description de la diffusion. La prestation d’analyse statistique pour thèse de médecine peut aider à transformer une base de réponses en tableaux et résultats exploitables.
Questions fréquentes
Peut-on utiliser Google Forms pour une thèse de médecine ?
Oui pour certains questionnaires anonymes et non sensibles, après validation locale si besoin. En revanche, ce n’est pas l’outil à utiliser pour recueillir des données de santé identifiantes ou pseudonymisées auprès de patients. Dans ce cas, utilisez un outil institutionnel ou validé par les interlocuteurs compétents.
Combien de réponses faut-il pour une étude par questionnaire ?
Il n’existe pas de nombre universel. L’effectif dépend de l’objectif, de la population cible, de la précision attendue, des comparaisons prévues et du taux de réponses plausible. Pour une simple description, la question est souvent celle de la précision. Pour comparer des groupes, il faut anticiper les effectifs dans chaque groupe.
Quelle démarche prévoir pour un questionnaire de thèse : registre, CPP ou CNIL ?
Le plus souvent, il ne s’agit pas de demander une autorisation CNIL. Si le questionnaire ne recueille pas de donnée sensible, la démarche relève plutôt de l’inscription au registre des traitements par l’université ou l’établissement responsable.
Si le questionnaire recueille des données de santé ou relève d’une recherche impliquant la personne humaine, il faut faire qualifier le projet localement : un passage en CPP peut être nécessaire, avec un cadre de type MR-003 si ses conditions sont remplies. Dans tous les cas, ce n’est pas l’étudiant qui fait la démarche en son nom propre : elle relève du responsable du traitement.
Comment diffuser un questionnaire de thèse ?
La diffusion doit suivre la population cible définie dans le protocole : liste institutionnelle, service, société savante, réseau professionnel, consultations ou autre canal adapté. Gardez une trace du canal, des dates, du nombre de personnes sollicitées quand il est connu, et des relances.
Peut-on analyser des questions ouvertes dans une thèse de médecine ?
Oui, mais elles demandent une méthode de codage ou d’analyse qualitative. Pour une première thèse quantitative, il vaut mieux limiter les questions ouvertes aux informations réellement utiles, puis expliquer comment elles ont été regroupées ou analysées.