Recueillir ses données de thèse implique de centraliser les informations nécessaires à votre étude dans un outil adapté. Avant de vous jeter sur votre tableur préféré, prenez le temps de vérifier s’il n’existe pas une approche plus adaptée à votre situation.
Comment seront recueillies vos données ?
Le premier critère de choix pour votre outil de recueil sera de définir le mode de saisie. Selon le contexte, vos données pourront être issues :
- d’une saisie manuelle par un ou plusieurs investigateurs
- de réponses à un questionnaire diffusé
- d’une extraction depuis un logiciel
Cas de la saisie par investigateur(s)
Tableurs (Microsoft Excel, LibreOffice Calc)
La plupart des thésards effectuent leur recueil avec Excel ou un autre tableur. Cela semble souvent être la méthode la plus logique. Pourtant… la plupart des études cliniques évitent à tout prix le recueil sur tableur et s’orientent vers des solutions de type e-CRF.
Quel est le problème avec un tableur ? Tout d’abord, un tableur, c’est un peu comme un tableau blanc. Vous pouvez inscrire ce que vous voulez dans les cellules. Et c’est précisément ce qu’on ne veut pas. Car au moment de l’analyse statistique, on souhaite que les données renseignées respectent un certain nombre de règles. Par exemple : toutes les dates doivent être au même format, les valeurs chiffrées doivent toujours être dans la même unité, une tension artérielle ne peut pas être négative, etc. Avec un tableur, vous êtes libres de dévier de ces règles, consciemment ou par simple erreur de saisie. Si l’on découvre ces erreurs au moment de l’analyse statistique, il faudra retourner à la source pour recueillir à nouveau la donnée corrigée. On cherche donc à insérer des règles de saisie pour limiter les erreurs. Plus le recueil est important et plus l’économie est importante. Avec un tableur, vous pouvez mettre en place des règles de ce type. Mais cela devient rapidement laborieux et implique parfois d’apprendre à manipuler des choses complexes comme des macros Excel.
Travailler avec un tableur, c’est aussi avoir tous les sujets sous les yeux en même temps. C’est très pratique lorsqu’on veut une vue globale comme lors des analyses statistiques. Mais pour un recueil, c’est prendre le risque d’écrire dans la mauvaise ligne/colonne ou de se faire influencer par les valeurs saisies pour les autres sujets.
Effectuer un recueil à plusieurs investigateurs pose également quelques problèmes lorsqu’on emploie un tableur. Car celui-ci ne peut pas être modifié par plusieurs personnes à la fois, même s’il est hébergé sur un répertoire partagé entre plusieurs postes de votre établissement. Si vous essayez, vous verrez un message indiquant qu’un autre utilisateur a déjà ouvert le fichier, et donc que celui-ci ne peut pas être modifié.
Si malgré tout, vous optez pour un tableur : n’oubliez pas de vérifier ces points clé AVANT de débuter votre recueil.
Tableurs en ligne (Google Sheet)
Une alternative intéressante au problème de saisie simultanée peut être d’utiliser des services en ligne comme Google Sheet. Celui-ci qui autorise la saisie simultanée à plusieurs. Mais sachez que vous ne pouvez pas stocker sur Google Sheet des données de santé pour des raisons réglementaires. Cette solution est à réserver aux projets n’impliquant aucune donnée sensible.
e-CRF (ex : RedCap)
De l’autre côté, les e-CRF sont des solutions en ligne qui vous permettent de recueillir vos données au travers de formulaires. Ces formulaires s’assurent du respect de règles de saisie préalablement configurées. Le formulaire affiché ne concerne que le sujet sélectionné. Par ailleurs, plusieurs investigateurs peuvent effectuer des saisies en même temps. Les e-CRF proposent de nombreux autres avantages, tels que l’affichage conditionnel de certains champs (ex : si vous avez coché « non » à la question « réalisation d’un scanner’, les variables en lien avec le résultat du scanner peuvent ne pas vous être demandées)
Contrairement au tableur qui se veut très générique, l’e-CRF est une solution pensée spécifiquement pour le recueil de données d’étude.
De nombreux établissements sont dotés de solution d’e-CRF comme RedCap. Il peut être intéressant de se rapprocher des équipes de recherche ou de votre Direction de la Recherche et voir s’il vous est possible de bénéficier de cet outil.
Lien vers RedCap. NB : RedCap ne propose pas de service en ligne. Seuls les établissements académiques peuvent bénéficier de la solution après en avoir fait la demande auprès de l’éditeur.
Cas du questionnaire
La diffusion d’un questionnaire et le recueil des réponses est grandement facilité par les outils informatiques. Quatre critères majeurs sont à prendre en compte :
- l’outil prend-il en charge le mode de diffusion souhaité ? (email +/- rappel ou simple lien)
- l’outil permet-il de recueillir des données sensibles comme des données de santé (réglementation RGPD) ?
- le coût de la solution
Voici quelques solutions qui vous faciliteront la vie :
Google Form
Facile et gratuit, Google Form vous permet de créer rapidement un questionnaire et de le diffuser.
L’outil présente cependant des limitations importantes :
- il n’est pas autorisé de l’utiliser pour recueillir des données sensibles comme des données de santé
- la diffusion du questionnaire s’effectue par un lien unique : vous ne saurez pas qui a répondu ou non et rien n’interdit un même sujet de répondre plusieurs fois
Lien vers Google Form.
Limesurvey
Limesurvey est une solution avancée pour générer et diffuser des questionnaires. Elle offre la possibilité de masquer/afficher certaines questions selon des règles complexes.
Limesurvey propose des modes de diffusion intéressants. En plus de la solution du lien unique à l’instar de Google Form, vous pouvez générer un lien propre à chaque sujet : ainsi chaque sujet ne peut répondre qu’une seule fois et vous savez qui n’a pas répondu et donc qui relancer.
La diffusion peut se faire par mail depuis la solution. Auquel cas les liens uniques sont envoyés à la liste des sujets. Vous pouvez également programmer des rappels qui ne seront envoyés qu’aux non répondant.
Il existe aussi un mode anonyme très pratique : vous conservez l’information de qui a répondu ou non, mais il n’est pas fait de lien entre le sujet et sa réponse. Pour les questionnaires relevant des informations sensibles, cette garantie d’anonymat peut être très intéressante.
Limesurvey propose aussi des figures et statistiques descriptives automatiques sur la base des réponses obtenues.
De nombreux établissements ont installé cette solution en interne. Il vous est donc possible de recueillir des données sensibles telles que des données de santé par ce biais. Il convient donc de se rapprocher de vos équipes de recherche ou Direction de la Recherche pour en bénéficier.
Sachez qu’il existe aussi une version payante en ligne de la solution à cette adresse. Mais cette version ne vous autorise pas à recueillir des données sensibles.
Questionnaire papier
Si vous optez pour la distribution de questionnaires papier, prenez quelques mesures pour vous simplifier la vie.
La retranscription des données papier pourra se faire directement via un tableur ou via un e-CRF (voir plus haut). Dans les deux cas, il est conseiller d’opter pour une double saisie : faites saisir l’information par deux personnes et compilez les données pour réduire au maximum le risque d’erreur.
Pour gagner du temps, pensez à numéroter vos questions et réponses (Ex : question numérotée 1, 2, 3, 4 et réponses A, B, C, D). Vous pourrez ainsi gagner du temps lors de la resaisie.
Cas de l’extraction de données
Lorsque vos données sont issues d’une extraction d’un logiciel, vous n’avez pas à saisir vous-même les données. Vous évitez ainsi tout risque d’erreur de saisie. Les extractions sont généralement fournies sous la forme d’un fichier de données dit tabulaire. C’est-à-dire un fichier avec des lignes et des colonnes. Les formats les plus courants sont :
- .csv
- .xls ou .xlsx (tableur Excel)
- .odt (tableur LibreOffice)
Ces fichiers peuvent être ouverts avec la plupart des logiciels de tableur et d’analyse statistique. Vous n’avez donc pas besoin d’outil supplémentaire.
Si vous souhaitez convertir votre fichier vers un autre format (ex : de .csv vers .xlsx), vous pouvez l’ouvrir avec votre tableur et le réenregistrer dans un autre format.
Si votre extraction doit s’accompagner d’un recueil manuel, vous pouvez :
- soit compléter vos données extraites depuis votre tableur (voir les risques cités plus haut vis-à-vis d’un recueil directement dans un tableur)
- soit choisir un outil adapté au recueil et chaîner les informations avec votre extraction (voir en amont de votre recueil avec votre statisticien pour vous mettre d’accord sur la façon de chaîner ces deux sources de données).