[Avent 2024 – Ecrire sa thèse] – 16/24 – Obligations réglementaires et éthiques (CNIL / RGPD, CPP…)

Sur les dernières années, la loi a pas mal évolué avec l’apparition de la loi Jardé votée en 2012 (le même Jardé qui proposait de faire n’importe quoi avec l’hydroxychloroquine en 2020…), le RGPD en mai 2018…

Vous êtes tenu de respecter le règlement général de protection des données (RGPD)

Il y a 2 grandes questions à se poser :

  • De quel type sont les données que je traite ? (données de santé ou données concernant les internes ? Recherche impliquant la personne humaine (RIPH) ou non ? etc.)
  • Est-ce qu’il existe une méthodologie de référence pour la gestion des données personnelles ?

Comment classer les données traitées ?

La CNIL a détaillé la question sur son site et conseille de commencer par déterminer le type de recherche :

  • RIPH 1 (recherche impliquant la personne humaine) : recherches interventionnelles habituellement non justifiées, pouvant comporter un risque ou une contrainte majeurs (essais cliniques sur les médicaments ou dispositifs médicaux notamment) ;
  • RIPH 2 : recherches interventionnelles avec des risques ou contraintes mineures selon l’arrêté du ministre chargé de la santé (prélèvement sanguin, IRM, questionnaire entraînant des modifications mineures des soins, etc.)
  • RIPH 3 : recherches non interventionnelles, sans risque ni contrainte, correspondant aux soins courants.
  • RNIPH (recherche n’impliquant pas la personne humaine) : recherches nécessitant une collecte de données supplémentaires (ex : évaluation des pratiques des médecins), réutilisation de données de santé (études rétrospectives sur des données existants : dossiers médicaux, entrepôt de données, système national des données de santé SNDS, etc.)

Concrètement, vous allez donc faire des RIPH 2 / 3 et RNIPH. Les revues de littérature ne sont pas considérées dans ces cadres.

Qui contacter ensuite ?

Ensuite, la bonne personne à contacter est le délégué à la protection des données (DPD ou DPO) de l’université ; à Lille, les informations sont disponibles ici. L’algorithme est le suivant :

  • Si vous ne traitez pas de données de santé :
    • comité d’éthique = dossier « comité d’éthique pour la recherche » (CER) local
    • déclaration informatique et libertés = registre « délégué à la protection des données » (DPO) local
  • Si vous traitez des données de santé RNIPH avec une MR :
    • comité d’éthique = CER local
    • déclaration informatique et libertés = registre DPO
  • Si vous traitez des données de santé RNIPH sans MR (rare) :
    • comité d’éthique = dossier Comité éthique et scientifique pour les recherches, les études et les évaluations dans le domaine de la santé (CESREES)
    • déclaration informatique et libertés = dossier CNIL
  • Si vous traitez des données de santé RIPH :
    • comité d’éthique = dossier comité de protection des personnes (CPP)
    • déclaration informatique et libertés = registre DPO (si une MR s’applique) ou autorisation CNIL (si pas de MR).

Ca vous semble complexe ? C’est normal… et c’est le DPO qui va vous guider.
A Lille, si vous utilisez un questionnaire sur LimeSurvey sur le site de l’université, vous devez remplir une demande à cette page qui sera consultée par le DPO.
Pour quelque chose de plus complexe, vous devrez potentiellement remplir un protocole (attention à prévoir un délai de 3 mois déjà pour l’accord).

Comité d’éthique : comment faire ?

Là encore, c’est le DPO qui va vous guider. C’est votre référent sur ces questions.

Comme dit juste au-dessus, tous les projets de recherche impliquant la personne humaine (RIPH) ne peuvent être mis en œuvre qu’après un avis favorable (avis éthique) d’un comité de protection des personnes (CPP) (article L. 1121-4 du CSP).

Le site pour faire les déclarations est SIRIPH (https://siriph.sante.gouv.fr/). Le projet sera attribué de façon aléatoire à l’un des 39 comités de protection des personnes (CPP) répartis sur les 7 inter-régions.

(Au cas où vous verriez trainer d’anciennes informations, le site a changé plusieurs fois : c’était https://ictaxercb.ansm.sante.fr/Public/index.php et https://vrb.sante.gouv.fr/vrb/ puis https://cnriph.sante.gouv.fr/…)

Déclaration informatique et libertés : comment faire ?

Ce sera l’information clé de ce billet : contactez votre DPO ! (Il existe souvent des pages sur le sujet sur le site de votre université, ou son ENT : par exemple ici à Lille).

Concrètement, une déclaration est obligatoire pour tout fichier informatique concernant des personnes (on ne peut pas faire des listes qui traînent n’importe comment sur internet… cette loi date d’avant Facebook). Le message clé c’est que les patients ne doivent pas être identifiables dans des données qui traînent n’importe où pendant 50 ans.

Vous allez probablement collecter des données de santé. Il convient de lui déclarer votre fichier, si vous appliquez une « méthodologie de référence » (MR) (liste et détail ici) :

  • Pour les RIPH, vous pouvez utiliser les méthodologies de références (MR) 001 à 003 ;
  • Pour les RNIPH, vous pouvez utiliser les MR004 à MR008

Si ce n’est pas le cas, il faut déclarer à la Commission Nationale Informatique et Libertés (CNIL). Il n’est pas utile de faire la déclaration simplifiée à la CNIL si vous l’avez faite auprès de votre DPO (vous pouvez si vous souhaitez avoir un numéro et un PDF à mettre dans votre thèse ou pour une future publication).

Droits d’auteurs : à propos des images dans la thèse

Le message le plus simple et clair est : ne mettez rien qui ne vous appartienne pas.

Vous trouvez qu’un graphique écrit par Tartampion et al., publié dans Nature en 2024 serait une super illustration didactique en introduction : vous n’avez pas le droit de l’utiliser (d’autant que votre thèse est un document public, publié sur internet, accessible « pour toujours » — jusqu’à perte définitive des infrastructures énergétiques et numériques, suite à une guerre nucléaire ou autre évènement).

Vous trouvez qu’une image au hasard sur Google Images serait parfaite pour illustrer dans votre présentation : c’est aussi interdit (mais soyons honnête, beaucoup plus toléré vu la diffusion à public réduit). Dans votre présentation, vous avez le droit d’utiliser des images libres de droit (domaine public, licence CC-0, licence WTFPL, etc.) ou des images qui donnent un droit de partage tant que vous citez l’auteur (licences Creative Commons CC BY, etc.). Vous avez aussi le droit dans la thèse, mais c’est beaucoup moins pertinent.

Pour aller plus loin, vous pouvez consulter cette présentation sur les droits des images.

Enfin, les images reconstituées par l’intelligence artificielle (MidJourney, etc.) sont aujourd’hui considérées libres de droit, mais c’est très très débattu : elles s’inspirent d’oeuvres d’auteurs qui se sont fait aspirer leur travail pour entraîner l’IA sans réel consentement. Je vous déconseille ce recours dans votre travail de thèse.

Loading spinner
Publié dans Ecriture / direction de thèse et publications | Marqué avec , | Commentaires fermés sur [Avent 2024 – Ecrire sa thèse] – 16/24 – Obligations réglementaires et éthiques (CNIL / RGPD, CPP…)

[Avent 2024 – Ecrire sa thèse] – 15/24 – Revues de littérature et méta-analyses, grands principes

La revue de littérature chercher à synthétiser les connaissances sur une question donnée. Là encore, il est préférable pour vous de faire une revue de littérature sur « le rôle d’Helicobacter pylori dans la pathogenèse de la maladie d’Alzheimer » plutôt que « la maladie d’Alzheimer » ou « Helicobacter pylori ».

Nous allons garder le même plan que pour les études qualitatives et les études quantitatives des deux précédents billets : choisir un type d’étude (selon votre objectif) – puis recueillir des données – puis les analyser.

Choisir le type d’étude

Il existe plusieurs types de revue de littérature :

  • Revue narrative de la littérature (narrative review ou literature review) : vous ne cherchez pas l’exhaustivité ; c’est une méthode intégrative (et non agrégative) où vous organiserez les études en catégories logiques, avant de les décrire et les résumer ;
  • Revue systématique de la littérature (systematic review) : c’est la « revue de littérature » classique qui répond à une question précise, en cherchant l’exhaustivité dans le recueil des études puis des données, et en évaluant le risque de biais des études (puis de la revue) ;
  • Revue parapluie (umbrella review) : c’est une revue systématique… de revues systématiques !
  • Revue rapide de la littérature (rapid review) : c’est une revue systématique… mais en omettant des méthodes spécifiques, pour gagner du temps (notamment pour répondre rapidement, par exemple aux débuts de pandémie COVID-19)
  • Revue de la portée / de la délimitation de l’étendue (scoping review) : c’est comme une revue systématique… mais la question de recherche et le phénomène ne sont ni très précis, ni spécifiques. On l’utilise dans un domaine où la recherche est émerge (par exemple aux débuts des recherches sur le COVID Long).
  • Méta-analyse : c’est une méthode statistique qui permet de résumer les résultats de plusieurs études en des estimations chiffrées (car le Petit Prince avait raison).
  • etc.

Les grandes personnes aiment les chiffres. Quand vous leur parlez d’un nouvel ami, elles ne vous questionnent jamais sur l’essentiel. Elles ne vous disent jamais : quel est le son de sa voix ? Quels sont les jeux qu’il préfère ? Est-ce qu’il collectionne les papillons ? Elles vous demandent : Quel âge a-t-il ? Combien a-t-il de frères ? Combien pèse-t-il ? Combien gagne son père ? Alors seulement elles croient le connaître. — Antoine de Saint-Exupéry, Le Petit Prince.

En qualitatif, il existe également des méthodes de synthèse visant à créer un consensus : on a déjà parlé brièvement des groupes nominaux et de la méthode Delphi… Il en existe d’autres, uniquement sur la littérature :

  • revue narrative qualitative : idem à la revue narrative quantitative ;
  • méta-synthèse qualitative et méta-ethnographie : similaire à une revue systématique, sur des études qualitatives, afin de synthétiser (et générer) de nouvelles connaissances ;
  • revues critiques, revues réalistes : évaluer ou expliquer les phénomènes ;
  • etc.

Recueillir des données : modalités de recueil et modalités d’échantillonnage

Nous nous attarderons ici sur la revue systématique de littérature.

Elle répond à des étapes claires, précises, rigoureuses et transparentes (pour être reproductible), notamment détaillées par la revue Cochrane :

  • définir la question de recherche (avec le cadre PICO)
  • rédiger un protocole avec les critères d’inclusion et d’exclusion des études
  • choix des bases de données à interroger et méthodes d’analyses prévues
  • création de l’équation de recherche
  • recherche exhaustive dans les bases de données choisies
  • sélection des études en double aveugle
  • analyse des études avec leurs résultats et leurs biais (selon la grille Cochrane par exemple)
  • synthèse des résultats : qualitative ou parfois quantitative (méta-analyse)
  • évaluation de la qualité des preuves (GRADE)

Insistons ici sur l’importance de tout noter dès le départ : votre diagramme de flux listera les études incluses, exclues, le stade et motif d’exclusion (doublons, hors sujet à la lecture du titre car sur l’animal / sur une autre population etc., exclus après lecture du résumé, exclus après lecture de l’article complet).

Quand s’arrêter ?

Dans une revue systématique de littérature, on vise l’exhaustivité sur une période choisie.

Cela soulève surtout la question du temps (si on part de 15 000 études, c’est… compliqué pour une thèse de médecine). Il convient donc de prévoir une question (et donc une équation) de recherche réaliste, visant un problème précis, éventuellement dans un sous-groupe…

Logiciels d’analyse

Il existe plusieurs outils et logiciels d’analyse pour la revue systématique de littérature, tels que Covidence… payant à 289$/an par étudiant. Voici des alternatives gratuites :

Il y a aussi Systematic Review Toolbox qui permet de trouver des outils selon le type de votre revue, et le stade (protocole, sélection, analyse…)

Analyse des données

Le travail va se baser en 3 temps : transcrire – décrire (coder) – analyser (organiser)

Transcrire

Vous allez synthétiser les données recueillies dans des tableaux prévus à cet effet (notamment ceux de la grille PRISMA – nous reparlerons dans 2 jours des grilles, sujet que j’ai pour l’instant choisi de garder de côté pour essayer d’avoir des billets assez courts et didactiques).

La sélection des études en double aveugle permet d’améliorer la qualité de votre sélection et donc de votre revue.

Décrire

Vous allez reporter des éléments tels que :

  • le nom de l’étude (par exemple Auteur. Revue (Année) [réf]),
  • le type d’étude,
  • les années,
  • le public,
  • le test choisi,
  • les résultats principaux

Analyser

L’analyse peut être textuelle et/ou faire appel à des techniques de méta-analyse :

  • identifier les thématiques principales (sections de votre chapitre résultats)
  • repérer les convergences et divergences (qui seront discutées : méthodologies différentes, populations différentes, biais, etc.)
  • synthétiser avec des tableaux (et éventuellement des graphiques ou diagrammes – forest-plot pour une méta-analyse notamment).

Une attention particulière est portée aux biais dans les revues de littérature et méta-analyse :

  • biais des études sélectionnées : sont-elles de qualité ?
  • biais de la littérature : y’a-t-il des biais de publication ? (recours à un funnel plot)
  • biais de la revue elle-même : biais de sélection, etc.

Après avoir balayé les principales méthodes utilisées en thèse de médecine, nous allons parler de réglementation, et entrer un peu plus dans le détail en fournissant des outils utiles pour préparer l’étude… avant d’attaquer les résultats.

Loading spinner
Publié dans Ecriture / direction de thèse et publications | Marqué avec , | Commentaires fermés sur [Avent 2024 – Ecrire sa thèse] – 15/24 – Revues de littérature et méta-analyses, grands principes

[Avent 2024 – Ecrire sa thèse] – 14/24 – Etudes quantitatives, grands principes

Après un point de vue général sur le qualitatif, faisons de même sur le quantitatif avec le même plan. Là encore, vous allez : choisir un type d’étude (selon votre objectif) – puis recueillir des données – puis les analyser.

Choisir le type d’étude

En qualitatif, vous pouvez étudier le vécu d’un individu face à un phénomène (approche par analyse interprétative phénoménologique – souvent abrégé en phénoménologie), étudier les réactions et comportements d’individus autour d’un phénomène (approche par théorisation ancrée), étudier les dynamiques de groupe face à un phénomène (ethnographie)… ou autres méthodes que nous avons peu détaillées.

En quantitatif, en reprenant le terme de phénomène (qu’on pourrait plutôt remplacer par « variable »), vous pouvez :

  • étudier la survenue d’un phénomène (une maladie, une habitude médicamenteuse, une fréquence d’effets indésirables…) par des études épidémiologiques descriptives
  • étudier l’association entre deux phénomènes (tabagisme et revenu socio-économique ; tabagisme et cancer du poumon, etc.) par des études épidémiologiques analytiques
  • étudier les valeurs diagnostiques d’un test, par des études diagnostiques
  • étudier l’efficacité et la tolérance d’un traitement par des études thérapeutiques

Comme pour la partie qualitative, nous resterons focalisés sur ces grands types d’études. Il en existe d’autres, notamment les études médico-économiques (coût-efficacité, coût-utilité…) ou les modélisations mathématiques. Une liste est disponible ici.

Pour reprendre l’exemple de la poule avec un couteau… La phénoménologie nous avait appris le ressenti et le vécu d’une poule face à un tel ustensile ; la théorisation ancrée nous avait permis de construire un modèle du couteau selon les poules ; l’ethnographie nous avait fait étudier la dynamique d’un groupe de poules face à un couteau.
Cette fois :

  • l’étude épidémiologie descriptive va calculer le nombre de couteaux par poulailler (prévalence), éventuellement par an (incidence) ;
  • l’étude épidémiologie analytique va déterminer si le nombre (ou la forme) des couteaux varie en fonction de la taille, la localisation régionale, la densité de pop(o)ulation autour de la ferme ;
  • l’étude diagnostique va nous permettre de déterminer la sensibilité et la spécificité des caméras à infrarouges dans le poulailler pour repérer le couteau ;
  • l’étude thérapeutique va étudier l’efficacité et la tolérance d’un gilet pare-couteau chez les poules

Recueillir des données : modalités de recueil et modalités d’échantillonnage

Le recueil de données vise idéalement à l’exhaustivité… ou à défaut, à la constitution d’un échantillon représentatif de la cible.
Par exemple, si vous voulez connaître la moyenne en mathématiques de la classe de 6ème 4 du collège Albert Camus de votre ville, l’exhaustivité est possible ; si vous voulez connaître la moyenne en mathématiques des 6ème en France, vous allez peut-être devoir constituer un échantillon (ou profiter des grandes bases de données).

ll existe plusieurs méthodes de recueil :

  • Observations avec mesures directes : collecte d’informations mesurables sur le terrain (clinique, biologique, radiologique, éventuellement avec des outils connectés…)
  • Bases de données existantes : réutilisation de données ; pour vous donner une idée de ce qu’il y a dans le SNDS : https://health-data-hub.shinyapps.io/dico-snds/
  • Questionnaire (standardisés idéalement) : en papier, en ligne ; souvent structuré, parfois avec des commentaires libres ;
  • Expérimentation contrôlée

Concernant l’échantillonnage, il pourra être idéalement probabiliste :

  • aléatoire (sélection aléatoire)
  • systématique (sélection selon un ordre décidé : par exemple le premier patient de chaque jour)
  • stratifié (sélection aléatoire dans des sous-groupes/strates homogènes selon une caractéristique)
  • en grappe (sélection aléatoire de sous-groupes organisationnels ou géographiques)

Un échantillonnage non probabiliste est possible, mais moins puissant car plus soumis à des biais de sélection notamment :

  • par convenance (les plus accessibles)
  • intentionnel / par jugement (ceux qui semblent pertinent selon le chercheur)
  • par quotas (celle des sondages : on a des quotas en sexe, âge, profession… et on remplit)
  • par effet boule de neige (idem en qualitatif : utile pour des populations rares)

Quand s’arrêter ?

Le nombre de sujets nécessaires doit être calculé a priori. Vous pouvez retrouver les informations sur le site Objectif Thèse d’Emmanuel Chazard.

Logiciels d’analyse

Il existe plusieurs outils et logiciels d’analyse :

Analyse des données

Le travail va se baser en 3 temps : transcrire – décrire (coder) – analyser (organiser)

Transcrire

Vous devez vérifier la qualité de vos données.

Pour cela, le plus simple est de tout regarder visuellement, en décrivant les variables une à une, par exemple en boîte à moustache (boxplot) : ça vous permettra de supprimer / corriger les données du patient de 451 ans, celui qui mesure 1180 cm, pèse 4 kg, etc. Ca vous permettra aussi d’homogénéiser s’il y a un patient qui prend du « paracétamol » avec celui qui prend du « paracetamol » ou celui qui prend du « paracétamol  » (avec 3 espaces après).

Il est aussi pertinent de préciser ce que vous ferez des données manquantes :

  • suppression (le plus courant) ;
  • imputation (remplacer par de « fausses » données probables…) : c’est un outil purement statistique, qui peut être discutable. Il faut surtout savoir que ça existe, mais c’est rare pour une thèse de médecine.

Décrire

Quel que soit votre type d’étude, la description (Tableau 1) est indispensable. C’est l’analyse univariée : vous décrivez une variable à la fois.
Les méthodes sont variées :

  • Moyenne et écart-type (mesure de dispersion)
  • Médiane et intervalle interquartiles
  • Nombre (%)

Les mesures de dispersion peuvent aussi être des intervalles de confiance à 95 % si la variable suite une loi normale.

Je l’ai déjà dit et je le répéterai : un tableau 1 c’est super, ça permet de synthétiser énormément d’informations en peu de pages (des heures de travail en un seul petit tableau : frustrant peut-être, magique assurément). Un tableau vaut 10 ou 20 graphiques lorsqu’il s’agit de décrire des variables (un graphique peut parfois être pertinent pour ça… mais c’est rare qu’il fasse mieux que le tableau !)

Analyser

Ensuite, vous pouvez procéder aux autres analyses. C’est là où vous verrez des petits p… il n’y en a pas en univarié et descriptif seul.

En pratique, on pose en général l’hypothèse nulle ou standard H0 : « il n’y a pas d’interaction entre les variables ». Cette hypothèse va être testée avec des… tests statistiques, pour rejeter (ou non) l’hypothèse au seuil alpha de 5 % (donc « avec 5 % de risque de nous tromper, nous affirmons qu’il existe une interaction / une différence statistiquement significative entre les 2 groupes »).
C’est ce qu’on appelle la démarche hypothético-déductive (qui est aussi celle que vous utilisez auprès de vos patients : vous formulez des hypothèses diagnostiques à l’interrogatoire, vous testez à l’examen physique, vous déduisez que leur probabilité diminue/augmente en conséquence, et vous formulez donc une conclusion… qui est parfois fausse).

Il y a 2 grands types d’analyse :

  • bivariées : est-ce que la variable X influence/explique/est associée à la variable Y ?
  • multivariées : c’est la même chose, sauf que la variable à expliquer Y peut l’être maintenant par plusieurs variables, afin de limiter les biais de confusion.

Vous avez plusieurs tests existants selon la nature des variables (continu, binaire, etc.) : test t de Student, ANOVA, Chi2, régression linéaire, régression logistique, etc.

Si vous vous lancez dans une étude quantitative, vous pouvez lire la page de LEPCAM ou Objectif Thèse.

Loading spinner
Publié dans Ecriture / direction de thèse et publications | Marqué avec , | Commentaires fermés sur [Avent 2024 – Ecrire sa thèse] – 14/24 – Etudes quantitatives, grands principes

[Avent 2024 – Ecrire sa thèse] – 13/24 – Etudes qualitatives, grands principes

En 3 billets, je vais dresser des généralités sur les études qualitatives, les études quantitatives, les revues de littérature et méta-analyses. Il existe des guides bien plus détaillés pour les trois (déjà cités dans les précédents billets) : il s’agit plutôt ici de présenter de grands tableaux, qui pourront guider dans le choix de réaliser sa thèse dans tel ou tel sujet.

Nous allons nous baser sur le plan proposé dans le billet du 6, où il est rappelé que la méthode est la recette de cuisine, pour quelqu’un qui veut reproduire les résultats.

Concrètement, dans tous les cas, vous allez : choisir un type d’étude (selon votre objectif) – puis recueillir des données – puis les analyser.

Choisir le type d’étude (ou l’approche)

En quantitatif (mieux connu avec la lecture critique d’articles notamment), nous avons des études épidémiologiques (descriptive ou analytique), diagnostiques, thérapeutiques. Vous recueillez des données chiffrées : l’objectif guidera l’analyse et les résultats que vous présenterez.

En qualitatif, c’est le même principe… mais avec des données textuelles.

Les principales études possibles sont les approches par :

  • analyse interprétative phénoménologique (Interpretative Phenomenological Analysis ou IPA) : on se concentre sur l’individu, son vécu, son expérience (subjective) face à un phénomène
  • théorisation ancrée (Grounded Theory Method ou GTM, construire la théorie à partir des données) : on étudie le phénomène partagé, en analysant comment il se construit à travers les récits et comportements des individus
  • ethnographie : on étudie le groupe dans son environnement en observant comment il vit, interagit et s’approprie un phénomène.

Tout ça peut sembler abstrait et vous voici comme une poule avec un couteau (comme dit l’expression). Justement, étudions cette situation, et posons-nous (enfin) les bonnes questions :

  • Comment chaque poule (P) interprète et se sent (I) face à l’arrivée d’un couteau (Co) ? (on étudie le vécu, le ressenti, l’expérience de l’individu face à un phénomène : c’est de l’approche par phénoménologie IPA)
  • Comment les poules (P) réagissent (I) face à l’arrivée d’un couteau (Co) ? (on étudie les (ré)actions, les comportements face à un phénomène : c’est de l’approche par théorisation ancrée GTM)
  • Comment le groupe de poules (P) intègre le couteau (I) dans leurs pratiques collectives (Co) ? (on étudie les dynamiques de groupe : c’est de l’ethnographie)

Pour essayer de bien saisir, voici 2 autres images :

  • en littérature :
    • la phénoménologie pourrait se rapprocher du journal intime ;
    • la théorisation ancrée du polar ou thriller (où un scénario/une théorie s’élabore progressivement, pouvant être réel ou non, et surtout variable selon le point de vue) ;
    • l’ethnographie d’une enquête-documentaire dans une tribu (au sens large, la tribu pouvant être « les médecins généralistes trentenaires exerçant en libéral »)
  • ou plutôt qu’une poule avec un couteau, un enfant avec un puzzle :
    • la phénoménologie, c’est demander à l’enfant comment il vit la pièce du puzzle (sa forme, son toucher, son poids, son odeur, sa chaleur, ce que ça évoque, etc.)
    • la théorisation ancrée, c’est demander aux enfants d’associer les pièces les une avec les autres (sans suivre de modèle pré-établi) (on voit ici qu’un autre groupe, d’adultes par exemple, n’aurait pas la même image finale… changer de groupe c’est déjà être original !)
    • l’ethnographie, c’est regarder un groupe d’enfants interagir avec un puzzle (qui ouvre la boîte, propose de chercher les coins, cherche les bords d’abord, commence par le milieu, par motifs, par couleurs…)

Maintenant, si on détaille un peu davantage, les différentes approches :

  • théorisation ancrée : Construire un modèle explicatif (ou théorie) d’un phénomène ou d’interactions sociales, fondé (ou ancré) sur les données recueillies dans une population
    • Exemple : comment un processus social (I) est-il construit à partir des représentations (Co) de la population (P) ?
  • analyse interprétative phénoménologique : explorer en détail les habitudes ou comportements sur des individus
    • Exemple : comment les individus (P) perçoivent, ressentent, interprètent (I) un phénomène donné (Co) ?
  • ethnographie : s’immerger pour observer et analyser les habitudes de vie et les interactions d’un groupe
    • Exemple : comment le groupe (P) vit et structure ses interactions (I) autour d’un phénomène donné (Co) ?

Notez que la théorisation ancrée et l’analyse interprétative phénoménologique sont des études longues de sociologie ; pour une thèse de médecine, on utilisera plus modestement les termes « d’approche (inspirée) par théorisation ancrée » et « d’approche par analyse interprétative phénoménologique ».

Pour plus de détails, vous pouvez revoir le site LEPCAM ou le livre de Jean-Pierre Lebeau déjà cité.

Pour mémoire, il existe d’autres approches possibles en sociologie (dont certaines sont détaillées ici par exemple) :

  • étude de cas (étudier une ferme où une poule a trouvé un couteau pour comprendre ce phénomène rare)
  • bibliographie / approche narrative (demander à chaque poule de raconter son expérience, puis analyser pour comprendre comment elles donnent du sens à leur réalité)
  • observation participante (vivre au milieu des poules pour comprendre l’interaction avec le couteau – une des méthode de l’ethnographie)
  • analyse de discours (étudier comment le discours du fermier influence la perception des poules face au couteau)
  • analyse conversationnelle (observer comment les poules discutent entre elles lorsqu’elles ont découvert un couteau)
  • analyse de contenus (analyser les traces laissées par les poules autour du contenu ou sur les réseaux sociaux)
  • consensus structuré (demander aux poules expertes en couteau la conduite à tenir, et faire plusieurs tours pour dégager un consensus – par méthode Delphi).
  • etc.

Recueillir des données : modalités de recueil et modalités d’échantillonnage

Le recueil de données est différent en quantitatif et en qualitatif. Pour marquer un peu les esprits, disons :

  • en quantitatif, on cherche plutôt à avoir le minimum de variabilité avec le maximum d’individus (représentativité)
  • en qualitatif, on cherche plutôt à avoir le maximum de variabilité (informations) avec le minimum d’individu

Si on étudie les finishers d’un marathon, on sera embêté en quantitatif si sur 100 personnes, on a un sportif avec 2 prothèses de hanche qui termine en 3 heures, parce qu’il n’est pas représentatif de la population générale des marathoniens… alors qu’on sera ravi d’avoir son avis (sans doute) différent et nouveau s’il fait partie des 10 personnes interrogées en qualitatif !

ll existe plusieurs méthodes de recueil :

  • Observation : directe participante ou non (sur le terrain), indirecte (par analyse de transcriptions ou documentaire), par vidéo ;
  • Entretiens individuels : libres (sans guide prédéfini), semi-structurés (avec des thèmes), structurés (questions précises), approfondis (une ou deux questions très détaillées) ;
  • Entretiens en groupe : focus group (où les interactions entre participants permettent d’enrichir les données) ;
  • Méthode de consensus : groupe nominal (groupe réuni), méthode Delphi (groupe qui ne se réunit jamais)
  • Méthode de la pensée à voix haute, méthode des scénarios…

Le détail de la réalisation de ces méthodes pourra être retrouvé ailleurs.

Concernant l’échantillonnage, il pourra être :

  • raisonné (intentionnel) : choisir des poules qui ont vu un couteau
  • théorique (lié à la théorisation ancrée) : sélectionner les poules qui complètent les concepts émergents dans la théorie (celle qui a osé déplacer le couteau, etc.)
  • par variation maximale (maximiser les points de vue) : choisir des poules d’âge extrêmes pour comprendre leurs visions
  • par effet boule de neige (snowball sampling) : la première poule qui a vu un couteau nous oriente vers d’autres qui ont été dans la même situation

Ces modalités d’échantillonnage ne sont pas exclusive : on peut combiner un échantillonnage raisonné et une variation maximale.

Quand s’arrêter ?

L’idée est de poursuivre jusqu’à saturation (suffisance) des données : interroger des poules jusqu’à ce que x (souvent 2 consécutives) n’apportent plus de nouvelles informations par rapport à celles déjà recueillies

Notons ici qu’on parle de « suffisance » des données plutôt que saturation, qui est un concept de sociologie qui implique une triangulation lourde et chronophage, rarement réalisée pour une thèse de médecine générale.

Analyse des données

En qualitatif, vous pouvez utiliser le logiciel NVivo . En tapant « tutoriel » OU « didacticiel » ET NVIVO, vous trouverez facilement (on révise ici les booléens !). Par exemple, vous avez des capsules vidéo d’autoformation à NVivo par le Pre Sabrina Tremblay de l’Université du Québec à Chicoutimi.
Il existe des alternatives gratuites : Taguette, QualCoder, QDA Miner, RQDA, etc. Là encore, c’est à voir en amont avec votre directeur de thèse et ses habitudes…

Le travail va se baser en 3 temps : transcrire – décrire (coder) – analyser (organiser)

Transcrire

Auparavant (dans les années 2010 encore !) les verbatims étaient transcrits à la main, depuis un enregistrement audio et/ou vidéo. Désormais, beaucoup passent par des logiciels de reconnaissance vocale performants pour gagner un temps précieux !

Avant toute analyse, les données doivent être vérifiées et leur qualité optimisée (quand en quantitatif). Ici, cela passe par la triangulation (ce qui évoque juste triangle) :

  • théorique : avec un codage indépendant par plusieurs experts de cadres disciplinaires variés (psychologie, sciences de la gestion, sociologie) ;
  • des données (ou des outils de cueillette, ou des méthodes) : utiliser au moins 2 outils (entretiens, observations, analyse documentaire)
  • des chercheurs et chercheuses : plusieurs chercheurs qui apportent un point de vue (sur les concepts, etc.)
  • des sources : les données sont recueillies auprès de plusieurs sources différentes.
  • écologique (ou indéfinie) : renvoie aux analyses et aux interprétations qui sont soumises à la vérification auprès des sujets participant à la recherche.

Coder (décrire)

Des thèmes ou concepts émergent des données via une phase de codage, souvent inductive (inverse de déductif).

Organiser (analyser)

Ces thèmes ou concepts sont ensuite regroupés ou reliés pour dégager du sens.

Ce qui est change est :

  • la finalité de l’analyse :
    • vécu individuel dans la phénoménologie, sans chercher à généraliser (un modèle est possible mais non systématique) ;
    • théorie généralisable dans la théorie ancrée (le modèle est systématique) ;
    • pratiques culturelles et interactions sociales en ethnographie, sans forcément chercher à théoriser (un modèle est possible mais non systématique) ;
  • le niveau d’abstraction des concepts :
    • proches du vécu, des sentiments subjectifs en phénoménologie
    • modèle explicatif systématique en théorie ancrée
    • pratiques sociales ou culturelles en etnhographie

Pour finir sur mes exemples de poules et de couteau :

  • en théorie ancrée : l’analyse suit un processus inductif les données sont codées au fur et à mesure pour faire émerger des concepts (l’appellation « ancrée » ou « grounded theory model » désigne bien le fait que la théorie naît du sol / des données). Les concepts sont ensuite comparés, regroupés en catégories, et intégrés dans un modèle théorique.
    • Concrètement : transcrire les interviews des poules (données) ; identifier les thèmes récurrents (concepts : peur, curiosité, évitement, manipulation…) ; les relier pour construire une théorie (le modèle est obligatoire).
  • en phénoménologie : l’analyse vise à comprendre l’expérience subjective par des descriptions détaillées, en identifiant les thèmes centraux dans les récits.
    • Concrètement : interroger les poules, identifier les sentiments (surprise, danger, etc.) ; comprendre comment elles donnent du sens à cette expérience. Un modèle est possible.
  • en ethnographie : l’analyse interprète les pratiques et interactions du groupe.
    • Concrètement : observer comment les poules collaborent ou non face au couteau (organisation collective, conflit, etc.) et interpréter ce comportement dans leur environnement de ferme. Un modèle est possible.
Loading spinner
Publié dans Non classé | Commentaires fermés sur [Avent 2024 – Ecrire sa thèse] – 13/24 – Etudes qualitatives, grands principes

[Avent 2024 – Ecrire sa thèse] – 12/24 – Poser et affiner sa question de recherche

(Billet tardif aujourd’hui parce que : la bourre…)

Deux situations existent :

  • vous pouvez avoir une idée de thème vague sans question précise (éventuellement grâce aux méthodes évoquées dans ce billet) : dans ce cas, je vous conseille dans le billet d’hier de naviguer sur plusieurs bases (LiSSa, PubMed, Google Scholar notamment, Sudoc éventuellement…), en cherchant des sujets dans votre thématique, en lisant la section Discussion > Perspectives, en regardant les sujets similaires (utiliser BibliZap peut être utile aussi) ;
  • votre travail peut commencer très tôt par une question de recherche : très bien, il faut peut-être l’affiner.

Déjà, à ce stade de votre travail, où rien n’est lancé, tout est possible ! Je vous conseille même de ne pas vous contenter d’une seule question de recherche : cherchez-en plusieurs, et choisissez celle qui vous semble « la mieux ».

Mais qu’est-ce qui est « mieux » ? C’est le sujet de ce billet où on va parler de la bonne question de recherche.

Votre intérêt pour le sujet

Nous l’avons déjà dit plusieurs fois : ce qui compte avant tout, c’est votre intérêt pour le sujet. Je ne reviens pas dessus, mais c’est un point primordial pour votre motivation. Il doit être en tête de vos critères.

Plutôt qualitatif ou quantitatif ?

(A lire avec la voix de Bernard Campan dans les Trois frères en mode « plutôt Braaaaque, Vasarely » :D)

Si on veut être puriste, le choix de la méthode dépend uniquement de la question de recherche née de votre connaissance approfondie d’un sujet.

Je vous ai dit auparavant qu’il n’était pas indispensable d’avoir une connaissance approfondie pour une thèse de médecine (c’est différent pour une thèse d’université), mais de réfléchir à l' »arène du récit » comme dans un roman : si dans votre livre de fantasy, vous avez une magie basée sur les crayons de couleur, vous avez tout intérêt à connaître la taille, la forme, le prix de ces crayons (mais dans la plupart des livres de science-fiction/fantasy, ça n’est pas un élément détaillé ou connu par l’auteur) ; de la même façon, si votre thèse a besoin d’informations épidémiologiques, vous les donnez et s’il n’a pas besoin d’informations de physiopathologie, vous pouvez les connaître ou non…

Ici, j’ajouterais que le choix de la méthode dépend en réalité de ce que vous avez envie de faire. C’est le cas majoritaire de toute façon : un étudiant se dit « j’ai envie de faire du quantitatif » / « j’ai envie de faire du qualitatif » et réfléchit à son sujet en fonction. Tant pis pour le purisme, vive le pragmatisme 😀

Nous reviendrons plus en détail sur quantitatif / qualitatif plus loin, mais de façon brève (et utile à ce stade) :

  • le qualitatif vise à comprendre des phénomènes, expériences, comportements sociaux… Les données ne sont pas numériques mais textuelles ; l’analyse passe par une interprétation, des codages…
  • le quantitative vise à mesurer, comparer, associer des variables… Les données sont numériques ; l’analyse passe par des statistiques descriptives (moyenne, médiane, etc.) ou des tests (Student, Chi2, etc.)

Il ne faut pas « craindre » le quantitatif : vous pouvez pour votre thèse faire quelque chose de descriptif, il n’y a pas besoin d’utiliser forcément des modèles complexes et incompréhensibles.
Il ne faut pas non plus « sous-estimer » le qualitatif : c’est parfois vu (à tort) comme plus simple, car sans calcul… Ce n’est pas le cas, il y a d’autres difficultés, notamment sur l’analyse et la discussion des résultats !

Pour des raisons qui vous concernent, vous pouvez vouloir forcément un sujet quantitatif ou qualitatif.

Le pragmatisme !

On revient ici sur un point essentiel, mais si votre sujet est « comment traiter efficacement la maladie d’Alzheimer ? »… ça va être un tantinet complet !

Les essais cliniques ne sont pas faisables pour une thèse de médecine, pour des raisons de temps (sauf à s’intégrer à un gros essai en cours).

Comme on l’a déjà dit également, utiliser des bases existantes en open data (par exemple cette liste ici) permet de gagner du temps par rapport à la constitution d’une nouvelle. Il ne s’agit évidemment pas de dissuader à créer de nouvelles bases (la plupart du temps, ce sera nécessaire !), mais de réfléchir à ce qui est faisable… si votre département de médecine générale l’autorise bien sûr ! Un exemple

Ecrire sa question de recherche : PICO, PICo ou sans PICO ?

Il existe 2 acronymes proches : PICO (études quantitatives) et PICo (études qualitatives).

En quantitatif, le modèle PICO est un acronyme pour Population, Intervention, Comparison, Outcome (résultat).

Concrètement : chez la population P, l’intervention I est-elle associée au (meilleur) résultat O par rapport à l’intervention C ?

Ce modèle sera utile pour construire votre question de recherche précise dans :

  • les études épidémiologiques analytiques ;
  • les études diagnostiques (O est souvent « un diagnostic plus précis », selon des valeurs diagnostiques : sensibilité, spécificité, valeurs prédictives) ;
  • les essais cliniques ;
  • les revues systématiques ou méta-analyses.

Par contre, ce modèle n’est pas nécessaire dans :

  • les études qualitatives (explorer des perceptions, des comportements ou des expériences, sans intervention, comparaison et résultat attendu) ;
  • les études quantitatives exploratoires ou descriptives (sans intervention / comparaison) ;
  • ou encore la recherche fondamentale…

Si votre question est : « quel est le taux de consommation des AINS chez les patients courant au marathon de Paris ? »… il n’y a pas d’intervention (donc pas de contrôle) et pas d’outcome. C’est pourtant une question de recherche.
Si vous vous demandez « chez les coureurs de plus de 60 ans (P), est-ce que la consommation d’AINS (I) est associée à davantage d’abandon lors d’un marathon (O) que chez les coureurs de 18-59 ans (C) ? », il s’agit d’une étude épidémiologique analytique (comparant 2 groupes), et vous pouvez donc généralement utiliser le modèle PICO.

En qualitatif, le modèle PICo est un acronyme pour Population, Interest, Context

Concrètement : Quelles sont les expériences de population P pour le phénomène d’intérêt I dans le contexte C ? (ou que signifie I pour P dans le contexte Co ?) Par exemple :

  • « quelles sont les expériences des étudiants en médecine (P) pour l’utilisation des flashcards (I) dans le contexte de la préparation de leurs examens (Co) ? »
  • « que signifie être en bonne santé (I) pour les hommes de plus de 80 ans (P) polymédiqués (C) ? »

Dans les 2 cas, on peut ajouter T pour la temporalité (entre 2010 et 2020, sur les 50 dernières années etc.)

Un autre modèle a été proposé en français dans Initiation à la recherche qualitative en santé, dirigé par Jean-Pierre Lebeau : RAPaCE pour recherche (qualitative, quantitative ou mixte), approche méthodologique, phénomène analysé, concept mobilisé (attitudes, perspectives, expériences, etc.), échantillonnage.

Finaliser le premier jet de l’introduction

Une fois la question de recherche posée, votre premier jet d’introduction peut être finalisé…

L’introduction s’écrit un peu comme une nouvelle : tout le texte va mener à l’inéluctable chute de la (des) dernière(s) phrase(s). Là, votre introduction va devoir définir les termes de votre question de recherche puis y amener progressivement, par un chemin logique.

Nous sommes encore une fois dans une écriture itérative : votre question de recherche s’est nourrie de vos recherches qui ont permis de commencer à écrire votre introduction… et une fois la question posée, c’est votre introduction qui se nourrit se ses termes, et mène à de nouvelles recherches pour peaufiner.

Loading spinner
Publié dans Ecriture / direction de thèse et publications | Marqué avec , | Commentaires fermés sur [Avent 2024 – Ecrire sa thèse] – 12/24 – Poser et affiner sa question de recherche