Je me permets de vous remettre l’algorithme pour vous aider :
Algorithme des études quantitatives
A. Cas, série de cas
En anglais, case report ou case series, correspond à la description détaillée d’un cas ou de plusieurs cas cliniques d’intérêt. Cette description comprend souvent les symptômes, les signes, le diagnostic, le traitement et le suivi.
Classification :
Le BMJ Case Reports propose de les classer en différentes catégories :
Une association rare entre une pathologie et des symptômes
Présentation inhabituelle d’une pathologie commune
Rappel d’une leçon clinique importante
Apprentissage suite à une erreur
Découverte d’un nouveau lien entre la pathogénèse d’une maladie ou d’un effet secondaire
Nouvelle ou maladie rare
Éclatement d’un mythe
Nouvelle procédure diagnostique
Nouveau traitement
Une image
La santé globale
Conséquence inattendue (positive ou négative) dont effet secondaire médicamenteux
Intérêt :
Avantages :
Découverte de nouvelles maladies
Ex : VIH
Découverte de nouveaux effets secondaires médicamenteux.
Ex : William McBride décrivit pour la 1ère fois une série de cas de malformation fœtale chez des patientes ayant reçu du thalidomide dans le Lancet de 1961.
Découverte de nouveau traitement
Ex : utilisation du propranolol dans l’hémangiome infantile.
Amélioration de la connaissance des symptômes fréquents d’une maladie rare et de symptômes rares d’une maladie fréquente.
Formation médicale : apprentissage par l’étude de cas clinique
Publication rapide.
Désavantage :
Qualité méthodologique souvent faible.
Ex : sur 1316 cas de médecine d’urgence publiés dans 4 journaux, la moitié manquaient d’information sur le traitement que suivait le patient.
Très faible niveau EBM
Pas de test statistique, nombreux biais
Publication :
Certains journaux sont spécialisés dans la publication de case report (Journal of Medical Case Reports, BMJ Case Reports…), d’autres journaux publient quelques cas (La Revue du Praticien, The Lancet…).
Incitez vos étudiants à en publier. Ça peut être rentable en termes d’impact factor et la démarche va stimuler l’étudiant pour faire de la recherche et publier (en plus c’est sympa d’avoir son nom sur PubMed…).
Guide de rédaction.
Des recommandations existent afin de rédiger un case report de qualité.
Étude qui mesure à un même moment la maladie ou le nombre de cas existants (prévalence de la maladie) et le degré d’exposition (6). On parle souvent de « photographie » à un moment donné.
Synonyme : étude de prévalence ou « survey »
S’oppose aux études longitudinales.
Objectif :
Principalement descriptive, elle étudie la distribution d’un paramètre ou la prévalence d’une exposition ou d’une maladie.
Rarement étiologique lorsqu’on étudie les marqueurs de l’état de santé pour lesquels la prévalence est un bon indicateur et dont l’étude ne modifiera pas le comportement vis-à-vis de l’exposition étudiée
Principe :
Choix d’un seul échantillon représentatif de la population générale.
Recueil de la maladie et des expositions à un instant donné
Pas de suivi dans le temps
Intérêt :
Avantage :
Calcul de la prévalence et du risque relatif
Rapide : pas de suivi dans le temps (évite les perdus de vue)
Coût faible (pas de suivi)
Exploratoire, permettant de générer des hypothèses.
Inconvénients :
Association mais pas causalité : ne détermine pas si la maladie est apparue après l’exposition.
Pas d’incidence : manque la notion de durée.
Nombreux biais
Principaux biais :
Biais de confusion : peu de contrôle sur de potentiels facteurs de confusion.
Biais de prévalence : les cas chroniques restent longtemps des cas prévalents.
Biais de sélection : « healthy worker effect »…
C. Étude diagnostique
Définition : une étude diagnostique permet d’évaluer un nouvel outil diagnostique au niveau de ses performances diagnostiques ainsi que de l’amélioration du devenir des sujets diagnostiqués.
En anglais : Fiabilité = reliability, Reproducibility, Consistency, Stability, Repeatability.
NB : On parle souvent uniquement de « test » diagnostique mais il existe plusieurs « outils » diagnostiques tels que
Ex : performance des D-Dimères dans le diagnostic de l’embolie pulmonaire.
Score, algorithme. Ex : performance du score de Wells dans le diagnostic de la thrombose veineuse profonde.
Signe clinique. Ex : performance du signe de Homans dans le diagnostic de la thrombose veineuse profonde des membres inférieurs.
Objectif :
Performance (exactitude, validité) : capacité d’un test de différencier des malades et non malades en fonction s’ils ont le test positif ou négatif.
Fiabilité (reproductibilité) : Capacité d’un examen ou d’un test de donner les mêmes résultats lorsqu’il est répété à plusieurs reprises (et donc à différents moments) sur les mêmes sujets et exactement dans les mêmes conditions.
Coût
Acceptabilité
Avant de pouvoir utiliser un outil/test diagnostique dans la pratique courante, il faut démontrer :
Qu’il a de bonnes performances diagnostiques et qu’il est fiable.
Qu’il améliore le devenir des sujets ayant bénéficié du test avec un coût acceptable.
Formulation de l’objectif :
On retrouve le fameux PICO :
P : population étudiée par le test
I : nouvel outil diagnostique
C : outil diagnostique de référence
O : critère de jugement
Ex : évaluer la performance du test hémoccult® (I) par rapport à la coloscopie (C) pour le dépistage du cancer colorectal (O) chez les sujets de plus de 50 ans (P).
Type d’étude :
Les principaux types d’études retrouvés sont :
Transversale : si on n’a pas besoin de suivre les sujets dans le temps
Cohorte : si on veut analyser la survenue d’un événement dans le temps
Interventionnel : lorsqu’on cherche une influence du test sur le devenir du sujet.
Choix du test de référence :
Définition : test de référence permettant d’identifier véritablement les malades et les non-malades, qui va permettre d’évaluer la performance du nouveau test.
En anglais : gold standard.
Méthodologie :
Schéma expérimental :
Soit on a un test de référence (gold standard) : étude observationnelle transversale.
On choisit un échantillon d’individu qui vont subir les 2 tests : gold standard + nouveau test. Ex : coloscopie vs hemoccult dans le dépistage du cancer colorectal.
Soit on n’a pas de test de référence :
Et on veut prédire la survenue d’un événement : étude de cohorte
Et on recherche une influence du test sur le devenir du sujet : étude interventionnelle.
a. Performance
La performance peut se décomposer en 2 catégories :
Performance intrinsèque :
Définition : c’est la capacité informative propre du test, ne dépendant pas de la prévalence de la maladie.
On l’estime grâce à la sensibilité (Sn), la spécificité (Sp), le rapport de vraisemblancepositif (RVP) et négatif (RVN)
Performance extrinsèque :
Définition : c’est la capacité informative du test en fonction de ses caractéristiques intrinsèques et un contexte d’utilisation (la prévalence = probabilité prétest)
On l’estime grâce à la valeur prédictive positive (VPP) et négative (VPN)
i. Caractéristiques intrinsèques
On va déterminer si notre test a de bonnes capacités discriminantes M-/M+. Ces indicateurs sont assez théoriques car on ne prend pas en compte le contexte (de la prévalence).
Pour cela, il faut établir le tableau de contingence. C’est un tableau à double entrée permettant d’estimer la dépendance entre 2 caractères. Ici, on choisit comme variable le statut malade (M+ ou M-) et le résultat du test (T+ ou T-).
T+
T-
M+
VP
FN
M-
FP
VN
Ce tableau nous permet de déterminer 4 catégories de sujets :
VP : Vrai Positif. Sujet malade ayant le test positif
FN : Faux Négatif. Sujet malade ayant le test négatif
FP : Faux Positif. Sujet sain ayant le test négatif
VN : Vrai Négatif. Sujet sain ayant le test négatif.
Pour qu’un test diagnostique soit de bonne qualité, il faut qu’on ait beaucoup de VP et VN et peu de FP et FP. On va pouvoir étudier la relation entre ces 4 catégories grâce au calcul de différents paramètres.
Sensibilité :
Définition :
Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement des individus affectés par une maladie visée ou par un problème de santé.
Probabilité que le test soit positif (T+) chez les personnes malades (M+) = p (T+/M+)
Calcul :
Sn = VP/(VP+FN)
Rmq : VP + FN = nombre total de sujets malades
Spécificité
Définition :
Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement les individus non affectés par une maladie visée ou par un problème de santé.
Probabilité que le test sera négatif (T-) parmi les personnes non malades (M-) = p (T-/M-)
Calcul :
Sp = VN/(VN+FP)
Rmq : VN + FP = nombre total de sujets non malades
Efficacité diagnostique d’un test
Définition :
Proportion de résultats corrects (VP et VN) dans l’ensemble des résultats du test.
Calcul :
E = (VN+VP)/(VN+VP+FN+FP)
Interprétation :
Valeur comprise entre 0 et 1
0 : test inefficace
1 : test parfait
Indice de Youden
Définition :
Indice permettant une mesure globale de la performance statistique d’un test
Calcul :
Y = Sn + Sp – 1
Interprétation :
Valeur comprise entre 0 et 1
0 : test inefficace
1 : test parfait
Courbe ROC
Définition : Un outil graphique permettant de représenter la capacité d’un test à discriminer entre la population des malades et des non malades.
Objectifs :
Évaluer la performance globale d’un test diagnostique (à variable de réponse quantitative continue)
Comparer 2 tests diagnostiques
Définir le seuil de validité optimal d’un test diagnostique.
Rapport de vraisemblance :
Définition : estimation du rapport entre la probabilité d’avoir un test positif (ou négatif) chez les sujets malades et celui d’avoir un test positif (ou négatif) chez les sujets sains
Autrement dit, il correspond à la probabilité post test de la maladie par rapport à sa prévalence.
Rapport de vraisemblance positif (RVP ou RV+) :
Définition : combien de fois est-il plus vraisemblable d’être M+ sachant qu’on a le T+ ?
Calcul : RVP = Se/(1-Sp)
Rmq :
Le sujet a RVP fois plus de risque d’avoir un test positif s’il est malade que s’il ne l’est pas.
Plus RVP est élevé, plus on aura confiance dans le résultat d’un test positif pour confirmer un diagnostic.
Rapport de vraisemblance négatif (RVN ou RV-) :
Définition : combien de fois est-il plus vraisemblable d’être M- sachant qu’on a le T- ?
Calcul : RVN = (1-Se)/Sp
Rmq :
Le sujet a RVN fois plus de chance d’avoir un test négatif s’il est malade que s’il ne l’est pas.
Plus RVN est élevé, plus on aura confiance dans le résultat d’un test négatif pour éliminer un diagnostic.
Interprétation : c’est un ratio qui s’interprète comme une RR
Nomogramme de Fagan:
Nomogramme = outil graphique de calcul constitué de courbes graduées entre lesquelles on place une règle. Le résultat de l’opération se lit au croisement de la règle et de l’une des courbes
Intérêt : il permet de calculer la probabilité post-test connaissant le RV et la prévalence : p (post-test) = p (prétest) x RV
RVP
RVN
Apport diagnostique
> 10
< 0,1
Très fort
5 – 10
0,1 – 0,2
Fort
2 – 5
0,2 – 0,5
Modéré
1 – 2
0,5 – 1
Faible
1
1
nul
ii. Caractéristiques extrinsèques
On va déterminer les qualités du test en prenant en compte la prévalence de la maladie qu’il va explorer. Un même test aura des qualités extrinsèques différentes en fonction de la maladie et de la population étudiée.
Ex : BNP dans le diagnostic de l’insuffisance cardiaque chez la population générale vs une population gériatrique.
Ex : CRP dans le diagnostic d’une pyélonéphrite vs une rhinopharyngite.
Pour calculer ces indicateurs, on va prendre en compte les paramètres intrinsèques du test (Se, Sp) et de la prévalence.
Ils sont plus parlant pour le clinicien :
La prévalence correspond à la probabilité pré-test : c’est la probabilité d’avoir la maladie avant d’avoir fait le test.
VPP et VPN correspondent à la probabilité post-test : c’est la probabilité d’avoir (ou pas) la maladie après le test.
Valeur prédictive positive (VPP)
Définition (6):
Capacité du test de distinguer les personnes malades (vrais positifs) de l’ensemble des personnes dont le résultat au test est positif (vrais positifs + faux positifs)
Probabilité d’être malade (M+) si on a un test positif (T+)= p (M+/T+)
Calcul :
VPP = VP / (VP+FP)
VPP = RVP x prévalence
Valeur prédictive négative (VPN)
Définition (6):
Capacité d’un test à distinguer les personnes saines (vrais négatifs) de l’ensemble des personnes dont le résultat au test est négatif (vrais négatifs + faux négatifs)
Probabilité de ne pas être malade (M-) si on a un test négatif (T-) = p (M-/T-)
Calcul :
VPN = VN / (VN+FN)
VPN = RVN x prévalence
Rmq :
VP + FP = nombre total de sujets ayant un test positif
VN + FN = nombre total de sujets ayant un test négatif
VPP et VPN dépendent de la Sp, Se et la prévalence de la maladie
b. Fiabilité
Définition : Fiabilité (reproductibilité) : Capacité d’un examen ou d’un test de donner les mêmes résultats lorsqu’il est répété à plusieurs reprises (et donc à différents moments) sur les mêmes sujets et exactement dans les mêmes conditions.
Après avoir démontré que le test est efficace, on veut s’assurer qu’il donnera les mêmes résultats s‘il est répété
Par un autre opérateur : reproductibilité inter opérateur
Par un même opérateur : reproductibilité intra opérateur
Coefficient de corrélation Kappa
Il mesure l’accord entre 2 jugements qualitatifs, en tenant compte de la part de concordance due au hasard.
Il mesure la variabilité intra et interobservateur.
Il est estimé en rapportant le gain observé (différence entre la concordance observée test/aléatoire) et le gain possible total (100 % – concordance aléatoire)
Calcul :
On doit évaluer la concordance interopérateur (opérateur 1 et opérateur 2)
C1 : nombre de tests positifs chez les 2 opérateurs
C2 : nombre de tests négatifs chez les 2 opérateurs
NC1 : nombre de tests positif chez l’opérateur 1 et négatif chez l’opérateur 2
NC2 : nombre de tests négatifs chez l’opérateur 1 et positif chez l’opérateur 2
C1 + C2 : nombre de tests concordants
NC1 + NC2 : nombre de tests non concordants
Test positif par opérateur 1
Test négatif par opérateur 2
Test positif par opérateur 2
C1
NC2
Test négatif par opérateur 2
NC1
C2
Interprétation : les valeurs de références d’après Landis-Koch 1977sont donnés dans le tableau joint. En médecine, on estime qu’il doit être > 0.8
κ
concordance
1,00 – 0,81
Excellente
0,80 – 0,61
Bonne
0,60 – 0,41
Moyenne
0,40 – 0,21
Faible
0,20 – 0,00
Mauvaise
c. Principaux biais
Biais de vérification :
Définition : le test de référence n’est réalisé que chez les ayant répondu positivement au nouveau test
Anglais : « work up biais »
Conséquence : surestimation des performances du test
Biais de spectre :
Définition : les patients sélectionnés ne reflètent pas l’ensemble des patients concernés (biais de sélection)
Biais de classement :
Définition : biais lorsque l’évaluateur est influencé par le résultat du premier test (non-respect de l’aveugle)
Biais lié à un choix non pertinent du gold standard
d. Grille de lecture STARD
Une grille de lecture STARD (français) a été développée pour aider à analyser et écrire une étude diagnostique.
Tableau I. Traduction française originale de la liste de contrôle STARD 2003.
Section et sujet
Item
TITRE/RÉSUMÉ/
MOTS CLEFS
1
Identifier l’article comme une étude sur la précision d’un test diagnostique (se référer à la rubrique MeSHa « sensibilité et spécificité »).
INTRODUCTION
2
Formuler les questions de recherche ou les objectifs de l’étude, comme évaluer la précision diagnostique ou comparer la précision entre plusieurs tests ou sur divers groupes de participants.
MÉTHODES
Population
3
Population étudiée : critères d’inclusion et d’exclusion, contexte et lieux où les données ont été collectées.
4
Recrutement des participants : le recrutement était-il basé sur la présentation de symptômes, sur des résultats d’examens antérieurs, ou sur le fait que les participants avaient déjà subi les tests étudiés ou le test de référence ?
5
Échantillonnage des participants : la population de l’étude était-elle une série consécutive de participants définis selon les critères de sélection précisés dans les items 3 et 4 ? Si non, spécifier la manière dont les participants ont alors été sélectionnés.
6
Collecte des données : le recueil des données était-il planifié avant que le test étudié et le test de référence aient été effectués (étude prospective) ou après (étude rétrospective) ?
Méthodes des tests
7
Description et justification du test de référence.
8
Spécifications techniques du matériel et des méthodes utilisés, y compris comment et quand les mesures ont été prises, et/ou citer les références relatives aux tests étudiés et au test de référence.
9
Définition et justification des unités, des seuils et/ou des catégories de résultats du test étudié et du test de référence.
10
Nombre, formation et niveau d’expertise des personnes exécutant et interprétant les tests étudiés et le test de référence.
11
Préciser si les lectures des tests étudiés et du test de référence ont été faites en aveugle (insu) des résultats de l’autre test, et décrire toute autre information clinique à la disposition des personnes interprétant le test.
Analyses statistiques
12
Méthodes de calcul ou de comparaison des mesures de précision diagnostique et analyses statistiques utilisées pour quantifier l’incertitude (par exemple, intervalles de confiance de 95 %).
13
Méthodes de calcul de la reproductibilité du test, si réalisé.
RÉSULTATS
Population
14
Quand l’étude a été réalisée, y compris dates de début et de fin de recrutement.
15
Caractéristiques cliniques et démographiques de la population de l’étude (au minimum : âge, sexe, type de symptômes présents).
16
Nombre de participants répondant aux critères d’inclusion qui ont subi ou non les tests étudiés et/ou le test de référence ; expliquer pourquoi les participants n’ont pas subi l’un ou l’autre test (un diagramme de flux est fortement recommandé).
Résultats pour les tests
17
Délai entre les tests étudiés et le test de référence, et de tout traitement administré entre deux.
18
Répartition des différents degrés de gravité de la maladie (définir les critères) des sujets remplissant les conditions ciblées ; autres diagnostics chez les participants ne remplissant pas les conditions ciblées.
19
Tableau croisé comparant les résultats du test étudié (y compris les résultats indéterminés et manquants) aux résultats du test de référence ; pour les données continues, distribution des résultats du test étudié par rapport aux résultats du test de référence.
20
Évènements indésirables liés à la réalisation des tests étudiés ou du test de référence.
Estimations
21
Estimations de la précision diagnostique et des mesures de l’incertitude statistique (par exemple, intervalles de confiance de 95 %).
22
Gestion des résultats indéterminés, des valeurs manquantes ou aberrantes des tests étudiés.
23
Estimations de la variabilité de la précision diagnostique entre les sous-groupes de participants, entre les personnes interprétant le test ou entre les centres d’étude, si réalisée.
24
Estimations de la reproductibilité du test, si réalisées.
DISCUSSION
25
Discuter l’applicabilité clinique des résultats de l’étude.
Traduction française du diagramme de flux STARD 2003.
Diagramme de flux, STARD 2003
D. Étude épidémiologique/étiologique
Les études étiologiques sont des études qui évaluent l’association entre un ou plusieurs facteurs de risque avec la survenue d’une maladie. Elles font partie des études observationnelles.
Formulation de l’objectif :
En reprenant le PICO :
P : population concernée
I : facteur de risque étudié
C : population de comparaison n’ayant pas le facteur de risque
O : la maladie
Ex : évaluation du rôle de la consommation de viande rouge (I) dans l’apparition de cancer colorectal (O) chez les personnes de plus de 50 ans (P). On sous-entend que l’on compare à ceux ne consommant pas de viande rouge (C).
Types d’étude :
Ce sont des études épidémiologiques, observationnelles de type étude :
Cohorte : on recrute des sujets indemnes de la maladie, qui sont exposés à des facteurs et sont suivis dans le temps afin d’évaluer la survenue de la maladie.
Cas-témoin : on recrute des malades et des sujets indemnes de la maladie qui seront similaires sur certaines caractéristiques aux malades (on les appelle les témoins). On recherche dans le passé s’ils ont été exposés à certains facteurs de risque.
Études de cohorte
Etudes cas-témoins
Critères de choix
Facteur
Unique, rare
Multiples, fréquente
maladie
Multiples, fréquente
Rare, unique
exposition
rare
fréquente
biais
perdus de vue
mémoire et sélection, peu de suivi
inconvénient
Gros échantillon, long, coût élevé
Rapide, coût moindre
niveau de preuve
Niveau 2 (grade B)
Niveau 3 (grade C)
groupes
exposés vs. non-exposés
cas vs. témoins
Protocole
critère de sélection
exposition
maladie
comparaison
incidence de la maladie
côtes d’exposition au
facteur (pas l’incidence)
Mesure de l’association
risque relatif
odds ratio (pas le RR)
Temporalité
Etude de la temporalité entre l’exposition et la maladie (interprétation possible d’un sens causal)
Adapté aux maladies ayant un long délai de latence (délais entre exposition et apparition de la maladie)
Difficulté de choix de témoins
Cas particulier : Cas témoins nichée dans une cohorte
Définition : les cas et les témoins sont recrutés à partir d’une cohorte déjà existante.
Avantages :
Recueil prospectif des données
Diminution des biais de sélection différentiel entre cas et témoins car les cas sont issus de la même population que les témoins.
Diminution des biais de survie sélective, on a potentiellement tous les cas incidents (exhaustivité des cas, sauf perdus de vue) comme dans une cohorte (on peut les avoir aussi dans un cas-témoins incidente…) et on a eu plus de possibilités pour limiter les perdus de vue.
Diminution des biais de mesure de l’exposition (biais de mémoire) car l’exposition a été recueillie avant la survenue de la maladie étudiée
Meilleure qualité des données, on a des données même chez les cas décédés
Inconvénient : on manque parfois de certaines données qui n’avaient pas été nécessaires pour la cohorte, obligeant à recontacter les sujets ou à explorer les dossiers médicaux de manière rétrospective.
a. Cohorte
Définition :
Étude dans laquelle un groupe de personnes (saines ou ne présentant pas de signe de la pathologie étudiée) est suivi pendant un certain temps. Les sujets choisis sont répartis en différents groupes d’exposition, au début ou pendant l’étude. Cette population à risque est suivie pendant une certaine période et les incidents sont identifiés.
Anglais : cohort study
Choix de la population :
Il existe 2 choix de population
Les cohortes en population : on sélectionne les sujets à partir d’une même population afin d’obtenir un échantillon représentatif.
Les cohortes exposées -non-exposées : on recrute 2 cohortes, 1 cohorte de sujets exposés à un facteur de risque et 1 cohorte non exposée au facteur de risque. Ces 2 cohortes auront un suivi identique.
À privilégier lorsque l’exposition est rare et la maladie assez fréquente, notamment lors d’étude des facteurs de risque professionnels
Inconvénient : ne permet pas d’étudier plusieurs expositions.
Classification :
En fonction de l’objectif :
Descriptive : déterminer l’incidence d’une maladie sans étude de causalité. La sélection des sujets en fonction de leur exposition se fait a posteriori de leur inclusion.
Synonyme : type 1, étude d’incidence.
Caractéristique : 1 seule cohorte appartient à l’épidémiologie observationnelle descriptive
Analytique : rechercher un lien et son intensité entre la survenue d’une maladie (M) et l’exposition à un facteur (F). On constitue d’emblée un groupe exposé et un groupe non exposé, avec au moins 2 cohortes.
Synonyme : type 2, cohorte exposée/non-exposée, comparative
Caractéristique : au moins 2 cohortes, appartient à l’épidémiologie observationnelle analytique
En fonction du temps : inclusion des sujets
Prospective (concourante) : inclusion des sujets au début du suivi
Rétrospective (historique) : inclusion des sujets a posteriori
Méthodologie :
Principes :
1 facteur explicatif : « l’exposition »
Soit un facteur de risque (FdR)
Soit un facteur protecteur
1 facteur à expliquer : « la maladie »
Un événement de santé
Une pathologie
2 groupes indemnes de la maladie
Les exposés : sujet ayant subi l’exposition
Les non-exposés : sujet n’ayant pas été exposé
Schéma expérimental :
Inclusion de sujets indemne de la maladie (M -) pouvant être exposés (E+) ou non exposés (E-)
Suivi des sujets dans le temps avec recueil des nouveaux cas (M+)
Comparaison de l’incidence de la maladie chez les exposés et non exposés.
Intérêt :
Avantages :
Mesure de l’incidence
Calcul du risque relatif
Exposition rare
Plusieurs maladies
Séquence chronologique et relation causale
Inconvénients :
Durée et coût
Nombreux sujets inclus
Perdus de vue
Inadapté pour maladie à faible incidence
Sélection de la population avec représentativité limitée de la population générale
Ex : La cohorte Framingham. Étude de cohorte ayant débuté en 1948 dans la ville de Framingham aux EU incluant initialement plus de 5000 sujets qui seront suivi sur 3 génération. Cette cohorte est la base de la notion de facteur de risque cardiovasculaire et de score de risque cardiovasculaire (Score de Framinghan).
Principaux biais :
Perdus de vue : cela concerne les sujets dont on ne dispose pas des données concernant le suivi.
S’ils sont répartis équitablement entre les 2 groupes (rare en pratique), on perd en puissance.
S’ils ne sont pas répartis équitablement (e nombre ou en termes de caractéristique) et on s’expose en plus à un biais d’attrition.
Si le nombre d’événements est supérieur au nombre de perdus de vue
Biais lié à un suivi différent entre les 2 groupes
Biais lié à une durée insuffisante de suivi permettant la survenue de la maladie
b. Cas témoin
Définition :
Étude qui compare le niveau d’exposition à un “agent particulier” ou à un “facteur de risque” d’un groupe de personnes présentant une maladie ou un évènement “cas”, à un autre groupe de personnes, similaire autant que faire se peut au premier groupe, mais qui n’est pas atteint par la maladie étudiée.
En gros, on compare un groupe de malade (cas) à un groupe de non malade (témoin) qui ressemble au groupe malade.
Caractéristiques :
Étude observationnelle souvent rétrospective.
Objectif :
On recherche un lien entre une maladie (M) et l’exposition antérieur à certains facteurs (F).
Méthodologie :
Sélection des cas : sujet ayant la maladie (M+). Ils doivent être représentatifs de la population étudiée. On distingue 2 méthodes de sélection :
Cas incidents : ils ne sont inclus dans l’étude que lorsqu’ils deviennent malades. C’est la méthode à privilégier.
Cas prévalents : ils sont déjà malades avant d’être inclus dans l’étude. On introduit un biais de survie sélective car on ne sélectionne que les malades ayant survécu à la date de début de l’étude.
Sélection des témoins : sujet indemne (M-) ayant des caractéristiques similaires aux cas (appariement) sauf pour les facteurs (F). Ils doivent être représentatifs de l’ensemble des sujets M- de la population source. Le tableau suivant résume les principaux types de témoins.
Mesure de l’exposition antérieure chez les cas et les témoins, sans suivi dans le temps.
Comparaison des fréquences d’exposition chez ces 2 groupes.
Témoins
Hospitalisés ou famille
Population
Accès
Facile
Difficile, coût
Motivation
Forte
Faible (en bonne santé)
Taux de réponse
Elevée
Faible
Biais de sélection
Important
Limité
Principaux biais :
De survie sélective : sélection des cas prévalents (cas déjà malades ayant survécu)
De mémorisation (sous-type classement) : les cas se rappelleront plus facilement de l’exposition. Il en résulte une majoration de l’exposition des cas et une diminution de celle des témoins.
De sélection : difficulté d’avoir des cas et témoins similaires, mauvaise définition des cas, sélection des témoins non indépendante de l’exposition.
L’appariement et l’ajustement :
Afin de limiter l’apparition de potentiels facteurs de confusion, c’est-à-dire de mesurer l’association entre l’exposition et la maladie indépendamment d’autres facteurs, on peut utiliser 2 méthodes particulières :
Appariement : méthode a priori.
Définition : méthode consistant à sélectionner des paires de sujets (cas + témoin) qui sont comparables sur certains facteurs (souvent l’âge et le sexe).
Limite : le nombre de facteurs d’appariement est limité
Ajustement : méthode statistique a posteriori permettant d’isoler mathématiquement de potentiels facteurs de confusion.
c. Principaux biais des études étiologiques
Biais
Type d’étude
Définition
Limitation du biais
Sélection
Cohorte
Sélection d’un échantillon non représentatif de la population d’intérêt
Qualité de la sélection des sujets
Cas-témoin
Mauvaise définition des cas
Sélection de témoins dépendant de l’exposition
Définition claire et standardisée des cas
Qualité de la sélection des témoins
Survie sélective
(sous-type de biais de sélection)
Uniquement dans les cas-témoins
Sélection des cas prévalents
Sélection de cas incidents
Classement
Cohorte
L’évaluateur peut être influencé s’il connaît le statut exposé/non-exposé du sujet
Evaluation des critères en aveugle
De mémoire
(sous-type de biais de classement)
Uniquement dans les cas-témoins
Les cas ont tendance à majorer leur exposition
Sujets en aveugle de la variable d’intérêt (exposition)
Évaluation standardisée, objective
De confusion
Présence de facteur de confusion
Analyse multivariée avec ajustement
Appariement si cas-témoins
D’attrition
Cohorte prospective
Perdus de vue non comptabilisés dans l’analyse
Limiter les perdus de vue
Gestion des perdus de vue
d. Critère de causalité de Bradford Hill
Une association statistique ne justifie pas causalité.
Pour affirmer une causalité, il faut que les 2 groupes ne diffèrent que par le facteur étudié et soient comparables en tout point. En pratique, il faut réaliser un essai contrôlé randomisé. Ainsi, une étude épidémiologique ne permet pas d’assurer un lien de causalité. Néanmoins, certains critères en faveur d’un lien causal ont été développés par Bardford-Hill en 1965. Les principaux critères sont :
Critères internes à l’étude :
Existence d’une association statistiquement significative entre l’exposition et la maladie.
Force de l’association: le degré d’association (RR ou OR) est très grand il faudrait un fort effet de confusion pour faire disparaitre l’association
Cohérence chronologique: Exposition au facteur doit précéder l’apparition de la maladie : permet d’exclure la relation inverse.
Relation dose-effet: si l’exposition augmente, le risque augmente : quand ce critère est présent, il est très spécifique mais il n’est pas vrai dans tous les cas.
Spécificité de l’association: si un facteur de risque est constamment relié uniquement à la maladie étudiée, il apparait vraisemblable qu’une relation causale existe : ce critère découle d’une analogie avec les maladies infectieuses mais son absence ne remet pas en question une relation causale.
Minimisation des biais de sélection, de classement et de confusion
Critères externes:
Plausibilité biologiquesur l’histoire naturelle de la maladie, la physiopathologie, la biologie
Analogie avec d’autres facteurs de risque démontrés: une hypothèse causale est renforcée par le fait qu’une relation causale analogue est connue, rendant l’hypothèse plus crédible
Reproductibilité: Constance de l’association et reproductibilité des résultats de l’étude avec d’autres équipes, en différents lieux, circonstances et temps.
Concordance avec des expérimentations in vitro et chez l’animal.
Gradients géographiques parallèles de l’exposition et de la maladie
Diminution de l’incidence de la maladie lorsque l’exposition est supprimée ou réduite.
e. Grille de lecture STROBE
Une grille de lecture STROBE (français) a été développée pour aider à analyser et écrire une étude observationnelle.
(a) Indiquer dans le titre ou dans le résumé le type d’étude réalisée en termes couramment utilisés
(b) Fournir dans le résumé une information synthétique et objective sur ce qui a été fait et ce qui a été trouvé
Introduction
Contexte/justification
2
Expliquer le contexte scientifique et la légitimité de l’étude en question
Objectifs
3
Citer les objectifs spécifiques, y compris toutes les hypothèses a priori
Méthodes
Conception de l’étude
4
Présenter les éléments clés de la conception de l’étude en tout début de document
Contexte
5
Décrire le contexte, les lieux et les dates pertinentes, y compris les périodes de recrutement, d’exposition, de suivi et de recueil de données
Population
6
(a) Étude de cohorte – Indiquer les critères d’éligibilité, et les sources et méthodes de sélection des sujets. Décrire les méthodes de suivi
Étude cas-témoin – Indiquer les critères d’éligibilité, et les sources et méthodes pour identifier les cas et sélectionner les témoins. Justifier le choix des cas et des témoins.
Étude transversale – Indiquer les critères d’éligibilité et les sources et méthodes de sélection des participants
(b) Étude de cohorte – Pour les études appariées, indiquer les critères d’appariement et le nombre de sujets exposés et non exposés.
Étude cas-témoin – Pour les études appariées, indiquer les critères d’appariement et le nombre de témoins par cas
Variables
7
Définir clairement tous les critères de résultats, les expositions, les facteurs de prédiction, les facteurs de confusion potentiels, et les facteurs d’influence. Indiquer les critères diagnostiques, le cas échéant
Sources de données/mesures
8*
Pour chaque variable d’intérêt, indiquer les sources de données et les détails des méthodes d’évaluation (mesures). Décrire la comparabilité des méthodes d’évaluation s’il y a plus d’un groupe
Biais
9
Décrire toutes les mesures prises pour éviter les sources potentielles de biais
Taille de l’étude
10
Expliquer comment a été déterminé le nombre de sujets à inclure
Variables quantitatives
11
Expliquer comment les variables quantitatives ont été traitées dans les analyses. Le cas échéant, décrire quels regroupements ont été effectués et pourquoi
Analyses statistiques
12
(a) Décrire toutes les analyses statistiques, y compris celles utilisées pour contrôler les facteurs de confusion
(b) Décrire toutes les méthodes utilisées pour examiner les sous-groupes et les interactions
(c) Expliquer comment les données manquantes ont été traitées
(d) Étude de cohorte – Le cas échéant, expliquer comment les perdus de vue ont été traités.
Étude cas-témoin – Le cas échéant, expliquer comment l’appariement des cas et des témoins a été réalisé.
Étude transversale – Le cas échéant, décrire les méthodes d’analyse qui tiennent compte de la stratégie d’échantillonnage
(e) Décrire toutes les analyses de sensibilité
Résultats
Population
13*
(a) Rapporter le nombre d’individus à chaque étape de l’étude – par exemple : potentiellement éligibles, examinés pour l’éligibilité, confirmés éligibles, inclus dans l’étude, complètement suivis, et analysés
(b) Indiquer les raisons de non-participation à chaque étape
(c) Envisager l’utilisation d’un diagramme de flux
Données descriptives
14*
(a) Indiquer les caractéristiques de la population étudiée (par exemple : démographiques, cliniques, sociales) et les informations sur les expositions et les facteurs de confusion potentiels
(b) Indiquer le nombre de sujets inclus avec des données manquantes pour chaque variable d’intérêt
(c) Étude de cohorte – Résumer la période de suivi (par exemple : nombre moyen et total)
Données obtenues
15*
Étude de cohorte – Rapporter le nombre d’évènements survenus ou les indicateurs mesurés au cours du temps
Étude cas-témoin – Reporter le nombre de sujets pour chaque catégorie d’exposition, ou les indicateurs du niveau d’exposition mesuré
Étude transversale – Reporter le nombre d’évènements survenus ou les indicateurs mesurés
Principaux résultats
16
(a) Indiquer les estimations non ajustées et, le cas échéant, les estimations après ajustement sur les facteurs de confusion avec leur précision (par exemple : intervalle de confiance de 95 %). Expliciter quels facteurs de confusion ont été pris en compte et pourquoi ils ont été inclus.
(b) Indiquer les valeurs borne des intervalles lorsque les variables continues ont été catégorisées
(c) Selon les situations, traduire les estimations de risque relatif en risque absolu sur une période de temps (cliniquement) interprétable
Autres analyses
17
Mentionner les autres analyses réalisées–par exemple : analyses de sous-groupes, recherche d’interactions, et analyses de sensibilité
Discussion
Résultats clés
18
Résumer les principaux résultats en se référant aux objectifs de l’étude
Limitations
19
Discuter les limites de l’étude, en tenant compte des sources de biais potentiels ou d’imprécisions. Discuter du sens et de l’importance de tout biais potentiel
Interprétation
20
Donner une interprétation générale prudente des résultats compte tenu des objectifs, des limites de l’étude, de la multiplicité des analyses, des résultats d’études similaires, et de tout autre élément pertinent
« Généralisabilité »
21
Discuter la « généralisabilité » (validité externe) des résultats de l’étude
Autre information
Financement
22
Indiquer la source de financement et le rôle des financeurs pour l’étude rapportée, le cas échéant, pour l’étude originale sur laquelle s’appuie l’article présenté.
*Indiquer l’information séparément pour les cas et les témoins dans les études cas-témoins et, le cas échéant, pour les groupes exposés et non exposés dans les études de cohorte et les études transversales.
E. Étude écologique
Définition :
Une étude écologique est une étude épidémiologique dans laquelle les facteurs étudiés proviennent de population et non pas d’individu, définie à partir de caractéristiques temporelles ou géographiques. Elle permet d’émettre des hypothèses avant de réaliser une étude de cohorte ou cas-témoin.
Ex : on veut étudier le cancer du poumon chez les tabagiques dans différents pays. On utilisera les données de cancer de poumon et de tabagisme dans les populations, à partir de statistiques déjà établies. On n’étudiera pas ces variables chez chaque individu.
Intérêt :
Avantage :
Permet de générer des hypothèses
Rapide, peu onéreux.
Nombreuses variables analysables et nombreux sujets recrutés
Inconvénients :
Faible niveau EBM
Erreur écologique : erreur de raisonnement dans l’interprétation de résultats statistiques au niveau individuel à partir de données agrégées.
Ex : en 1981, R. Edgar Hope-Simpson émet l’hypothèse qu’un « stimulus saisonnier » associé à l’exposition solaire pourrait expliquer le caractère saisonnier des infections à Haemophilus. Un essai interventionnel confirmera cette hypothèse en proposant une supplémentation en vitamine D à visée préventive.
F. Étude pronostique
Définition :
Type d’article dont l’objectif est de montrer qu’un facteur va influencer le devenir de la maladie, c’est-à-dire l’apparition d’un critère de jugement (« positif » comme la guérison ou « négatif » comme le décès). En identifiant certains facteurs de bon ou mauvais pronostiques, on pourra proposer une prise en charge plus adaptée.
À la différence d’une étude étiologique, on ne cherche pas à montrer un lien de causalité.
De plus, la différence entre un facteur de risque et un facteur pronostic est que le facteur de risque aura une influence sur la survenue de la maladie alors que le facteur pronostic aura une influence sur le devenir de la maladie.
Formulation de l’objectif :
On retrouve le PICO :
P : population concernée
I : facteur pronostic évalué
C : population de comparaison n’ayant pas le facteur pronostic
O : critère de jugement (maladie, guérison…)
Ex : évaluer si la dépression(I) est un facteur de mauvais pronostique, prédictif de décès (O) chez les patients ayant un cancer(P). On sous-entend par rapport aux patients non déprimés (C).
Objectifs :
Descriptif : répartition spatio-temporelle des phénomènes de santé et leurs déterminants. Ex : étude de la survie des sujets ayant un mélanome.
Explicatif : explorant des facteurs pronostiques influençant sur l’évolution d’une maladie. Cela permet d’améliorer la compréhension de la maladie pour prédire plus justement son devenir et proposer une thérapeutique en fonction du risque (définition de groupes à risque. Ex : stade TNM pour les cancers). En fonction de la capacité à maîtriser le facteur, on pourra réaliser :
soit des études interventionnelles. Ex : le repos strict est-il adapté dans la lombalgie aigüe commune ?
soit des études observationnelles. Ex : le tabac augmente-t-il le risque de parodontopathie ?
F bis. Analyse de survies
Les études de survie ne correspondent pas à un type d’étude en particulier comme les études de cohorte ou cas-témoins. Ce type d’étude témoigne plus de l’utilisation d’une méthode statistiques particulière : l’analyse de survie. Ces méthodes permettent d’étudier le délai de survenue d’un événement dont la survenue n’est pas constante.
Initialement utilisées pour étudier la survie des patients (délais de survenue d’un décès), ces méthodes permettent d’étudier plus généralement des données dites « censurées à droite », c’est-à-dire des événements qualitatifs binaires (présence/absence) survenant au cours du temps de manière non récurrente. Ex : décès, métastase, récidive, maladie…
Ce type d’étude nécessite le recueil de données particulières :
En rapport avec la date :
Date d’origine (DO) : date d’entrée du patient dans l’étude (ex : au moment de la randomisation, diagnostic, opération…)
Date de point (DP) : date butoir pour laquelle on cherchera à connaître l’état de chaque sujet.
Date de dernière nouvelle (DDN) : date la plus récente à laquelle on a pu
avoir des nouvelles du sujet quant au critère étudié (décès/survie…). Elle correspond à la date de décès pour les sujets décédés et à la date de la dernière consultation pour les sujets vivants.
En rapport avec l’intervalle de temps entre la DO, DP et DDN :
Temps de participation (TP) : délai correspondant à toute la durée de surveillance du sujet. Elle permet de construire la courbe de survie.
Si DDN < DP alors TP = DDN – DO
Si DDN > DP alors TP = DP – DO
Recul : délai écoulé entre la date d’origine et la date de point. Les reculs minimum et maximum d’une série de sujets participant à une étude définissent donc « l’ancienneté » de la série.
Recul = DP – DO
En rapport avec le sujet :
Décédé ou survivant à la DP
Si le sujet est vivant à la DP, on dit que les données sont censurées à droite. Les sujets peuvent être qualifiés de :
Perdu de vue : on ne connaît pas son état à la DP mais toujours vivant à la DDN.
Exclu-vivant : vivant à la DP.
Interprétations :
Les études pronostiques utilisent des données censurées.
Cette particularité implique des analyses statistiques particulières spécifiques aux variables censurées.
G. Étude interventionnelle
Définition :
Mise en œuvre systématique d’un programme (visant par exemple la promotion de la santé ou la prévention des maladies, ou encore une intervention médicale), en direction d’individus ou d’une population, en vue de mesurer les résultats de ce programme à des fins de recherche.
En gros, cherche l’impact d’une intervention (médicament, chirurgie, programme…) sur un état (maladie, guérison, connaissance…).
En anglais : intervention study
Formulation de l’objectif :
En reprenant le PICO :
P : population concernée
I : Intervention
C : groupe contrôle
O : critère de jugement (état)
Ex : évaluation de l’efficacité à 30 jours (O) du paracétamol (I) par rapport à un placebo (C) dans la lombalgie aigüe (O).
Type d’étude :
ECR (Essai contrôlé randomisé) : les sujets sont tirés au sort quant à l’allocation de l’intervention. C’est la méthode de référence.
Étude pragmatique : étudie le bénéfice de l’intervention dans des conditions pratiques (« in vivo »).
Étude explicative : étudie l’efficacité théorique de l’intervention dans des conditions idéales (« in vitro »)
ECnR (Essai contrôlé non randomisé) :
Étude ici-ailleurs : on compare 2 groupes distincts géographiquement, l’un reçoit l’intervention, l’autre pas. Risque de biais de sélection.
Étude avant-après : on compare un même groupe avant et après une intervention. Risque de biais de confusion notamment dû à l’évolution naturelle de la maladie.
Comparaison étude pragmatique et explicative :
Essai pragmatique
Essai explicatif
Objectif
Documenter le bénéfice qu’apportera le traitement aux patients qui seront traités en pratique
Evaluer et expliquer l’effet du traitement dans des conditions très précises
Finalité
Pratique : valider une pratique médicale
Cognitive : connaissance et explication
Population visée
Représentative des futurs patients qui seront traités
La plus homogène possible afin de contrôler au maximum l’influence d’autres facteurs
Critères de sélection
Simples
Correspondant aux critères utilisés en pratique pour décider de traiter
Mesurés par des examens de routine
Précis
Définissant parfaitement les patients ciblés
Mesurés par des techniques sophistiquées
Pertinence clinique
Forte
Faible
Rappel des grandes phases de développement d’un médicament.
En cours de rédaction
Choix du comparateur :
Pour choisir le groupe de comparaison, on a 2 choix en fonction de la pathologie :
Soit on dispose d’un traitement efficace, le comparateur sera le traitement de référence
Soit on de dispose pas de traitement efficace, on utilisera un placebo
Taille d’effet :
Risque de base : A = survenue (%) du critère principal dans le groupe contrôle (placebo ou Tt de référence).
Risque avec traitement : B = survenue (%) du critère principal pour le Tt expérimental
Réduction absolue du risque (RAR) : RAR = A-B
Réduction Relative du Risque (RRR) : RRR = (A-B) / A
Nombre de sujets Nécessaires à Traiter (NNT, « number needed to treat ») :
définition: nombre de sujets à traiter pour éviter la survenue d’un évènement sur une durée donnée.
Calcul : NNT = 1 / RAR = 1 / (A-B)
ex: A = 20 % et B = 10 %: NST = 1/0.01 = 10 patients
Interprétation : « il faut traiter 10 patients pendant 1 an pour éviter 1 décès »
Différence de risques : il correspond au nombre d’événements évités grâce au nouveau traitement.
Calcul: à partir du bénéfice absolu qui représente la différence des risques absolus.
= incidence de l’événement dans le groupe 1 – incidence dans le groupe B
1. Plan expérimental
a. Supériorité, équivalence et non-infériorité
Lors d’un essai de supériorité, l’absence de différence significative entre les 2 interventions ne permet pas de déterminer s’ils sont comparables. Pour cela on a développé un nouveau type d’essai permettant de déterminer si 2 traitements sont équivalents ou si le nouveau médicament n’est pas inférieur à celui de référence.
Dans les essais interventionnels, on distingue 3 grands types de schémas expérimentaux :
Essai de supériorité :
Objectif : « le traitement A est-il supérieur au traitement B ou le traitement B est-il supérieur au traitement A ? » (si analyse bilatérale)
Soit ∆ : la différence d’efficacité entre les 2 traitements. ∆ = µA – µB
On pose les hypothèses :
H0 : efficacité du traitement A (µA) = efficacité du traitement B (µB),
la différence d’efficacité entre les 2 traitements : |∆| = |µA – µB| = 0
H1 : |∆| ≠ 0
Interprétation : si la différence d’efficacité est non significative, on peut supposer que l’un des traitements n’est pas supérieur à l’autre mais pas que les traitements sont équivalents.
Essai d’équivalence :
Objectif : « le traitement A est-il équivalent au traitement B et vis-versa ? »
Soit ∆L: la borne d’équivalence. C’est la plus petite différence cliniquement pertinente.
On veut que |µA – µB| < ∆L
On pose les hypothèses
H0 : ∆ ≤ ∆L ou ∆ ≥ ∆L (c’est la non-équivalence)
H1 : -∆L < ∆ < +∆L (c’est l’équivalence)
Interprétation : si la différence comprend la borne d’équivalence, on considère que les traitements sont équivalents.
Essai de non-infériorité :
Objectif : « le traitement A est-il au moins aussi efficace que le traitement B ? »
Soit ∆L : la borne de non-infériorité
On veut que µA – µB > -∆L
On pose les hypothèses (analyse unilatérale) :
H0 : ∆ ≤ -∆L (le traitement A est < au traitement B)
H1 : ∆ > -∆L (le traitement A est ≥ au traitement B)
Interprétation : si la différence comprend la borne de non-infériorité, on considère que le traitement A est au moins aussi efficace que le traitement B.
Pourquoi faire un essai de non-infériorité plutôt qu’un essai de supériorité ? (ECN 2012)
L’analyse unilatérale et pas bilatérale permet de diminuer le nombre de sujets nécessaire (NSN) permettant d’augmenter la puissance pour un même nombre de sujets.
Lorsqu’il est difficile de montrer une amélioration du traitement de référence (chirurgie, traitement déjà très efficace)
Lorsque le nouveau traitement a d’autres avantages en termes de coût (prix), de tolérance (moins d’effets secondaires) ou de facilité d’utilisation (per os plutôt qu’injectable), rapport bénéfice-risque.
Borne d’équivalence et de non-infériorité :
En réalité, il est impossible de prouver que les 2 traitements sont parfaitement équivalents en termes d’efficacité. On va s’accorder une petite marge d’erreur (classique en statistique…) et montrer qu’ils ne sont pas trop différents. Pour cela on définit une borne d’équivalence ou de non-infériorité. Ainsi, si la différence entre ces 2 traitements (son intervalle de confiance à 95 %) comprend cette borne, on pourra conclure à l’équivalence ou la non-infériorité.
Comment distinguer un essai de supériorité d’un essai de non-infériorité ?
En regardant dans la partie analyse statistique :
Si supériorité : analyse souvent bilatérale avec une différence attendue
Si non-infériorité : analyse unilatérale avec une borne de non-infériorité
Pourquoi réaliser un essai de non-infériorité plutôt qu’un essai d’équivalence ?
En cas d’équivalence, la zone de significativité est plus étroite nécessitant un nombre de sujets nécessaires plus important.
De plus, dans les essais de non-infériorité, le nouveau médicament peut être plus efficace.
On pratique, les essais de non-infériorité sont largement dominants dans la recherche.
b. Cross-over et bras parallèle
Définition : essai durant lequel les sujets vont être leur propre témoin et recevoir les 2 traitements.
La randomisation détermine l’ordre d’attribution des traitements.
Les 2 traitements sont espacés par une période de wash-out (lavage) permettant d’effacer l’effet du 1er traitement, appelé effet rémanent (carry-over effect)
Avantages :
Amélioration de la comparabilité des groupes en diminuant la variabilité interindividuelle
Amélioration de la puissance car on a besoin de 2 fois moins de sujets qu’avec une étude en groupe parallèle
Conditions :
Maladie chronique stable dans le temps afin que l’amélioration observée ne soit pas influencée par l’évolution naturelle de la maladie (ex : asthme, migraine, épilepsie…)
Les traitements évalués doivent être des traitements symptomatiques et doivent agir de manière non définitive(ex : la fièvre est adaptée mais pas la chirurgie)
Le critère de jugement peut être répété (ex : la douleur est adaptée mais pas la mortalité)
Période de wash-out
2. Étude de dépistage
Définition :
Étude interventionnelle qui vise à identifier une maladie ou un haut risque pathologique dans une population a priori en bonne santé
Formulation de l’objectif :
En reprenant le PICO :
P : population concernée
I : procédure de dépistage
C : population dépistée
O : critère de jugement (la maladie)
Ex : évaluation de l’efficacité de dépistage du frottis cervico-vaginale (I) chez les femmes de plus de 25 ans (P) en termes de mortalité (O). On sous-entend que l’on compare à une population non dépistée (C).
Types de dépistage :
Opportuniste ou individuel : sur proposition du médecin ou à la demande du patient
Organisé ou de masse : mis en place par les pouvoirs publics
Type d’étude :
On va privilégier une étude contrôlée randomisée. L’intervention correspond à la procédure de dépistage.
Intérêts :
Avantages :
Diminution de la morbi-mortalité
Traitements moins lourds
Réassurances des sujets négatifs
Inconvénients :
Faux négatif : fausse réassurance
Faux positif : exploration inutile
Iatrogénie des tests de dépistage ou des explorations
Allongement de la durée de la maladie (diagnostic plus tôt)
Quand réaliser un dépistage organisé ?
Un dépistage est dit organisé lorsqu’il répond à l’ensemble des dix critères de l’Organisation mondiale de la santé (OMS) :
Problème majeur de santé publique (sévérité, impact socio-économique, fréquence)
Un traitement efficace est disponible
Des moyens de diagnostic et de traitement sont disponibles
L’histoire naturelle de la maladie est bien connue
La maladie doit pouvoir être détectée pendant sa phase de latence asymptomatique ou au tout début des symptômes.
Le test de dépistage doit être simple et bien accepté par la population.
Il existe un test de dépistageperformant (et le programme de dépistage est efficace)
Il n’existe pas de facteur de risque accessible à la prévention primaire.
Le choix des sujets qui recevront un traitement est opéré selon des critères préétablis.
Le coût de la recherche des cas (y compris les frais de diagnostic et de traitement des sujets reconnus malades) n’est pas disproportionné par rapport au coût global des soins médicaux.
La recherche des cas est un processus continu et elle n’est pas considérée comme une opération exécutée « une fois pour toutes ».
3. Grille de lecture CONSORT
Une grille de lecture CONSORT (français et son flow chart) a été développée pour aider à analyser et écrire une étude randomisée.
Identification en tant qu’“essai randomisé“ dans le titre
1b
Résumé structuré du plan d’essai, méthodes, résultats et conclusions (pour une aide spécifique voir CONSORT pour Abstract)
INTRODUCTION
Contexte et objectifs
2a
Contexte scientifique et explication du bien-fondé
2b
Objectifs spécifiques et hypothèses
MÉTHODES
Plan de l’essai
3a
Description du plan de l’essai (tel que : groupes parallèles, plan factoriel) en incluant les ratios d’allocation
3b
Changements importants de méthode après le début de l’essai(tel que les critères d’éligibilité), en expliquer la raison
Participants
4a
Critères d’éligibilité des participants
4b
Structures et lieux de recueil des données
Interventions
5
Interventions pour chaque groupe avec suffisamment de détails pour pouvoir reproduire l’étude, en incluant comment et quand elles ont été véritablement conduites
Critères de jugement
6a
Critères « à priori » de jugement principal et secondaires entièrement définis, en incluant comment et quand ils ont été évalués
6b
Changement quelconque de critères de jugement après le début de l’essai, en expliquer la raison
Taille de l’échantillon
7a
Comment la taille de l’échantillon a-t-elle été déterminée ?
7b
Quand cela est applicable, explication des analyses intermédiaires et des règles d’arrêt
RANDOMISATION
Production de la séquence
8a
Méthode utilisée pour générer la séquence d’allocation par tirage au sort
8b
Type de randomisation, en incluant les détails relatifs à une méthode de restriction (comme par ex. : par blocs, avec la taille des blocs)
Mécanisme d’assignation secrète
9
Mécanisme utilisé pour mettre en œuvre la séquence d’allocation randomisée (comme par exemple : l’utilisation d’enveloppes numérotées séquentiellement), en décrivant chaque mesure prise pour masquer l’allocation jusqu’à l’assignation des interventions.
Mise en oeuvre
10
Qui a généré la séquence d’allocation, qui a enrôlé les participants et qui a assigné les participants à leurs groupes
Aveugle
11a
Au cas où, décrire qui a été en aveugle après l’assignation des interventions (par exemple, les participants, les administrateurs de traitement, ceux qui évaluent les résultats) et comment ont-ils été empêchés de savoir
11b
Si approprié, description de la similitude des interventions
Méthodes statistiques
12a
Méthodes statistiques utilisées pour comparer les groupes au regard des critères de jugement principal et secondaires
12b
Méthodes utilisées pour des analyses supplémentaires, telles que des analyses de sous-groupes ou des analyses ajustées
RESULTATS
Flux des participants (un diagramme est fortement conseillé)
13a
Pour chaque groupe, le nombre de participants qui ont été assignés par tirage au sort, qui ont reçu le traitement qui leur était destiné, et qui ont été analysés pour le critère de jugement principal.
Pour chaque groupe, abandons et exclusions après la randomisation, en donner les raisons
Recrutement
14a
Dates définissant les périodes de recrutement et de suivi
14b
Pourquoi l’essai a-t-il pris fin ou a été interrompu
Données initiales
15
Une table décrivant les caractéristiques initiales démographiques et cliniques de chaque groupe
Effectifs analysés
16
Nombre de participants (dénominateur) inclus dans chaque analyse en précisant si l’analyse a été faite avec les groupes d’origine
Critères de jugement et estimations
17a
Pour chaque critère de jugement principal et secondaire, donner les résultats pour chaque groupe, et la taille estimée de l’effet ainsi que sa précision (comme par ex. : intervalles de confiance à 95 %)
17b
Pour les variables binaires, une présentation de la taille de l’effet en valeurs absolues et relatives est recommandée
Analyses accessoires
18
Résultats de toute analyse supplémentaire réalisée, en incluant les analyses en sous-groupes et les analyses ajustées, et en distinguant les analyses spécifiées à priori des analyses exploratoires
Risques
19
Tous les risques importants ou effets secondaires inattendus dans chaque groupe (pour un conseil détaillé voir ‘CONSORT for harms’)
DISCUSSION
Limitations
20
Limitations de l’essai, en tenant compte des sources de biais potentiels ou d’imprécision, et au cas où, en tenant compte de la multiplicité des analyses
“Généralisabilité”
21
“Généralisabilité“ (validité externe, applicabilité) des résultats de l’essai
Interprétation
22
Interprétations/conclusions cohérentes avec les résultats, en tenant compte du ratio-bénéfices/risques et de possibles autres faits pertinents
INFORMATIONS SUPPLEMENTAIRES
Enregistrement
23
Numéro d’enregistrement de l’essai en précisant le registre utilisé
Protocole
24
Où le protocole complet de l’essai peut-il être consulté, si possible
Financement
25
Sources de financement et autres ressources (par ex. : fourniture de médicaments), rôle des donateurs
Matayong S, Jetwanna KW, Choksuchat C, Choosawang S, Trakulmaykee N, Limsuwan S, et al. IoT-based systems and applications for elderly healthcare: a systematic review. Univ Access Inf Soc [Internet]. 2023 Nov 2 [cited 2024 Oct 8]; Available from: https://doi.org/10.1007/s10209-023-01055-1
1.
Ferrara M, Bertozzi G, Di Fazio N, Aquila I, Di Fazio A, Maiese A, et al. Risk Management and Patient Safety in the Artificial Intelligence Era: A Systematic Review. Healthcare [Internet]. 2024 Jan [cited 2024 Oct 8];12(5):549. Available from: https://www.mdpi.com/2227-9032/12/5/549
1.
Kumar Y, Koul A, Singla R, Ijaz MF. Artificial intelligence in disease diagnosis: a systematic literature review, synthesizing framework and future research agenda. J Ambient Intell Human Comput [Internet]. 2023 Jul 1 [cited 2024 Oct 8];14(7):8459–86. Available from: https://doi.org/10.1007/s12652-021-03612-z
Glenn JK, Goldman J. Task delegation to physician extenders--some comparisons. Am J Public Health. 1976 Jan;66(1):64–6.
1.
Heerspink HJL, Stefánsson BV, Correa-Rotter R, Chertow GM, Greene T, Hou FF, et al. Dapagliflozin in Patients with Chronic Kidney Disease. N Engl J Med [Internet]. 2020 Oct 8 [cited 2023 Nov 21];383(15):1436–46. Available from: https://doi.org/10.1056/NEJMoa2024816
1.
Heerspink HJL, Stefánsson BV, Correa-Rotter R, Chertow GM, Greene T, Hou FF, et al. Dapagliflozin in Patients with Chronic Kidney Disease. N Engl J Med [Internet]. 2020 Oct 8 [cited 2023 Nov 21];383(15):1436–46. Available from: https://doi.org/10.1056/NEJMoa2024816
Frappé P, Druais PL, Petersen W, Association française des jeunes chercheurs en médecine générale (Lyon). Initiation à la recherche. 2018.
1.
Becker J. Active Allyship. Public Services Quarterly. 2017 0;13(1):27–31.
1.
Bucher S, Maury A, Rosso J, de Chanaud N, Bloy G, Pendola-Luchel I, et al. Time and feasibility of prevention in primary care. Fam Pract. 2017;34(1):49–56.
1.
Le Lous M, De Chanaud N, Bourret A, Senat MV, Colmant C, Jaury P, et al. Improving the quality of transvaginal ultrasound scan by simulation training for general practice residents. Adv Simul (Lond). 2017;2:24.
1.
Le Lous M, De Chanaud N, Bourret A, Senat MV, Colmant C, Jaury P, et al. Improving the quality of transvaginal ultrasound scan by simulation training for general practice residents. Advances in Simulation [Internet]. 2017 Nov 21 [cited 2018 Mar 10];2:24. Available from: https://doi.org/10.1186/s41077-017-0056-z
1.
de Chanaud N, Boukari L, Gérin M, Mekinian A, Fain O. [Typhoid fever. Sore throat, macrophage activation syndrome and glomerulonephritis]. Rev Prat. 2012 Oct;62(8):1056.
1.
de Chanaud N, Sidrokiewitcz S. Comparaison de l’efficacité d’une évaluation gériatrique en soins primaires réalisée par une infirmière ou un médecin généraliste. D’après une communication de : Ferrat E, Attali C, Audureau E. Exercer. 2017;132:160–1.
1.
Neuman MD, Goldstein JN, Cirullo MA, Schwartz JS. Durability of class I American College of Cardiology/American Heart Association clinical practice guideline recommendations. JAMA. 2014 May;311(20):2092–100.
1.
Bucher S, Maury A, Rosso J, de Chanaud N, Bloy G, Pendola-Luchel I, et al. Time and feasibility of prevention in primary care. Fam Pract. 2017 Feb;34(1):49–56.
1.
Alderson LJH, Alderson P, Tan T. Median life span of a cohort of National Institute for Health and Care Excellence clinical guidelines was about 60 months. J Clin Epidemiol. 2014 Jan;67(1):52–5.
Makary MA, Daniel M. Medical error—the third leading cause of death in the US. BMJ [Internet]. 2016 May 3 [cited 2017 Mar 23];i2139. Available from: http://www.bmj.com/lookup/doi/10.1136/bmj.i2139
1.
Makary MA, Daniel M. Medical error—the third leading cause of death in the US. BMJ [Internet]. 2016 May 3 [cited 2017 Mar 23];353:i2139. Available from: http://www.bmj.com/content/353/bmj.i2139
1.
Michel P, Quenon JL, Djihoud A. Les événements indésirables graves liés au soins observés dans les établissements de santé : premiers résultats d’une étude nationale. Etudes et Résultats [Internet]. 2005 [cited 2017 Mar 23];(398). Available from: http://social-sante.gouv.fr/IMG/pdf/ENEIS_1.pdf
1.
Chaleix M, IZOTTE-KRET M, Régine BS, QUENON JL, OLIER L. Les événements indésirables graves associés aux soins observés dans les établissements de santé - Résultat des enquêtes nationales menées en 2009 et 2004. Solidarité Santé [Internet]. 2010 [cited 2017 Mar 23];(17). Available from: http://www.guidedesdemarches.com/DOCS/DOC123.pdf
1.
Stewart M. Towards a global definition of patient centred care. BMJ [Internet]. 2001 Feb 24 [cited 2017 Jan 5];322(7284):444–5. Available from: http://www.bmj.com/content/322/7284/444
Jegu J, Braun M, Pelaccia T. Quelle est la motivation des étudiants en médecine pour l’apprentissage de la lecture critique d’article ? Pédagogie Médicale [Internet]. 2014 [cited 2017 Jan 5];15(4):259–67. Available from: http://www.pedagogie-medicale.org/10.1051/pmed/2014019
1.
Association pédagogique nationale pour l’enseignement de la thérapeutique (France), Durocher A. LCA-UE 12: formation générale à la recherche : iECN 2016, 2017, 2018 : cours + entraînement. Paris: Med-Line éditions; 2015.
Moak JH, Larese SR, Riordan JP, Sudhir A, Yan G. Training in transvaginal sonography using pelvic ultrasound simulators versus live models: a randomized controlled trial. Acad Med. 2014 Jul;89(7):1063–8.
1.
Dorton LH, Lintzenich CR, Evans AK. Simulation model for tracheotomy education for primary health-care providers. Ann Otol Rhinol Laryngol. 2014 Jan;123(1):11–8.
1.
Sukalich S, Elliott JO, Ruffner G. Teaching medical error disclosure to residents using patient-centered simulation training. Acad Med. 2014 Jan;89(1):136–43.
1.
Prislin MD, Fitzpatrick CF, Lie D, Giglio M, Radecki S, Lewis E. Use of an objective structured clinical examination in evaluating student performance. Fam Med. 1998 May;30(5):338–44.
1.
Harris JM, Sun H. A randomized trial of two e-learning strategies for teaching substance abuse management skills to physicians. Acad Med. 2013 Sep;88(9):1357–62.
1.
Brown RS, Graham CL, Richeson N, Wu J, McDermott S. Evaluation of medical student performance on objective structured clinical exams with standardized patients with and without disabilities. Acad Med. 2010 Nov;85(11):1766–71.
Hureaux J, Urban T. La simulation en pneumologie : rationnel, données de la littérature et perspectives. Revue des Maladies Respiratoires [Internet]. 2015 [cited 2016 Sep 29];32(10):969–84. Available from: http://linkinghub.elsevier.com/retrieve/pii/S0761842515001874
Poelman T. Rapport de hasards (hazard ratio, HR) et risque relatif. Minerva [Internet]. 2013 [cited 2016 Sep 29];12(10):129. Available from: file:///Users/Nico/Downloads/12_10_129-129.pdf
Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.