Les études quantitatives des articles médicaux

Les exercices

Cliquez pour afficher

Exercice N°1 – À la recherche du critère pertinent… pour les patients
Exercice N°3 – Quand deux précautions valent mieux qu’une
Exercice N°4 – Distinguer évaluation de l’efficacité et évaluation de l’utilité
Exercice N°8 – Gare aux extrapolations
Exercice N°9 – Ne pas confondre observer et expérimenter
Exercice N°15 – Oeufs brouillés
Exercice N°19 – Ne pas fausser la balance bénéfices-risques
Exercice N°21 – Un assemblage fragile
Exercice N°28 – Gérer l’incertitude dans l’intérêt des patients
Exercice N°34 – Rapports de vraisemblance
Exercice N°36 – Efficacité en poupées russes
Exercice N°38 – Pas de preuves sans essai ?
Exercice N°40 – Un million en quatre semaines
Exercice N°45 – Ne pas prendre des vessies pour des lanternes

Je me permets de vous remettre l’algorithme pour vous aider :

Algorithme des études quantitatives

A. Cas, série de cas

En anglais, case report ou case series, correspond à la description détaillée d’un cas ou de plusieurs cas cliniques d’intérêt. Cette description comprend souvent les symptômes, les signes, le diagnostic, le traitement et le suivi.

Classification :

Le BMJ Case Reports propose de les classer en différentes catégories :

Une association rare entre une pathologie et des symptômes
Présentation inhabituelle d’une pathologie commune
Rappel d’une leçon clinique importante
Apprentissage suite à une erreur
Découverte d’un nouveau lien entre la pathogénèse d’une maladie ou d’un effet secondaire
Nouvelle ou maladie rare
Éclatement d’un mythe
Nouvelle procédure diagnostique
Nouveau traitement
Une image
La santé globale
Conséquence inattendue (positive ou négative) dont effet secondaire médicamenteux

Intérêt :

Avantages :
- Découverte de nouvelles maladies
  - Ex : VIH
- Découverte de nouveaux effets secondaires médicamenteux.
  - Ex : William McBride décrivit pour la 1^ère fois une série de cas de malformation fœtale chez des patientes ayant reçu du thalidomide dans le Lancet de 1961.
- Découverte de nouveau traitement
  - Ex : utilisation du propranolol dans l’hémangiome infantile.
- Amélioration de la connaissance des symptômes fréquents d’une maladie rare et de symptômes rares d’une maladie fréquente.
- Formation médicale : apprentissage par l’étude de cas clinique
- Publication rapide.
Désavantage :
- Qualité méthodologique souvent faible.
  - Ex : sur 1316 cas de médecine d’urgence publiés dans 4 journaux, la moitié manquaient d’information sur le traitement que suivait le patient.
- Très faible niveau EBM
- Pas de test statistique, nombreux biais

Publication :

Certains journaux sont spécialisés dans la publication de case report (Journal of Medical Case Reports, BMJ Case Reports…), d’autres journaux publient quelques cas (La Revue du Praticien, The Lancet…).

Incitez vos étudiants à en publier. Ça peut être rentable en termes d’impact factor et la démarche va stimuler l’étudiant pour faire de la recherche et publier (en plus c’est sympa d’avoir son nom sur PubMed…).

Guide de rédaction.

Des recommandations existent afin de rédiger un case report de qualité.

Vous pouvez les retrouver sur le site d’Equator.

B. Étude transversale

Définition :

Étude qui mesure à un même moment la maladie ou le nombre de cas existants (prévalence de la maladie) et le degré d’exposition (6). On parle souvent de « photographie » à un moment donné.

Synonyme : étude de prévalence ou « survey »

S’oppose aux études longitudinales.

Objectif :

Principalement descriptive, elle étudie la distribution d’un paramètre ou la prévalence d’une exposition ou d’une maladie.

Rarement étiologique lorsqu’on étudie les marqueurs de l’état de santé pour lesquels la prévalence est un bon indicateur et dont l’étude ne modifiera pas le comportement vis-à-vis de l’exposition étudiée

Principe :

Choix d’un seul échantillon représentatif de la population générale.
Recueil de la maladie et des expositions à un instant donné
Pas de suivi dans le temps

Intérêt :

Avantage :
- Calcul de la prévalence et du risque relatif
- Rapide : pas de suivi dans le temps (évite les perdus de vue)
- Coût faible (pas de suivi)
- Exploratoire, permettant de générer des hypothèses.
Inconvénients :
- Association mais pas causalité : ne détermine pas si la maladie est apparue après l’exposition.
- Pas d’incidence : manque la notion de durée.
- Nombreux biais

Principaux biais :

Biais de confusion : peu de contrôle sur de potentiels facteurs de confusion.
Biais de prévalence : les cas chroniques restent longtemps des cas prévalents.
Biais de sélection : « healthy worker effect »…

C. Étude diagnostique

Définition : une étude diagnostique permet d’évaluer un nouvel outil diagnostique au niveau de ses performances diagnostiques ainsi que de l’amélioration du devenir des sujets diagnostiqués.

En anglais : Fiabilité = reliability, Reproducibility, Consistency, Stability, Repeatability.

NB : On parle souvent uniquement de « test » diagnostique mais il existe plusieurs « outils » diagnostiques tels que

Ex : performance des D-Dimères dans le diagnostic de l’embolie pulmonaire.
Score, algorithme. Ex : performance du score de Wells dans le diagnostic de la thrombose veineuse profonde.
Signe clinique. Ex : performance du signe de Homans dans le diagnostic de la thrombose veineuse profonde des membres inférieurs.

Objectif :

Performance (exactitude, validité) : capacité d’un test de différencier des malades et non malades en fonction s’ils ont le test positif ou négatif.
Fiabilité (reproductibilité) : Capacité d’un examen ou d’un test de donner les mêmes résultats lorsqu’il est répété à plusieurs reprises (et donc à différents moments) sur les mêmes sujets et exactement dans les mêmes conditions.
Coût
Acceptabilité

Avant de pouvoir utiliser un outil/test diagnostique dans la pratique courante, il faut démontrer :

Qu’il a de bonnes performances diagnostiques et qu’il est fiable.
Qu’il améliore le devenir des sujets ayant bénéficié du test avec un coût acceptable.

Formulation de l’objectif :

On retrouve le fameux PICO :

P : population étudiée par le test
I : nouvel outil diagnostique
C : outil diagnostique de référence
O : critère de jugement

Ex : évaluer la performance du test hémoccult® (I) par rapport à la coloscopie (C) pour le dépistage du cancer colorectal (O) chez les sujets de plus de 50 ans (P).

Type d’étude :

Les principaux types d’études retrouvés sont :

Transversale : si on n’a pas besoin de suivre les sujets dans le temps
Cohorte : si on veut analyser la survenue d’un événement dans le temps
Interventionnel : lorsqu’on cherche une influence du test sur le devenir du sujet.

Choix du test de référence :

Définition : test de référence permettant d’identifier véritablement les malades et les non-malades, qui va permettre d’évaluer la performance du nouveau test.

En anglais : gold standard.

Méthodologie :

Schéma expérimental :
- Soit on a un test de référence (gold standard) : étude observationnelle transversale.
  - On choisit un échantillon d’individu qui vont subir les 2 tests : gold standard + nouveau test. Ex : coloscopie vs hemoccult dans le dépistage du cancer colorectal.
- Soit on n’a pas de test de référence :
  - Et on veut prédire la survenue d’un événement : étude de cohorte
  - Et on recherche une influence du test sur le devenir du sujet : étude interventionnelle.

a. Performance

La performance peut se décomposer en 2 catégories :

Performance intrinsèque :
- Définition : c’est la capacité informative propre du test, ne dépendant pas de la prévalence de la maladie.
- On l’estime grâce à la sensibilité (Sn), la spécificité (Sp), le rapport de vraisemblance positif (RVP) et négatif (RVN)
Performance extrinsèque :
- Définition : c’est la capacité informative du test en fonction de ses caractéristiques intrinsèques et un contexte d’utilisation (la prévalence = probabilité prétest)
- On l’estime grâce à la valeur prédictive positive (VPP) et négative (VPN)

i. Caractéristiques intrinsèques

On va déterminer si notre test a de bonnes capacités discriminantes M-/M+. Ces indicateurs sont assez théoriques car on ne prend pas en compte le contexte (de la prévalence).

Pour cela, il faut établir le tableau de contingence. C’est un tableau à double entrée permettant d’estimer la dépendance entre 2 caractères. Ici, on choisit comme variable le statut malade (M+ ou M-) et le résultat du test (T+ ou T-).

	T+	T-
M+	VP	FN
M-	FP	VN

Ce tableau nous permet de déterminer 4 catégories de sujets :

VP : Vrai Positif. Sujet malade ayant le test positif
FN : Faux Négatif. Sujet malade ayant le test négatif
FP : Faux Positif. Sujet sain ayant le test négatif
VN : Vrai Négatif. Sujet sain ayant le test négatif.

Pour qu’un test diagnostique soit de bonne qualité, il faut qu’on ait beaucoup de VP et VN et peu de FP et FP. On va pouvoir étudier la relation entre ces 4 catégories grâce au calcul de différents paramètres.

Sensibilité :
- Définition :
  - Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement des individus affectés par une maladie visée ou par un problème de santé.
  - Probabilité que le test soit positif (T+) chez les personnes malades (M+) = p (T+/M+)
- Calcul :
  - Sn = VP/(VP+FN)
- Rmq : VP + FN = nombre total de sujets malades
Spécificité
- Définition :
  - Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement les individus non affectés par une maladie visée ou par un problème de santé.
  - Probabilité que le test sera négatif (T-) parmi les personnes non malades (M-) = p (T-/M-)
- Calcul :
  - Sp = VN/(VN+FP)
- Rmq : VN + FP = nombre total de sujets non malades
Efficacité diagnostique d’un test
- Définition :
  - Proportion de résultats corrects (VP et VN) dans l’ensemble des résultats du test.
- Calcul :
  - E = (VN+VP)/(VN+VP+FN+FP)
- Interprétation :
  - Valeur comprise entre 0 et 1
  - 0 : test inefficace
  - 1 : test parfait
Indice de Youden
- Définition :
  - Indice permettant une mesure globale de la performance statistique d’un test
- Calcul :
  - Y = Sn + Sp – 1
- Interprétation :
  - Valeur comprise entre 0 et 1
  - 0 : test inefficace
  - 1 : test parfait

Courbe ROC
- Définition : Un outil graphique permettant de représenter la capacité d’un test à discriminer entre la population des malades et des non malades.
- Objectifs :
  - Évaluer la performance globale d’un test diagnostique (à variable de réponse quantitative continue)
  - Comparer 2 tests diagnostiques
  - Définir le seuil de validité optimal d’un test diagnostique.

Rapport de vraisemblance :

Définition : estimation du rapport entre la probabilité d’avoir un test positif (ou négatif) chez les sujets malades et celui d’avoir un test positif (ou négatif) chez les sujets sains

Autrement dit, il correspond à la probabilité post test de la maladie par rapport à sa prévalence.

Rapport de vraisemblance positif (RVP ou RV+) :
- Définition : combien de fois est-il plus vraisemblable d’être M+ sachant qu’on a le T+ ?
- Calcul : RVP = Se/(1-Sp)
- Rmq :
  - Le sujet a RVP fois plus de risque d’avoir un test positif s’il est malade que s’il ne l’est pas.
  - Plus RVP est élevé, plus on aura confiance dans le résultat d’un test positif pour confirmer un diagnostic.
Rapport de vraisemblance négatif (RVN ou RV-) :
- Définition : combien de fois est-il plus vraisemblable d’être M- sachant qu’on a le T- ?
- Calcul : RVN = (1-Se)/Sp
- Rmq :
  - Le sujet a RVN fois plus de chance d’avoir un test négatif s’il est malade que s’il ne l’est pas.
  - Plus RVN est élevé, plus on aura confiance dans le résultat d’un test négatif pour éliminer un diagnostic.
Interprétation : c’est un ratio qui s’interprète comme une RR
Nomogramme de Fagan:
- Nomogramme = outil graphique de calcul constitué de courbes graduées entre lesquelles on place une règle. Le résultat de l’opération se lit au croisement de la règle et de l’une des courbes
- Intérêt : il permet de calculer la probabilité post-test connaissant le RV et la prévalence : p (post-test) = p (prétest) x RV

RVP	RVN	Apport diagnostique
> 10	< 0,1	Très fort
5 – 10	0,1 – 0,2	Fort
2 – 5	0,2 – 0,5	Modéré
1 – 2	0,5 – 1	Faible
1	1	nul

ii. Caractéristiques extrinsèques

On va déterminer les qualités du test en prenant en compte la prévalence de la maladie qu’il va explorer. Un même test aura des qualités extrinsèques différentes en fonction de la maladie et de la population étudiée.

Ex : BNP dans le diagnostic de l’insuffisance cardiaque chez la population générale vs une population gériatrique.

Ex : CRP dans le diagnostic d’une pyélonéphrite vs une rhinopharyngite.

Pour calculer ces indicateurs, on va prendre en compte les paramètres intrinsèques du test (Se, Sp) et de la prévalence.

Ils sont plus parlant pour le clinicien :

La prévalence correspond à la probabilité pré-test : c’est la probabilité d’avoir la maladie avant d’avoir fait le test.
VPP et VPN correspondent à la probabilité post-test : c’est la probabilité d’avoir (ou pas) la maladie après le test.

Valeur prédictive positive (VPP)
- Définition (6):
  - Capacité du test de distinguer les personnes malades (vrais positifs) de l’ensemble des personnes dont le résultat au test est positif (vrais positifs + faux positifs)
  - Probabilité d’être malade (M+) si on a un test positif (T+)= p (M+/T+)
- Calcul :
  - VPP = VP / (VP+FP)
  - VPP = RVP x prévalence
Valeur prédictive négative (VPN)
- Définition (6):
  - Capacité d’un test à distinguer les personnes saines (vrais négatifs) de l’ensemble des personnes dont le résultat au test est négatif (vrais négatifs + faux négatifs)
  - Probabilité de ne pas être malade (M-) si on a un test négatif (T-) = p (M-/T-)
- Calcul :
  - VPN = VN / (VN+FN)
  - VPN = RVN x prévalence
- Rmq :
  - VP + FP = nombre total de sujets ayant un test positif
  - VN + FN = nombre total de sujets ayant un test négatif
  - VPP et VPN dépendent de la Sp, Se et la prévalence de la maladie

b. Fiabilité

Définition : Fiabilité (reproductibilité) : Capacité d’un examen ou d’un test de donner les mêmes résultats lorsqu’il est répété à plusieurs reprises (et donc à différents moments) sur les mêmes sujets et exactement dans les mêmes conditions.

Après avoir démontré que le test est efficace, on veut s’assurer qu’il donnera les mêmes résultats s‘il est répété

Par un autre opérateur : reproductibilité inter opérateur
Par un même opérateur : reproductibilité intra opérateur

Coefficient de corrélation Kappa

Il mesure l’accord entre 2 jugements qualitatifs, en tenant compte de la part de concordance due au hasard.

Il mesure la variabilité intra et interobservateur.

Il est estimé en rapportant le gain observé (différence entre la concordance observée test/aléatoire) et le gain possible total (100 % – concordance aléatoire)

Calcul :
- On doit évaluer la concordance interopérateur (opérateur 1 et opérateur 2)
- C1 : nombre de tests positifs chez les 2 opérateurs
- C2 : nombre de tests négatifs chez les 2 opérateurs
- NC1 : nombre de tests positif chez l’opérateur 1 et négatif chez l’opérateur 2
- NC2 : nombre de tests négatifs chez l’opérateur 1 et positif chez l’opérateur 2
- C1 + C2 : nombre de tests concordants
- NC1 + NC2 : nombre de tests non concordants

	Test positif par opérateur 1	Test négatif par opérateur 2
Test positif par opérateur 2	C1	NC2
Test négatif par opérateur 2	NC1	C2

Interprétation : les valeurs de références d’après Landis-Koch 1977sont donnés dans le tableau joint. En médecine, on estime qu’il doit être > 0.8

κ	concordance
1,00 – 0,81	Excellente
0,80 – 0,61	Bonne
0,60 – 0,41	Moyenne
0,40 – 0,21	Faible
0,20 – 0,00	Mauvaise

c. Principaux biais

Biais de vérification :
- Définition : le test de référence n’est réalisé que chez les ayant répondu positivement au nouveau test
- Anglais : « work up biais »
- Conséquence : surestimation des performances du test
Biais de spectre :
- Définition : les patients sélectionnés ne reflètent pas l’ensemble des patients concernés (biais de sélection)
Biais de classement :
- Définition : biais lorsque l’évaluateur est influencé par le résultat du premier test (non-respect de l’aveugle)
Biais lié à un choix non pertinent du gold standard

d. Grille de lecture STARD

Une grille de lecture STARD (français) a été développée pour aider à analyser et écrire une étude diagnostique.

Grille STARD en français

Tableau I. Traduction française originale de la liste de contrôle STARD 2003.

Section et sujet	Item
TITRE/RÉSUMÉ/ MOTS CLEFS	1	Identifier l’article comme une étude sur la précision d’un test diagnostique (se référer à la rubrique MeSH^a « sensibilité et spécificité »).
INTRODUCTION	2	Formuler les questions de recherche ou les objectifs de l’étude, comme évaluer la précision diagnostique ou comparer la précision entre plusieurs tests ou sur divers groupes de participants.
MÉTHODES
*Population*	3	Population étudiée : critères d’inclusion et d’exclusion, contexte et lieux où les données ont été collectées.
	4	Recrutement des participants : le recrutement était-il basé sur la présentation de symptômes, sur des résultats d’examens antérieurs, ou sur le fait que les participants avaient déjà subi les tests étudiés ou le test de référence ?
	5	Échantillonnage des participants : la population de l’étude était-elle une série consécutive de participants définis selon les critères de sélection précisés dans les items 3 et 4 ? Si non, spécifier la manière dont les participants ont alors été sélectionnés.
	6	Collecte des données : le recueil des données était-il planifié avant que le test étudié et le test de référence aient été effectués (étude prospective) ou après (étude rétrospective) ?
*Méthodes des tests*	7	Description et justification du test de référence.
	8	Spécifications techniques du matériel et des méthodes utilisés, y compris comment et quand les mesures ont été prises, et/ou citer les références relatives aux tests étudiés et au test de référence.
	9	Définition et justification des unités, des seuils et/ou des catégories de résultats du test étudié et du test de référence.
	10	Nombre, formation et niveau d’expertise des personnes exécutant et interprétant les tests étudiés et le test de référence.
	11	Préciser si les lectures des tests étudiés et du test de référence ont été faites en aveugle (insu) des résultats de l’autre test, et décrire toute autre information clinique à la disposition des personnes interprétant le test.
*Analyses statistiques*	12	Méthodes de calcul ou de comparaison des mesures de précision diagnostique et analyses statistiques utilisées pour quantifier l’incertitude (par exemple, intervalles de confiance de 95 %).
	13	Méthodes de calcul de la reproductibilité du test, si réalisé.
RÉSULTATS
*Population*	14	Quand l’étude a été réalisée, y compris dates de début et de fin de recrutement.
	15	Caractéristiques cliniques et démographiques de la population de l’étude (au minimum : âge, sexe, type de symptômes présents).
	16	Nombre de participants répondant aux critères d’inclusion qui ont subi ou non les tests étudiés et/ou le test de référence ; expliquer pourquoi les participants n’ont pas subi l’un ou l’autre test (un diagramme de flux est fortement recommandé).
*Résultats pour les tests*	17	Délai entre les tests étudiés et le test de référence, et de tout traitement administré entre deux.
	18	Répartition des différents degrés de gravité de la maladie (définir les critères) des sujets remplissant les conditions ciblées ; autres diagnostics chez les participants ne remplissant pas les conditions ciblées.
	19	Tableau croisé comparant les résultats du test étudié (y compris les résultats indéterminés et manquants) aux résultats du test de référence ; pour les données continues, distribution des résultats du test étudié par rapport aux résultats du test de référence.
	20	Évènements indésirables liés à la réalisation des tests étudiés ou du test de référence.
*Estimations*	21	Estimations de la précision diagnostique et des mesures de l’incertitude statistique (par exemple, intervalles de confiance de 95 %).
	22	Gestion des résultats indéterminés, des valeurs manquantes ou aberrantes des tests étudiés.
	23	Estimations de la variabilité de la précision diagnostique entre les sous-groupes de participants, entre les personnes interprétant le test ou entre les centres d’étude, si réalisée.
	24	Estimations de la reproductibilité du test, si réalisées.
DISCUSSION	25	Discuter l’applicabilité clinique des résultats de l’étude.

a Note du traducteur : http://www.ncbi.nlm.nih.gov/mesh.

Traduction française du diagramme de flux STARD 2003.

Diagramme de flux, STARD 2003

D. Étude épidémiologique/étiologique

Les études étiologiques sont des études qui évaluent l’association entre un ou plusieurs facteurs de risque avec la survenue d’une maladie. Elles font partie des études observationnelles.

Formulation de l’objectif :

En reprenant le PICO :

P : population concernée
I : facteur de risque étudié
C : population de comparaison n’ayant pas le facteur de risque
O : la maladie

Ex : évaluation du rôle de la consommation de viande rouge (I) dans l’apparition de cancer colorectal (O) chez les personnes de plus de 50 ans (P). On sous-entend que l’on compare à ceux ne consommant pas de viande rouge (C).

Types d’étude :

Ce sont des études épidémiologiques, observationnelles de type étude :

Cohorte : on recrute des sujets indemnes de la maladie, qui sont exposés à des facteurs et sont suivis dans le temps afin d’évaluer la survenue de la maladie.
Cas-témoin : on recrute des malades et des sujets indemnes de la maladie qui seront similaires sur certaines caractéristiques aux malades (on les appelle les témoins). On recherche dans le passé s’ils ont été exposés à certains facteurs de risque.

		Études de cohorte	Etudes cas-témoins
Critères de choix	Facteur	Unique, rare	Multiples, fréquente
	maladie	Multiples, fréquente	Rare, unique
	exposition	rare	fréquente
	biais	perdus de vue	mémoire et sélection, peu de suivi
	inconvénient	Gros échantillon, long, coût élevé	Rapide, coût moindre
	niveau de preuve	Niveau 2 (grade B)	Niveau 3 (grade C)
	groupes	exposés vs. non-exposés	cas vs. témoins
Protocole	critère de sélection	exposition	maladie
	comparaison	incidence de la maladie	côtes d’exposition au facteur (pas l’incidence)
	Mesure de l’association	risque relatif	odds ratio (pas le RR)
	Temporalité	Etude de la temporalité entre l’exposition et la maladie (interprétation possible d’un sens causal)	Adapté aux maladies ayant un long délai de latence (délais entre exposition et apparition de la maladie)
			Difficulté de choix de témoins

Cas particulier : Cas témoins nichée dans une cohorte

Définition : les cas et les témoins sont recrutés à partir d’une cohorte déjà existante.
Avantages :
- Recueil prospectif des données
- Diminution des biais de sélection différentiel entre cas et témoins car les cas sont issus de la même population que les témoins.
- Diminution des biais de survie sélective, on a potentiellement tous les cas incidents (exhaustivité des cas, sauf perdus de vue) comme dans une cohorte (on peut les avoir aussi dans un cas-témoins incidente…) et on a eu plus de possibilités pour limiter les perdus de vue.
- Diminution des biais de mesure de l’exposition (biais de mémoire) car l’exposition a été recueillie avant la survenue de la maladie étudiée
- Meilleure qualité des données, on a des données même chez les cas décédés
Inconvénient : on manque parfois de certaines données qui n’avaient pas été nécessaires pour la cohorte, obligeant à recontacter les sujets ou à explorer les dossiers médicaux de manière rétrospective.

a. Cohorte

Définition :

Étude dans laquelle un groupe de personnes (saines ou ne présentant pas de signe de la pathologie étudiée) est suivi pendant un certain temps. Les sujets choisis sont répartis en différents groupes d’exposition, au début ou pendant l’étude. Cette population à risque est suivie pendant une certaine période et les incidents sont identifiés.

Anglais : cohort study

Choix de la population :

Il existe 2 choix de population

Les cohortes en population : on sélectionne les sujets à partir d’une même population afin d’obtenir un échantillon représentatif.
Les cohortes exposées -non-exposées : on recrute 2 cohortes, 1 cohorte de sujets exposés à un facteur de risque et 1 cohorte non exposée au facteur de risque. Ces 2 cohortes auront un suivi identique.
- À privilégier lorsque l’exposition est rare et la maladie assez fréquente, notamment lors d’étude des facteurs de risque professionnels
- Inconvénient : ne permet pas d’étudier plusieurs expositions.

Classification :

En fonction de l’objectif :
- Descriptive : déterminer l’incidence d’une maladie sans étude de causalité. La sélection des sujets en fonction de leur exposition se fait a posteriori de leur inclusion.
  - Synonyme : type 1, étude d’incidence.
  - Caractéristique : 1 seule cohorte appartient à l’épidémiologie observationnelle descriptive
- Analytique : rechercher un lien et son intensité entre la survenue d’une maladie (M) et l’exposition à un facteur (F). On constitue d’emblée un groupe exposé et un groupe non exposé, avec au moins 2 cohortes.
  - Synonyme : type 2, cohorte exposée/non-exposée, comparative
  - Caractéristique : au moins 2 cohortes, appartient à l’épidémiologie observationnelle analytique

En fonction du temps : inclusion des sujets
- Prospective (concourante) : inclusion des sujets au début du suivi
- Rétrospective (historique) : inclusion des sujets a posteriori

Méthodologie :

Principes :
- 1 facteur explicatif : « l’exposition »
  - Soit un facteur de risque (FdR)
  - Soit un facteur protecteur
- 1 facteur à expliquer : « la maladie »
  - Un événement de santé
  - Une pathologie
- 2 groupes indemnes de la maladie
  - Les exposés : sujet ayant subi l’exposition
  - Les non-exposés : sujet n’ayant pas été exposé
- Schéma expérimental :
  - Inclusion de sujets indemne de la maladie (M -) pouvant être exposés (E+) ou non exposés (E-)
  - Suivi des sujets dans le temps avec recueil des nouveaux cas (M+)
  - Comparaison de l’incidence de la maladie chez les exposés et non exposés.

Intérêt :

Avantages :
- Mesure de l’incidence
- Calcul du risque relatif
- Exposition rare
- Plusieurs maladies
- Séquence chronologique et relation causale
Inconvénients :
- Durée et coût
- Nombreux sujets inclus
- Perdus de vue
- Inadapté pour maladie à faible incidence
- Sélection de la population avec représentativité limitée de la population générale

Ex : La cohorte Framingham. Étude de cohorte ayant débuté en 1948 dans la ville de Framingham aux EU incluant initialement plus de 5000 sujets qui seront suivi sur 3 génération. Cette cohorte est la base de la notion de facteur de risque cardiovasculaire et de score de risque cardiovasculaire (Score de Framinghan).

Principaux biais :

Perdus de vue : cela concerne les sujets dont on ne dispose pas des données concernant le suivi.
- S’ils sont répartis équitablement entre les 2 groupes (rare en pratique), on perd en puissance.
- S’ils ne sont pas répartis équitablement (e nombre ou en termes de caractéristique) et on s’expose en plus à un biais d’attrition.
- Si le nombre d’événements est supérieur au nombre de perdus de vue
Biais lié à un suivi différent entre les 2 groupes
Biais lié à une durée insuffisante de suivi permettant la survenue de la maladie

b. Cas témoin

Définition :

Étude qui compare le niveau d’exposition à un “agent particulier” ou à un “facteur de risque” d’un groupe de personnes présentant une maladie ou un évènement “cas”, à un autre groupe de personnes, similaire autant que faire se peut au premier groupe, mais qui n’est pas atteint par la maladie étudiée.

En gros, on compare un groupe de malade (cas) à un groupe de non malade (témoin) qui ressemble au groupe malade.

Caractéristiques :

Étude observationnelle souvent rétrospective.

Objectif :

On recherche un lien entre une maladie (M) et l’exposition antérieur à certains facteurs (F).

Méthodologie :

Sélection des cas : sujet ayant la maladie (M+). Ils doivent être représentatifs de la population étudiée. On distingue 2 méthodes de sélection :
- Cas incidents : ils ne sont inclus dans l’étude que lorsqu’ils deviennent malades. C’est la méthode à privilégier.
- Cas prévalents : ils sont déjà malades avant d’être inclus dans l’étude. On introduit un biais de survie sélective car on ne sélectionne que les malades ayant survécu à la date de début de l’étude.
Sélection des témoins : sujet indemne (M-) ayant des caractéristiques similaires aux cas (appariement) sauf pour les facteurs (F). Ils doivent être représentatifs de l’ensemble des sujets M- de la population source. Le tableau suivant résume les principaux types de témoins.
Mesure de l’exposition antérieure chez les cas et les témoins, sans suivi dans le temps.
Comparaison des fréquences d’exposition chez ces 2 groupes.

Témoins	Hospitalisés ou famille	Population
Accès	Facile	Difficile, coût
Motivation	Forte	Faible (en bonne santé)
Taux de réponse	Elevée	Faible
Biais de sélection	Important	Limité

Principaux biais :

De survie sélective : sélection des cas prévalents (cas déjà malades ayant survécu)
De mémorisation (sous-type classement) : les cas se rappelleront plus facilement de l’exposition. Il en résulte une majoration de l’exposition des cas et une diminution de celle des témoins.
De sélection : difficulté d’avoir des cas et témoins similaires, mauvaise définition des cas, sélection des témoins non indépendante de l’exposition.

L’appariement et l’ajustement :

Afin de limiter l’apparition de potentiels facteurs de confusion, c’est-à-dire de mesurer l’association entre l’exposition et la maladie indépendamment d’autres facteurs, on peut utiliser 2 méthodes particulières :

Appariement : méthode a priori.
- Définition : méthode consistant à sélectionner des paires de sujets (cas + témoin) qui sont comparables sur certains facteurs (souvent l’âge et le sexe).
- Limite : le nombre de facteurs d’appariement est limité
Ajustement : méthode statistique a posteriori permettant d’isoler mathématiquement de potentiels facteurs de confusion.

c. Principaux biais des études étiologiques

Biais	Type d’étude	Définition	Limitation du biais
Sélection	Cohorte	Sélection d’un échantillon non représentatif de la population d’intérêt	Qualité de la sélection des sujets
Sélection	Cas-témoin	Mauvaise définition des cas Sélection de témoins dépendant de l’exposition	Définition claire et standardisée des cas Qualité de la sélection des témoins
Survie sélective (sous-type de biais de sélection)	Uniquement dans les cas-témoins	Sélection des cas prévalents	Sélection de cas incidents
Classement	Cohorte	L’évaluateur peut être influencé s’il connaît le statut exposé/non-exposé du sujet	Evaluation des critères en aveugle
De mémoire (sous-type de biais de classement)	Uniquement dans les cas-témoins	Les cas ont tendance à majorer leur exposition	Sujets en aveugle de la variable d’intérêt (exposition) Évaluation standardisée, objective
De confusion		Présence de facteur de confusion	Analyse multivariée avec ajustement Appariement si cas-témoins
D’attrition	Cohorte prospective	Perdus de vue non comptabilisés dans l’analyse	Limiter les perdus de vue Gestion des perdus de vue

d. Critère de causalité de Bradford Hill

Une association statistique ne justifie pas causalité.

Pour affirmer une causalité, il faut que les 2 groupes ne diffèrent que par le facteur étudié et soient comparables en tout point. En pratique, il faut réaliser un essai contrôlé randomisé. Ainsi, une étude épidémiologique ne permet pas d’assurer un lien de causalité. Néanmoins, certains critères en faveur d’un lien causal ont été développés par Bardford-Hill en 1965. Les principaux critères sont :

Critères internes à l’étude :
- Existence d’une association statistiquement significative entre l’exposition et la maladie.
- Force de l’association: le degré d’association (RR ou OR) est très grand il faudrait un fort effet de confusion pour faire disparaitre l’association
- Cohérence chronologique: Exposition au facteur doit précéder l’apparition de la maladie : permet d’exclure la relation inverse.
- Relation dose-effet: si l’exposition augmente, le risque augmente : quand ce critère est présent, il est très spécifique mais il n’est pas vrai dans tous les cas.
- Spécificité de l’association: si un facteur de risque est constamment relié uniquement à la maladie étudiée, il apparait vraisemblable qu’une relation causale existe : ce critère découle d’une analogie avec les maladies infectieuses mais son absence ne remet pas en question une relation causale.
- Minimisation des biais de sélection, de classement et de confusion
Critères externes:
- Plausibilité biologiquesur l’histoire naturelle de la maladie, la physiopathologie, la biologie
- Analogie avec d’autres facteurs de risque démontrés: une hypothèse causale est renforcée par le fait qu’une relation causale analogue est connue, rendant l’hypothèse plus crédible
- Reproductibilité: Constance de l’association et reproductibilité des résultats de l’étude avec d’autres équipes, en différents lieux, circonstances et temps.
- Concordance avec des expérimentations in vitro et chez l’animal.
- Gradients géographiques parallèles de l’exposition et de la maladie
- Diminution de l’incidence de la maladie lorsque l’exposition est supprimée ou réduite.

e. Grille de lecture STROBE

Une grille de lecture STROBE (français) a été développée pour aider à analyser et écrire une étude observationnelle.

Grille STROBE en français

	Item N°	Recommandation
Titre et résumé	1	(a) Indiquer dans le titre ou dans le résumé le type d’étude réalisée en termes couramment utilisés
		(b) Fournir dans le résumé une information synthétique et objective sur ce qui a été fait et ce qui a été trouvé
Introduction
Contexte/justification	2	Expliquer le contexte scientifique et la légitimité de l’étude en question
Objectifs	3	Citer les objectifs spécifiques, y compris toutes les hypothèses a priori
Méthodes
Conception de l’étude	4	Présenter les éléments clés de la conception de l’étude en tout début de document
Contexte	5	Décrire le contexte, les lieux et les dates pertinentes, y compris les périodes de recrutement, d’exposition, de suivi et de recueil de données
Population	6	(a) Étude de cohorte – Indiquer les critères d’éligibilité, et les sources et méthodes de sélection des sujets. Décrire les méthodes de suivi Étude cas-témoin – Indiquer les critères d’éligibilité, et les sources et méthodes pour identifier les cas et sélectionner les témoins. Justifier le choix des cas et des témoins. Étude transversale – Indiquer les critères d’éligibilité et les sources et méthodes de sélection des participants
		(b) Étude de cohorte – Pour les études appariées, indiquer les critères d’appariement et le nombre de sujets exposés et non exposés. Étude cas-témoin – Pour les études appariées, indiquer les critères d’appariement et le nombre de témoins par cas
Variables	7	Définir clairement tous les critères de résultats, les expositions, les facteurs de prédiction, les facteurs de confusion potentiels, et les facteurs d’influence. Indiquer les critères diagnostiques, le cas échéant
Sources de données/mesures	8*	Pour chaque variable d’intérêt, indiquer les sources de données et les détails des méthodes d’évaluation (mesures). Décrire la comparabilité des méthodes d’évaluation s’il y a plus d’un groupe
Biais	9	Décrire toutes les mesures prises pour éviter les sources potentielles de biais
Taille de l’étude	10	Expliquer comment a été déterminé le nombre de sujets à inclure
Variables quantitatives	11	Expliquer comment les variables quantitatives ont été traitées dans les analyses. Le cas échéant, décrire quels regroupements ont été effectués et pourquoi
Analyses statistiques	12	(a) Décrire toutes les analyses statistiques, y compris celles utilisées pour contrôler les facteurs de confusion
		(b) Décrire toutes les méthodes utilisées pour examiner les sous-groupes et les interactions
		(c) Expliquer comment les données manquantes ont été traitées
		(d) Étude de cohorte – Le cas échéant, expliquer comment les perdus de vue ont été traités. Étude cas-témoin – Le cas échéant, expliquer comment l’appariement des cas et des témoins a été réalisé. Étude transversale – Le cas échéant, décrire les méthodes d’analyse qui tiennent compte de la stratégie d’échantillonnage
		(e) Décrire toutes les analyses de sensibilité
Résultats
Population	13*	(a) Rapporter le nombre d’individus à chaque étape de l’étude – par exemple : potentiellement éligibles, examinés pour l’éligibilité, confirmés éligibles, inclus dans l’étude, complètement suivis, et analysés
		(b) Indiquer les raisons de non-participation à chaque étape
		(c) Envisager l’utilisation d’un diagramme de flux
Données descriptives	14*	(a) Indiquer les caractéristiques de la population étudiée (par exemple : démographiques, cliniques, sociales) et les informations sur les expositions et les facteurs de confusion potentiels
		(b) Indiquer le nombre de sujets inclus avec des données manquantes pour chaque variable d’intérêt
		(c) Étude de cohorte – Résumer la période de suivi (par exemple : nombre moyen et total)
Données obtenues	15*	Étude de cohorte – Rapporter le nombre d’évènements survenus ou les indicateurs mesurés au cours du temps
		Étude cas-témoin – Reporter le nombre de sujets pour chaque catégorie d’exposition, ou les indicateurs du niveau d’exposition mesuré
		Étude transversale – Reporter le nombre d’évènements survenus ou les indicateurs mesurés
Principaux résultats	16	(a) Indiquer les estimations non ajustées et, le cas échéant, les estimations après ajustement sur les facteurs de confusion avec leur précision (par exemple : intervalle de confiance de 95 %). Expliciter quels facteurs de confusion ont été pris en compte et pourquoi ils ont été inclus.
		(b) Indiquer les valeurs borne des intervalles lorsque les variables continues ont été catégorisées
		(c) Selon les situations, traduire les estimations de risque relatif en risque absolu sur une période de temps (cliniquement) interprétable
Autres analyses	17	Mentionner les autres analyses réalisées–par exemple : analyses de sous-groupes, recherche d’interactions, et analyses de sensibilité
Discussion
Résultats clés	18	Résumer les principaux résultats en se référant aux objectifs de l’étude
Limitations	19	Discuter les limites de l’étude, en tenant compte des sources de biais potentiels ou d’imprécisions. Discuter du sens et de l’importance de tout biais potentiel
Interprétation	20	Donner une interprétation générale prudente des résultats compte tenu des objectifs, des limites de l’étude, de la multiplicité des analyses, des résultats d’études similaires, et de tout autre élément pertinent
« Généralisabilité »	21	Discuter la « généralisabilité » (validité externe) des résultats de l’étude
Autre information
Financement	22	Indiquer la source de financement et le rôle des financeurs pour l’étude rapportée, le cas échéant, pour l’étude originale sur laquelle s’appuie l’article présenté.

*Indiquer l’information séparément pour les cas et les témoins dans les études cas-témoins et, le cas échéant, pour les groupes exposés et non exposés dans les études de cohorte et les études transversales.

E. Étude écologique

Définition :

Une étude écologique est une étude épidémiologique dans laquelle les facteurs étudiés proviennent de population et non pas d’individu, définie à partir de caractéristiques temporelles ou géographiques. Elle permet d’émettre des hypothèses avant de réaliser une étude de cohorte ou cas-témoin.

Ex : on veut étudier le cancer du poumon chez les tabagiques dans différents pays. On utilisera les données de cancer de poumon et de tabagisme dans les populations, à partir de statistiques déjà établies. On n’étudiera pas ces variables chez chaque individu.

Intérêt :

Avantage :
- Permet de générer des hypothèses
- Rapide, peu onéreux.
- Nombreuses variables analysables et nombreux sujets recrutés
Inconvénients :
- Faible niveau EBM
- Erreur écologique : erreur de raisonnement dans l’interprétation de résultats statistiques au niveau individuel à partir de données agrégées.

Ex : en 1981, R. Edgar Hope-Simpson émet l’hypothèse qu’un « stimulus saisonnier » associé à l’exposition solaire pourrait expliquer le caractère saisonnier des infections à Haemophilus. Un essai interventionnel confirmera cette hypothèse en proposant une supplémentation en vitamine D à visée préventive.

F. Étude pronostique

Définition :

Type d’article dont l’objectif est de montrer qu’un facteur va influencer le devenir de la maladie, c’est-à-dire l’apparition d’un critère de jugement (« positif » comme la guérison ou « négatif » comme le décès). En identifiant certains facteurs de bon ou mauvais pronostiques, on pourra proposer une prise en charge plus adaptée.

À la différence d’une étude étiologique, on ne cherche pas à montrer un lien de causalité.

De plus, la différence entre un facteur de risque et un facteur pronostic est que le facteur de risque aura une influence sur la survenue de la maladie alors que le facteur pronostic aura une influence sur le devenir de la maladie.

Formulation de l’objectif :

On retrouve le PICO :

P : population concernée
I : facteur pronostic évalué
C : population de comparaison n’ayant pas le facteur pronostic
O : critère de jugement (maladie, guérison…)

Ex : évaluer si la dépression(I) est un facteur de mauvais pronostique, prédictif de décès (O) chez les patients ayant un cancer(P). On sous-entend par rapport aux patients non déprimés (C).

Objectifs :

Descriptif : répartition spatio-temporelle des phénomènes de santé et leurs déterminants. Ex : étude de la survie des sujets ayant un mélanome.
Explicatif : explorant des facteurs pronostiques influençant sur l’évolution d’une maladie. Cela permet d’améliorer la compréhension de la maladie pour prédire plus justement son devenir et proposer une thérapeutique en fonction du risque (définition de groupes à risque. Ex : stade TNM pour les cancers). En fonction de la capacité à maîtriser le facteur, on pourra réaliser :
- soit des études interventionnelles. Ex : le repos strict est-il adapté dans la lombalgie aigüe commune ?
- soit des études observationnelles. Ex : le tabac augmente-t-il le risque de parodontopathie ?

F bis. Analyse de survies

Les études de survie ne correspondent pas à un type d’étude en particulier comme les études de cohorte ou cas-témoins. Ce type d’étude témoigne plus de l’utilisation d’une méthode statistiques particulière : l’analyse de survie. Ces méthodes permettent d’étudier le délai de survenue d’un événement dont la survenue n’est pas constante.

Initialement utilisées pour étudier la survie des patients (délais de survenue d’un décès), ces méthodes permettent d’étudier plus généralement des données dites « censurées à droite », c’est-à-dire des événements qualitatifs binaires (présence/absence) survenant au cours du temps de manière non récurrente. Ex : décès, métastase, récidive, maladie…

Ce type d’étude nécessite le recueil de données particulières :

En rapport avec la date :
- Date d’origine (DO) : date d’entrée du patient dans l’étude (ex : au moment de la randomisation, diagnostic, opération…)
- Date de point (DP) : date butoir pour laquelle on cherchera à connaître l’état de chaque sujet.
- Date de dernière nouvelle (DDN) : date la plus récente à laquelle on a pu
  avoir des nouvelles du sujet quant au critère étudié (décès/survie…). Elle correspond à la date de décès pour les sujets décédés et à la date de la dernière consultation pour les sujets vivants.
En rapport avec l’intervalle de temps entre la DO, DP et DDN :
- Temps de participation (TP) : délai correspondant à toute la durée de surveillance du sujet. Elle permet de construire la courbe de survie.
  - Si DDN < DP alors TP = DDN – DO
  - Si DDN > DP alors TP = DP – DO
- Recul : délai écoulé entre la date d’origine et la date de point. Les reculs minimum et maximum d’une série de sujets participant à une étude définissent donc « l’ancienneté » de la série.
  - Recul = DP – DO

En rapport avec le sujet :
- Décédé ou survivant à la DP
- Si le sujet est vivant à la DP, on dit que les données sont censurées à droite. Les sujets peuvent être qualifiés de :
  - Perdu de vue : on ne connaît pas son état à la DP mais toujours vivant à la DDN.
  - Exclu-vivant : vivant à la DP.

Interprétations :

Les études pronostiques utilisent des données censurées.

Cette particularité implique des analyses statistiques particulières spécifiques aux variables censurées.

G. Étude interventionnelle

Définition :

Mise en œuvre systématique d’un programme (visant par exemple la promotion de la santé ou la prévention des maladies, ou encore une intervention médicale), en direction d’individus ou d’une population, en vue de mesurer les résultats de ce programme à des fins de recherche.

En gros, cherche l’impact d’une intervention (médicament, chirurgie, programme…) sur un état (maladie, guérison, connaissance…).

En anglais : intervention study

Formulation de l’objectif :

En reprenant le PICO :

P : population concernée
I : Intervention
C : groupe contrôle
O : critère de jugement (état)

Ex : évaluation de l’efficacité à 30 jours (O) du paracétamol (I) par rapport à un placebo (C) dans la lombalgie aigüe (O).

Type d’étude :

ECR (Essai contrôlé randomisé) : les sujets sont tirés au sort quant à l’allocation de l’intervention. C’est la méthode de référence.
- Étude pragmatique : étudie le bénéfice de l’intervention dans des conditions pratiques (« in vivo »).
- Étude explicative : étudie l’efficacité théorique de l’intervention dans des conditions idéales (« in vitro »)
ECnR (Essai contrôlé non randomisé) :
- Étude ici-ailleurs : on compare 2 groupes distincts géographiquement, l’un reçoit l’intervention, l’autre pas. Risque de biais de sélection.
- Étude avant-après : on compare un même groupe avant et après une intervention. Risque de biais de confusion notamment dû à l’évolution naturelle de la maladie.

Comparaison étude pragmatique et explicative :

	Essai pragmatique	Essai explicatif
Objectif	Documenter le bénéfice qu’apportera le traitement aux patients qui seront traités en pratique	Evaluer et expliquer l’effet du traitement dans des conditions très précises
Finalité	Pratique : valider une pratique médicale	Cognitive : connaissance et explication
Population visée	Représentative des futurs patients qui seront traités	La plus homogène possible afin de contrôler au maximum l’influence d’autres facteurs
Critères de sélection	Simples Correspondant aux critères utilisés en pratique pour décider de traiter Mesurés par des examens de routine	Précis Définissant parfaitement les patients ciblés Mesurés par des techniques sophistiquées
Pertinence clinique	Forte	Faible

Rappel des grandes phases de développement d’un médicament.

En cours de rédaction

Choix du comparateur :

Pour choisir le groupe de comparaison, on a 2 choix en fonction de la pathologie :

Soit on dispose d’un traitement efficace, le comparateur sera le traitement de référence
Soit on de dispose pas de traitement efficace, on utilisera un placebo

Taille d’effet :

Risque de base : A = survenue (%) du critère principal dans le groupe contrôle (placebo ou Tt de référence).

Risque avec traitement : B = survenue (%) du critère principal pour le Tt expérimental

Réduction absolue du risque (RAR) : RAR = A-B

Réduction Relative du Risque (RRR) : RRR = (A-B) / A

Nombre de sujets Nécessaires à Traiter (NNT, « number needed to treat ») :
- définition: nombre de sujets à traiter pour éviter la survenue d’un évènement sur une durée donnée.
- Calcul : NNT = 1 / RAR = 1 / (A-B)
- ex: A = 20 % et B = 10 %: NST = 1/0.01 = 10 patients
- Interprétation : « il faut traiter 10 patients pendant 1 an pour éviter 1 décès »
Différence de risques : il correspond au nombre d’événements évités grâce au nouveau traitement.
- Calcul: à partir du bénéfice absolu qui représente la différence des risques absolus.
- = incidence de l’événement dans le groupe 1 – incidence dans le groupe B

1. Plan expérimental

a. Supériorité, équivalence et non-infériorité

Lors d’un essai de supériorité, l’absence de différence significative entre les 2 interventions ne permet pas de déterminer s’ils sont comparables. Pour cela on a développé un nouveau type d’essai permettant de déterminer si 2 traitements sont équivalents ou si le nouveau médicament n’est pas inférieur à celui de référence.

Dans les essais interventionnels, on distingue 3 grands types de schémas expérimentaux :

Essai de supériorité :
- Objectif : « le traitement A est-il supérieur au traitement B ou le traitement B est-il supérieur au traitement A ? » (si analyse bilatérale)
- Soit ∆ : la différence d’efficacité entre les 2 traitements. ∆ = µ_A – µ_B
- On pose les hypothèses :
  - H0 : efficacité du traitement A (µ_A) = efficacité du traitement B (µ_B),
  - la différence d’efficacité entre les 2 traitements : |∆| = |µ_A – µ_B| = 0
  - H1 : |∆| ≠ 0
- Interprétation : si la différence d’efficacité est non significative, on peut supposer que l’un des traitements n’est pas supérieur à l’autre mais pas que les traitements sont équivalents.

Essai d’équivalence :
- Objectif : « le traitement A est-il équivalent au traitement B et vis-versa ? »
- Soit ∆_L: la borne d’équivalence. C’est la plus petite différence cliniquement pertinente.
- On veut que |µ_A – µ_B| < ∆_L
- On pose les hypothèses
  - H0 : ∆ ≤ ∆_L ou ∆ ≥ ∆_L(c’est la non-équivalence)
  - H1 : -∆_L < ∆ < +∆_L(c’est l’équivalence)
- Interprétation : si la différence comprend la borne d’équivalence, on considère que les traitements sont équivalents.
Essai de non-infériorité :
- Objectif : « le traitement A est-il au moins aussi efficace que le traitement B ? »
- Soit ∆_L: la borne de non-infériorité
- On veut que µ_A – µ_B> -∆_L
- On pose les hypothèses (analyse unilatérale) :
  - H0 : ∆ ≤ -∆_L(le traitement A est < au traitement B)
  - H1 : ∆ > -∆_L(le traitement A est ≥ au traitement B)
- Interprétation : si la différence comprend la borne de non-infériorité, on considère que le traitement A est au moins aussi efficace que le traitement B.

Pourquoi faire un essai de non-infériorité plutôt qu’un essai de supériorité ? (ECN 2012)

L’analyse unilatérale et pas bilatérale permet de diminuer le nombre de sujets nécessaire (NSN) permettant d’augmenter la puissance pour un même nombre de sujets.
Lorsqu’il est difficile de montrer une amélioration du traitement de référence (chirurgie, traitement déjà très efficace)
Lorsque le nouveau traitement a d’autres avantages en termes de coût (prix), de tolérance (moins d’effets secondaires) ou de facilité d’utilisation (per os plutôt qu’injectable), rapport bénéfice-risque.

Borne d’équivalence et de non-infériorité :

En réalité, il est impossible de prouver que les 2 traitements sont parfaitement équivalents en termes d’efficacité. On va s’accorder une petite marge d’erreur (classique en statistique…) et montrer qu’ils ne sont pas trop différents. Pour cela on définit une borne d’équivalence ou de non-infériorité. Ainsi, si la différence entre ces 2 traitements (son intervalle de confiance à 95 %) comprend cette borne, on pourra conclure à l’équivalence ou la non-infériorité.

Comment distinguer un essai de supériorité d’un essai de non-infériorité ?

En regardant dans la partie analyse statistique :

Si supériorité : analyse souvent bilatérale avec une différence attendue
Si non-infériorité : analyse unilatérale avec une borne de non-infériorité

Pourquoi réaliser un essai de non-infériorité plutôt qu’un essai d’équivalence ?

En cas d’équivalence, la zone de significativité est plus étroite nécessitant un nombre de sujets nécessaires plus important.

De plus, dans les essais de non-infériorité, le nouveau médicament peut être plus efficace.

On pratique, les essais de non-infériorité sont largement dominants dans la recherche.

b. Cross-over et bras parallèle

Définition : essai durant lequel les sujets vont être leur propre témoin et recevoir les 2 traitements.

La randomisation détermine l’ordre d’attribution des traitements.

Les 2 traitements sont espacés par une période de wash-out (lavage) permettant d’effacer l’effet du 1^er traitement, appelé effet rémanent (carry-over effect)

Avantages :
- Amélioration de la comparabilité des groupes en diminuant la variabilité interindividuelle
- Amélioration de la puissance car on a besoin de 2 fois moins de sujets qu’avec une étude en groupe parallèle
Conditions :
- Maladie chronique stable dans le temps afin que l’amélioration observée ne soit pas influencée par l’évolution naturelle de la maladie (ex : asthme, migraine, épilepsie…)
- Les traitements évalués doivent être des traitements symptomatiques et doivent agir de manière non définitive (ex : la fièvre est adaptée mais pas la chirurgie)
- Le critère de jugement peut être répété (ex : la douleur est adaptée mais pas la mortalité)
- Période de wash-out

2. Étude de dépistage

Définition :

Étude interventionnelle qui vise à identifier une maladie ou un haut risque pathologique dans une population a priori en bonne santé

Formulation de l’objectif :

En reprenant le PICO :

P : population concernée
I : procédure de dépistage
C : population dépistée
O : critère de jugement (la maladie)

Ex : évaluation de l’efficacité de dépistage du frottis cervico-vaginale (I) chez les femmes de plus de 25 ans (P) en termes de mortalité (O). On sous-entend que l’on compare à une population non dépistée (C).

Types de dépistage :

Opportuniste ou individuel : sur proposition du médecin ou à la demande du patient
Organisé ou de masse : mis en place par les pouvoirs publics

Type d’étude :

On va privilégier une étude contrôlée randomisée. L’intervention correspond à la procédure de dépistage.

Intérêts :

Avantages :
- Diminution de la morbi-mortalité
- Traitements moins lourds
- Réassurances des sujets négatifs
Inconvénients :
- Faux négatif : fausse réassurance
- Faux positif : exploration inutile
- Iatrogénie des tests de dépistage ou des explorations
- Allongement de la durée de la maladie (diagnostic plus tôt)

Quand réaliser un dépistage organisé ?

Un dépistage est dit organisé lorsqu’il répond à l’ensemble des dix critères de l’Organisation mondiale de la santé (OMS) :

Problème majeur de santé publique (sévérité, impact socio-économique, fréquence)
Un traitement efficace est disponible
Des moyens de diagnostic et de traitement sont disponibles
L’histoire naturelle de la maladie est bien connue
La maladie doit pouvoir être détectée pendant sa phase de latence asymptomatique ou au tout début des symptômes.
Le test de dépistage doit être simple et bien accepté par la population.
Il existe un test de dépistage performant (et le programme de dépistage est efficace)
Il n’existe pas de facteur de risque accessible à la prévention primaire.
Le choix des sujets qui recevront un traitement est opéré selon des critères préétablis.
Le coût de la recherche des cas (y compris les frais de diagnostic et de traitement des sujets reconnus malades) n’est pas disproportionné par rapport au coût global des soins médicaux.
La recherche des cas est un processus continu et elle n’est pas considérée comme une opération exécutée « une fois pour toutes ».

3. Grille de lecture CONSORT

Une grille de lecture CONSORT (français et son flow chart) a été développée pour aider à analyser et écrire une étude randomisée.

Grille CONSORT en français

Section/sujet	Item N°	DESCRIPTION
TITRE & RESUME
	1a	Identification en tant qu’“essai randomisé“ dans le titre
	1b	Résumé structuré du plan d’essai, méthodes, résultats et conclusions (pour une aide spécifique voir CONSORT pour Abstract)
INTRODUCTION
Contexte et objectifs	2a	Contexte scientifique et explication du bien-fondé
Contexte et objectifs	2b	Objectifs spécifiques et hypothèses
MÉTHODES
Plan de l’essai	3a	Description du plan de l’essai (tel que : groupes parallèles, plan factoriel) en incluant les ratios d’allocation
Plan de l’essai	3b	Changements importants de méthode après le début de l’essai(tel que les critères d’éligibilité), en expliquer la raison
Participants	4a	Critères d’éligibilité des participants
Participants	4b	Structures et lieux de recueil des données
Interventions	5	Interventions pour chaque groupe avec suffisamment de détails pour pouvoir reproduire l’étude, en incluant comment et quand elles ont été véritablement conduites
Critères de jugement	6a	Critères « à priori » de jugement principal et secondaires entièrement définis, en incluant comment et quand ils ont été évalués
Critères de jugement	6b	Changement quelconque de critères de jugement après le début de l’essai, en expliquer la raison
Taille de l’échantillon	7a	Comment la taille de l’échantillon a-t-elle été déterminée ?
Taille de l’échantillon	7b	Quand cela est applicable, explication des analyses intermédiaires et des règles d’arrêt
RANDOMISATION
Production de la séquence	8a	Méthode utilisée pour générer la séquence d’allocation par tirage au sort
Production de la séquence	8b	Type de randomisation, en incluant les détails relatifs à une méthode de restriction (comme par ex. : par blocs, avec la taille des blocs)
Mécanisme d’assignation secrète	9	Mécanisme utilisé pour mettre en œuvre la séquence d’allocation randomisée (comme par exemple : l’utilisation d’enveloppes numérotées séquentiellement), en décrivant chaque mesure prise pour masquer l’allocation jusqu’à l’assignation des interventions.
Mise en oeuvre	10	Qui a généré la séquence d’allocation, qui a enrôlé les participants et qui a assigné les participants à leurs groupes
Aveugle	11a	Au cas où, décrire qui a été en aveugle après l’assignation des interventions (par exemple, les participants, les administrateurs de traitement, ceux qui évaluent les résultats) et comment ont-ils été empêchés de savoir
Aveugle	11b	Si approprié, description de la similitude des interventions
Méthodes statistiques	12a	Méthodes statistiques utilisées pour comparer les groupes au regard des critères de jugement principal et secondaires
Méthodes statistiques	12b	Méthodes utilisées pour des analyses supplémentaires, telles que des analyses de sous-groupes ou des analyses ajustées

RESULTATS
Flux des participants (un diagramme est fortement conseillé)	13a	Pour chaque groupe, le nombre de participants qui ont été assignés par tirage au sort, qui ont reçu le traitement qui leur était destiné, et qui ont été analysés pour le critère de jugement principal.
		Pour chaque groupe, abandons et exclusions après la randomisation, en donner les raisons
Recrutement	14a	Dates définissant les périodes de recrutement et de suivi
Recrutement	14b	Pourquoi l’essai a-t-il pris fin ou a été interrompu
Données initiales	15	Une table décrivant les caractéristiques initiales démographiques et cliniques de chaque groupe
Effectifs analysés	16	Nombre de participants (dénominateur) inclus dans chaque analyse en précisant si l’analyse a été faite avec les groupes d’origine
Critères de jugement et estimations	17a	Pour chaque critère de jugement principal et secondaire, donner les résultats pour chaque groupe, et la taille estimée de l’effet ainsi que sa précision (comme par ex. : intervalles de confiance à 95 %)
Critères de jugement et estimations	17b	Pour les variables binaires, une présentation de la taille de l’effet en valeurs absolues et relatives est recommandée
Analyses accessoires	18	Résultats de toute analyse supplémentaire réalisée, en incluant les analyses en sous-groupes et les analyses ajustées, et en distinguant les analyses spécifiées à priori des analyses exploratoires
Risques	19	Tous les risques importants ou effets secondaires inattendus dans chaque groupe (pour un conseil détaillé voir ‘CONSORT for harms’)
DISCUSSION
Limitations	20	Limitations de l’essai, en tenant compte des sources de biais potentiels ou d’imprécision, et au cas où, en tenant compte de la multiplicité des analyses
“Généralisabilité”	21	“Généralisabilité“ (validité externe, applicabilité) des résultats de l’essai
Interprétation	22	Interprétations/conclusions cohérentes avec les résultats, en tenant compte du ratio-bénéfices/risques et de possibles autres faits pertinents
INFORMATIONS SUPPLEMENTAIRES
Enregistrement	23	Numéro d’enregistrement de l’essai en précisant le registre utilisé
Protocole	24	Où le protocole complet de l’essai peut-il être consulté, si possible
Financement	25	Sources de financement et autres ressources (par ex. : fourniture de médicaments), rôle des donateurs

Flowchart CONSORT :

Diagramme de flux CONSORT

{1093634:3VV856JH};{1093634:MJFICS24};{1093634:QDSGVCVE};{1093634:7FIQ89JX};{1093634:AT9ZVA2M};{1093634:UM3AGQZ3};{1093634:UM3AGQZ3};{1093634:4EMMWIVC};{1093634:4EMMWIVC};{1093634:UM3AGQZ3};{1093634:UM3AGQZ3};{1093634:Z9XQSM5I};{1093634:N789G4S4};{1093634:5T57SXVW};{1093634:UM3AGQZ3};{1093634:TZ8FG25T};{1093634:9F3XXNFT} vancouver default asc 0 767

III. Types d’études quantitatives

Cliquez pour afficher

A. Cas, série de cas

B. Étude transversale

C. Étude diagnostique

a. Performance

i. Caractéristiques intrinsèques

ii. Caractéristiques extrinsèques

b. Fiabilité

c. Principaux biais

d. Grille de lecture STARD

Grille STARD en français

D. Étude épidémiologique/étiologique

a. Cohorte

b. Cas témoin

c. Principaux biais des études étiologiques

d. Critère de causalité de Bradford Hill

e. Grille de lecture STROBE

Grille STROBE en français

E. Étude écologique

F. Étude pronostique

F bis. Analyse de survies

G. Étude interventionnelle

1. Plan expérimental

a. Supériorité, équivalence et non-infériorité

b. Cross-over et bras parallèle

2. Étude de dépistage

3. Grille de lecture CONSORT

Grille CONSORT en français

Laisser un commentaire Annuler la réponse

Identifier la question et le type d’étude adapté

Recherche

Contact