I. Interprétation
A. Critère de jugement principal
1. Est-ce que le résultat est statistiquement significatif ?
- Interpréter en fonction de l’indice de confiance :
- P : indice de significativité statistique
- En fonction du risque α (svt 5%)
- Significatif si p < 0,05
- IC : Intervalle de confiance
- Significatif si :
- Ne comprend pas 1 pour un ratio : OR, RR…
- Ne comprend pas 0 pour une différence
- Ne comprend pas Δ (borne d’infériorité ou d’équivalence, souvent -10%)
- Significatif si :
- AUC : Aire sous la courbe lors d’une courbe ROC (Area Under Curve)
- Fixée à 0,5
- Apport diagnostique si > 0,5
- P : indice de significativité statistique
- Si différence significative, p < 0,05 :
- Interprétation :
- La différence/l’association est bien réelle : « les sujets ont 2,34 plus de chance s’ils présentent tel facteur d’exposition … en prenant en compte les facteurs de confusion… (analyse multivariée d’un RR) ».
- Il y a 95% de chance que le risque réel soit compris entre ces 2 valeurs.
- Il y a 5% de chance que le risque réel soit en dehors entre ces 2 valeurs (risque alpha).
- Robustesse : analyser la valeur du résultat et sa dispersion.
- Vérifier :
- Tests cohérent avec la question posée
- CDJ de qualité
- Comparaison multiple
- (Un test significatif ne corrige pas les biais)
- Interprétation :
- Si pas de différence significative si p ≥ 0,5 :
- on ne peut pas conclure
- soit qu’il n’y a pas d’association/pas de différence réelle.
- soit que on manque de puissance : la différence/ l’association n’a pas pu être mise en évidence.
- On parle de tendance statistique si p compris entre 5 et 10%
- on ne peut pas conclure
Rmq : un site internet répertorie 500 manières différentes d’écrire que les résultats ne sont pas significatifs 😉
2. Est-ce que le résultat est cliniquement pertinent ?
Une différence statistiquement significative ne sera pas forcément cliniquement pertinente. En effet, plus on a de sujets, plus on aura la capacité de mettre en évidence des différences minimes qui ne seront pas cliniquement pertinentes.
Pour cela on doit évaluer la taille d’effet : mesure de la force de l’effet observé d’une variable sur une autre et plus généralement d’une inférence.
L’inférence statistique consiste à induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population. Les caractéristiques de l’échantillon, une fois connues, reflètent avec une certaine marge d’erreur possible celles de la population. (wiki)
Anglais : effect size
Lors des études interventionnelles, on peut utiliser :
- RAR : Réduction Absolue du Risque qui correspond à la différence de risque entre les 2 groupes.
- NNT : Nombre de sujets Nécessaires à Traiter pour éviter 1 événement. Il correspond à l’inverse du RAR.
B. Critère de jugement secondaire
Les résultats doivent être interprétés de manière prudente car l’étude n’a pas été élaborée pour répondre à ces critères.
Ces critères étant souvent nombreux, il y a un risque d’inflation du risque alpha.
On ne peut pas conclure sur une CdJ secondaire (surtout si le CdJ principal est non significatif ! )
C. Analyse intermédiaire
Définition : analyse effectuée avant l’inclusion de tous les sujets prévus. Elle est réalisée le plus souvent lorsque l’étude est longue.
- But :
- Efficacité : permet de conclure au plus vite à la supériorité du nouveau traitement.
- Futilité : permet d’interrompre le recrutement en cas d’effets secondaires importants ou d’inefficacité.
- Ethique : éviter une perte de chance, donner au plus tôt le traitement efficace à tous les malades, ou arrêter au plus tôt un traitement inefficace ou dangereux.
- Economique : arrêt précoce permettant de diminuer les coûts.
- Pratique : lors d’un essai long, risque de fatigabilité des intervenants et de la diminution de la rigueur méthodologique.
- Eléments à prendre en compte :
- Prévue à l’avance dans le protocole.
- Règles d’arrêt ou de poursuites sont prévue dans le protocole.
- Prises en compte de la multiplicité des tests augmentant la puissance obligeant à ajuster le risque α pour chaque analyse intermédiaire. (Si on teste à plusieurs reprises le CdJ principal, on risque d’observer un résultat significatif alors que c’est faux, à cause de l’inflation du risque α).
- Augmente le NSN (car α diminue).
D. Analyse en sous-groupe
Définition : analyse du CdJ principal dans des sous-groupes de sujets définis selon leurs caractéristiques (âge, poids, stade de la maladie…).
- Limites :
- Perte de la comparabilité (biais de sélection) en l’absence de stratification préalable
- Diminution de la puissance car petits effectifs
- Inflation du risque α
- Conditions :
- Défini a priori
- Justifiée
- Limitées en nombre
- Randomisation par strate sur la variable qui définit les sous-groupes
- Puissance suffisante pour détecter les interactions
- Ajustement du risque α
- A visée exploratoire
- Test d’interaction. Interaction = mesure dans laquelle l’effet d’un facteur est modifié en fonction de l’action d’un ou de plusieurs autres facteurs.
- Interaction quantitative : le traitement est bénéfique (ou délétère) dans tous les sous-groupes définis par une variable mais a une taille d’effet différente.
- Interaction qualitative : le traitement est bénéfique dans un sous-groupe mais est délétère dans un autre.
- Interprétation :
- Si le résultat du CdJ principal est significatif, si l’interaction est très significative et si elle est justifiée par un argument fort : les résultats des analyses en sous-groupes peuvent être pris en compte dans la conclusion clinique. On peut alors conclure que l’effet du traitement est différent entre les sous-groupes.
- Si le résultat du CdJ principal est non significatif, les analyses en sous-groupes ne sont pas interprétables et doivent rester exploratoires.
- En règle générale, les résultats d’une analyse en sous-groupe nécessitent d’être confirmés dans une autre étude.
- Représentation sous forme de figure :
- Diagramme en forêt. (Forest plot)
- Abscisse : résultat du CdJ principal
- Ordonnée : sous-groupe
E. Analyse de la tolérance
La tolérance est essentielle en tant qu’objectif secondaire dans les essais cliniques. Tous les événements indésirables doivent être décrit dans leur bras de traitement avec leur fréquence de survenue.
On considère comme effet indésirable grave : décès, événement clinique ayant entraîné une prolongation de l’hospitalisation, une incapacité ou une anomalie congénitale.
Les événement indésirables étant rares (surtout les graves), il est rare de pouvoir réaliser des tests statistiques (manque de puissance). Ainsi, l’absence de différence significative du profil de tolérance ne permet pas de conclure à une bonne tolérance du nouveau médicament.
F. Les tableaux et figure
Exercice :
Prescrire : "Analyser la présentation, la précision et la lisibilité des tableaux et des figures, leur cohérence avec le texte et leur utilité"
Exercice N°1 – À la recherche du critère pertinent… pour les patients
Exercice N°6 – Critères combinés, et combines
Exercice N°7 – Omission trompeuse
Exercice N°8 – Gare aux extrapolations
Exercice N°17 – Adopter les conclusions d’une synthèse : pas sans précautions
Exercice N°19 – Ne pas fausser la balance bénéfices-risques
Exercice N°29 – Savoir ne pas relativiser
Exercice N°35 – On ne trouve que ce que l’on cherche
Exercice N°37 – Ça ressemble à du Prescrire, mais ce n’est pas du Prescrire
Exercice N°42 – Ne pas se tromper de casting
Règles générales
- Utilité :
- Comporte un titre informatif, un numéro et un appel dans le texte.
- Fidèle aux résultats
- Pas de redondance
- Compréhensible, même isolé du reste de l’article
- Précision : indices de prévision, de dispersion, test
- Cohérence avec la question étudiée
- Lisibilité
- Organisation :
- Tableau 1 : caractéristiques de l’échantillon, comparaison après randomisation.
- Figure 1 : Flow chart
- Tableau répondant à la question, portant sur le CJP :
- Résultat en valeur absolue
- Sur l’ensemble de l’échantillon (donnée manquante)
a. Tableaux
i. Tableau 1
b. Figure
i. Flow chart
en cours de rédaction…
Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.