IV. Analyse bivariée

A. Le risque relatif et l’odds ratio

Permet d’évaluer la dépendance entre 2 variables qualitatives binaires.

  • Tableau de contingence :
    • On utilise ce tableau pour se représenter les données.
    • On a 2 variables qualitatives binaires
      • Maladie : positif (malade) ou négatif (sain). C’est l’événement.
      • Exposition : positif(exposé) ou négatif (non exposé). C’est le facteur d’exposition.
    • On a 4 modalités observées :
      • a : malade qui a été exposé
      • b : sain qui a été exposé
      • c : malade qui n’a pas été exposé
      • d : sain qui n’a pas été exposé
M+ M-
exposés a b
non-exposés c d
  • Le risque relatif RR :
    • Définition : risque de survenue d’un événement (malade) dans un groupe exposé à un facteur d’exposition par rapport à un autre groupe non exposé.
    • Anglais : relative risk, R.R.
    • Utilisé dans les études de cohorte.
    • Calcul : RR = [a/(a+b)] / [c/(c+d)]

 

  • L’odds ratio OR :
    • Définition : rapport de la cote d’exposition chez les sujets ayant présenté l’événement (malade) et ceux ne l’ayant pas présenté (non malade).
    • Anglais : odds ratio
    • Synonyme : rapport des cotes, rapport des chances
    • Utilisé dans les études cas-témoins.
    • Calcul : OR = [a/c] / [b/d] = ad/bc

 

  • Interprétation :
    • Ces 2 indices s’interprètent de la même façon.
    • Intervalle de variation : [0 à +∞ [
    • Si =1, pas de dépendance
    • Si <1, association négative, facteur protecteur
    • Si > 1, association positive, facteur de risque
    • Toujours interpréter en fonction de l’IC (Intervalle de Confiance)

 

  • Avantage du RR par rapport à l’OR
    • On peut donner une traduction littérale, une interprétation intuitive au RR mais pas de l’OR.
    • Par ex : un RR égale à 2 signifie que la population exposée a 2 fois plus de risque de présenté l’événement que la population non exposée. Un OR égale à 2 n’aura pas de traduction littérale.

 

  • Comment passer de l’OR au RR ?
    • Dans les études cas témoins, la prévalence d’un événement (la maladie étudiée souvent) ne correspond pas à la prévalence dans la population générale car elle a été mesurée dans un échantillon sélectionné.
    • Lorsque la prévalence de la maladie dans la population générale est rare (< 5-10%), on peut approximer l’OR par le RR.
    • Dans les études de cohorte, la prévalence de l’événement correspond à celle de la population générale, on peut utiliser le RR.

 

  • Cas particulier des variables censurées : le rapport des risques instantanés

Exercice Prescrire : B.A.-BA n°2 : “Différence des risques absolus, risque relatif, variation relative du risque, nombre de patients à traiter (NNT)”

B. Le rapport des risques instantanés (Hazard ratio)

  • Définition : risque de mourir (variable censurée) si on est exposé à un facteur d’exposition (variable qualitative binaire) à un moment donné.
  • Anglais : Hazard Ration, HR
  • Calcul : à partir du modèle de Cox. Il correspond au rapport des risques instantanés dans le groupe traité  divisé par le risque dans le groupe contrôle.
  • Interprétation : Il s’interprète comme le RR mais a la particularité d’être variable dans le temps.
  • Exemple ici 

C. Coefficient de corrélation de Pearson

  • Définition : mesure de l’intensité de la relation entre 2 variables quantitatives et de son sens lorsque cette relation est monotone.

 

  • Condition d’application :
    • Distribution normale
    • Variables quantitatives continues
    • Pas de valeurs extrêmes

 

  • Calcul :
    • R(X,Y) = Cov(X,Y)/ox.oy

pearson

  • Interprétation :
    • Compris entre -1 et +1
    • Le signe de r indique le sens de la relation :
      • – : négative
      • + : positive
    • La valeur absolue de r indique l’intensité de la relation, de la capacité à prédire la valeur de la 2ème variable lorsque l’on connaît la valeur de la 1ère
      • 0 : nulle
      • 0,5 : faible
      • 0,75 : moyenne
      • 0,9 : forte
      • 1 : parfaite

 

  • Significativité de la corrélation :
    • Le calcul du coefficient de corrélation ne constitue que la 1ère étape pour analyser la relation entre 2 variables. Cette étape exploratoire doit être validée par un test de significativité. Il faut s’assurer que cette corrélation n’est pas due au hasard.
    • On fixe l’hypothèse H0 : il n’y a pas de relation entre les 2 variables.

 

  • Absence de biais : on peut obtenir un résultat biaisé qui sera significatif mathématiquement mais faux en réalité.
    • Influence d’une valeur exceptionnelle : dans cet exemple, la valeur exceptionnelle va permettre d’obtenir une corrélation positive alors que d’après le graphique elle est négative.
    • Emboîtement des relations et composantes d’échelle : dans cet exemple, il existe bien une relation positive mais lorsqu’on regarde les 3 sous-populations, on observe qu’il existe une relation négative. Il existe une composante d’échelle (population/sous-population) dans la relation observée avec des conclusions variables en fonction de l’échantillon considéré.
    • Conclusion erronée sur l’absence de relation : il existe bien une relation (non-linéaire et non-monotone) alors que r = 0.

D. Coefficient de corrélation de Spearman

Ce coefficient est identique à celui de Pearson, sauf qu’il s’applique lorsqu’on ne peut pas utiliser Pearson. Il s’interprète de la même façon.

Synonyme : coefficient de corrélation de rang

 

  • Quand l’utiliser ?
    • Distribution non normale des variables
    • Coefficient de Pearson semble influencé par des valeurs extrêmes
    • Variables qualitatives

E. Coefficient de corrélation intraclasse

Il permet d’évaluer la concordance entre 2 variables quantitatives. Il permet de déterminer si la variation des mesures est dû au hasard ou pas.

  • Calcul : via un logiciel statistique
  • Interprétation : ?

En cours de rédaction…

F. Diagramme de Bland – Altman

Ce diagramme permet d’évaluer la concordance entre 2 instruments qui mesurent une même variable quantitative.

Ex : 2 glucomètres

  • Construction :
    • Abscisse : valeur moyenne entre les 2 instruments pour chaque sujet.
    • Ordonnée : différence entre les 2 mesures pour chaque sujet.
    • Limites d’agrément (limits of agreement)
      • Calcul d : différence moyenne
      • Calcul sdd : écart-type des différences
      • Calcul limite inférieur et supérieur (intervalle de confiance à 95%) : d ± 2sdd
  • Interprétation :
    • d : moyenne des différences. Il nous indique si un instrument tend à donner des mesures systématiquement trop basses ou trop élevées. Il peut être considéré comme la mesure du biais entre les 2 instruments.
    • Limites d’agrément : 95% de nos différences de mesure se situeront entre d ± 2 sdd. On ne peut pas faire de test statistique sur un graphique de Bland-Altman, il faut donc se demander quelle différence de mesure entre les 2 instruments est considérée comme acceptable ?

 

  • Intérêt :
    • Donne la dispersion des variables pour l’ensemble du spectre des moyennes.
    • Donne le biais : différence moyenne entre les mesures par les 2 tests.
    • Permet de repérer si le test est plus performant pour une valeur particulière.
    • Pas de gold standard.

 

  • Limite :
    • Pas de test statistique, p non calculable.
    • Il faut fixer quelle différence de mesure entre les 2 instruments paraît acceptable.

 

  • Pourquoi ne peut-on pas utiliser le coefficient de corrélation de Pearson pour établir la concordance entre 2 instruments ?
    • On ne veut pas uniquement savoir si ces valeurs sont corrélées, on veut aussi savoir si les mesures sont identiques.
    • Bland-Altman indique la différence systématique entre les 2 mesures (d).

Dans cet exemple issu du CRCHUM, la corrélation entre les 2 instruments est très bonne (0,9) mais le graphique de Bland-Altman nous indique que la concordance entre les instruments de gauche est mauvaise avec d = 2 alors que la concordance avec les instruments de droite est bonne avec d = 0.

Ainsi pour une valeur du coefficient de Pearson identique, on obtiendra une concordance de test différente.
bland pearson

G. Coefficient Kappa

Il permet d’évaluer la concordance entre 2 variables qualitatives ayant les mêmes modalités. Il permet de déterminer si la variation des mesures est due au hasard ou pas.

  • Calcul :
    • Kappa = (concordance observée – concordance due au hasard)/(1 – concordance due au hasard)

 

  • Interprétation :
    • Kappa n’est pas un test statistique. Il fournit un indicateur numérique de ce que l’on cherche à mesurer mais son interprétation reste subjective. On peut s’aider du tableau suivant :
κ concordance
1,00 – 0,81 Excellente
0,80 – 0,61 Satisfaisante
0,60 – 0,41 Moyenne
0,40 – 0,21 Faible
0,20 – 0,00 Très faible
< 0 Grand désaccord
  • Intervalle :
    • Compris entre – 1 et 1
    • < 0 : désaccord total
    • 0 : aucune concordance
    • 1 : concordance parfaite
  • Bien que ces valeurs soient arbitraires, on estime qu’il doit être > 0,8 dans les études médicales.

H. Sensibilité, spécificité, VPP, VPN, RV, courbe ROC

Ces mesures permettent d’évaluer la concordance entre 2 variables qualitatives binaires.

En pratique, on les retrouve dans les études diagnostiques.

La performance peut se décomposer en 2 catégories :

  • Performance intrinsèque :
    • Définition : c’est la capacité informative propre du test, ne dépendant pas de la prévalence de la maladie.
    • On l’estime grâce à la sensibilité (Sn), la spécificité (Sp), le rapport de vraisemblance positif (RVP) et négatif (RVN).
  • Performance extrinsèque :
    • Définition : c’est la capacité informative du test en fonction de ses caractéristiques intrinsèque et un contexte d’utilisation (la prévalence = probabilité pré-test).
    • On l’estime grâce à la valeur prédictive positive (VPP) et négative (VPN), c’est la probabilité post-test.

 

  • Tableau de contingence

On va déterminer si notre test a de bonne capacité discriminante M-/M+. Ces indicateurs sont assez théoriques car on ne prend pas en compte le contexte (la prévalence).

C’est un tableau à double entrée permettant d’estimer la dépendance entre 2 caractères. Ici, on choisit comme variable le statut malade (M+ ou M-) et le résultat du test (T+ ou T-).

T+ T-
M+ VP FN
M- FP VN

Ce tableau nous permet de déterminer 4 catégories de sujets :

  • VP : Vrai Positif. Sujet malade ayant le test positif.
  • FN : Faux Négatif. Sujet malade ayant le test négatif.
  • FP : Faux Positif. Sujet sain ayant le test négatif.
  • VN : Vrai Négatif. Sujet sain ayant le test négatif.

Pour qu’un test diagnostique soit de bonne qualité, il faut obtenir des VP et VN élevées et des FP et FP faibles. On va pouvoir étudier la relation entre ces 4 catégories grâce au calcul de différents paramètres.

1. Sensibilité et spécificité

  • Sensibilité :
    • Définition :
      • Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement des individus affectés par une maladie ou par un problème de santé.
      • La sensibilité d’un test correspond à la probabilité que le test soit positif chez les personnes malades = p (T+/M+)
    • Calcul :
      • Sn = VP/(VP+FN)
  • Spécificité
    • Définition :
      • Capacité d’un diagnostic ou d’un test de dépistage à identifier correctement les individus non-affectés par une maladie ou par un problème de santé.
      • La spécificité d’un test correspond à la probabilité que le test sera négatif parmi les personnes non-malades = p (T-/M-)
    • Calcul :
      • Sp = VN/(VN+FP)

Se et Sp

Exercice Prescrire : B.A.-BA n°3 : “Sensibilité, spécificité”

2. Courbe ROC

Définition : un outil graphique permettant de représenter la capacité d’un test à discriminer entre la population des malades et des non-malades.

En anglais : ROC (Receiving Operating Curve)

 

  • Objectifs :
    • Evaluer la performance globale d’un test diagnostic (à variable de réponse quantitative continue).
    • Comparer 2 tests diagnostiques.
    • Définir le seuil de validité optimal d’un test diagnostique.

 

  • Construction de la courbe :
    • Ordonnée : taux de Vrai Positif = Se = P (T+/M+)
    • Abscisse : taux de Faux Positif = 1 – Sp = P (T+/M-)
    • Ces taux varient en fonction du seuil du test (seuil qui détermine si le test est positif ou négative, par ex : valeur seuil du dosage du BNP).
    • Dans l’illustration ci-dessous, la courbe bleue correspond à la distribution de la variable quantitative dans un groupe (par ex : le taux de BNP chez des sujets sains) et la courbe rouge correspond à celle dans un autre groupe (par ex : le taux de BNP chez des sujets ayant une insuffisance cardiaque)

roc

  • Interprétation :
    • Pour évaluer la performance d’1 test :
      • On calcule l’aire sous la courbe : AUC (Area Under Curve)
      • Valeur comprise entre 0,5 et 1
      • 1 : test parfait
      • 0,5 : test inutile
      • En pratique, le test est valable si AUC > 0.7
    • Pour comparer la performance de 2 tests :
      • On va comparer les 2 courbes et faire un test statistique pour déterminer s’il existe une différence.
    • Définir le seuil de validité optimal d’un test.
      • Il correspond au point d’inflexion de la courbe (le plus en haut à gauche). Pour une valeur donnée, la Se et la Sp seront optimales.
      • En pratique, on le choisit en fonction de l’objectif du test :
        • Dépistage : Se ~ 100% avec meilleur Sp possible. On choisit un point à droite
        • Diagnostic : Sp ~ 100% avec meilleur Sn possible. On choisit un point à gauche.
    • Plus le résultat du test est différent entre les 2 groupes, plus la courbe ROC aura un AUC élevé, plus le test sera discriminant. Dans l’illustration ci-dessous, on fait varier le résultat du test dans les 2 groupes et on voit une modification de la courbe ROC. Par ex : le test sera plus discriminant si le taux de BNP est de 100 chez les non malades et de 10 000 chez les malades, plutôt que 500 chez les malades et 550 chez les non-malades.

ROC moyenne

3. Rapport de vraisemblance

Définition : estimation du rapport entre la probabilité d’avoir un test positif (ou négatif) chez les sujets malades et celui d’avoir un test positif (ou négatif) chez les sujets sains.

Autrement dit, il correspond à la probabilité post test de la maladie par rapport à sa prévalence.

En anglais : LR , Likelihood Ratio

 

 

  • Rapport de vraisemblance positif (RVP) :
    • Définition : combien de fois est-il plus vraisemblable d’être malade (M+) sachant qu’on a le test positif (T+) ?
    • Calcul : RVP = Se/(1-Sp)
  • Rapport de vraisemblance négatif (RVN) :
    • Définition : combien de fois est-il plus vraisemblable d’être sain (M-) sachant qu’on a le test négatif (T-) ?
    • Calcul : RVN = (1-Se)/Sp
  • Nomogramme FaganNomogramme de Fagan:
    • Nomogramme = outil graphique de calcul constitué de courbes graduées entre lesquelles on place une règle. Le résultat de l’opération se lit au croisement de la règle et de l’une des courbes.
    • Intérêt : il permet de calculer la probabilité post-test connaissant le RV et la prévalence : p (post-test) = p (pré-test) x RV
  • Interprétation : c’est un ratio qui s’interprète comme un RR.
  • Avantages :
    • Indépendant de la prévalence
    • Cliniquement significatif pour le clinicien
RVP RVN Apport diagnostique
> 10 < 0,1 Très fort
5 – 10 0,1 – 0,2 Fort
2 – 5 0,2 – 0,5 Modéré
1 – 2 0,5 – 1 Faible
1 1 nul

Exercice Prescrire : B.A.-BA n°5 : “Rapport de vraisemblance”

4. Valeur prédictive positive et négative

  • Valeur prédictive positive (VPP)
    • Définition :
      • Capacité du test de distinguer les personnes malades (vrais positifs) de l’ensemble des personnes dont le résultat au test est positif (vrais positifs + faux positifs).
      • Probabilité qu’une personne qui a un test positif soit effectivement atteinte par la maladie ou le problème de santé = p (M+/T+).
    • Calcul :
      • VPP = VP / (VP+FP)
      • VPP = RVP x prévalence
  • Valeur prédictive négative (VPN)
    • Définition :
      • Capacité d’un test à distinguer les personnes saines (vrais négatifs) de l’ensemble des personnes dont le résultat au test est négatif (vrais négatifs + faux négatifs).
      • Probabilité qu’une personne au test négatif ne soit pas atteinte par la maladie ou par le problème de santé = p (M-/T-).
    • Calcul :
      • VPN = VN / (VN+FN)
      • VPN = RVN x prévalence

Exercice Prescrire : B.A.-BA n°3 : “Sensibilité, spécificité”