Dans le blog précédent "Pourquoi la précision globale n'est pas suffisante", la nécessité d'examiner plusieurs mesures de la performance clinique pour les tests de diagnostic in vitro a été discutée et a montré que la précision globale en elle-même n'est pas suffisante pour décrire la performance clinique des tests de diagnostic in vitro. Les concepts de sensibilité et de spécificité ont été abordés, ainsi que les valeurs prédictives positives et négatives (VPP et VPN).
Ce blog approfondira les valeurs prédictives positives (VPP) et les valeurs prédictives négatives (VPN) et leur utilisation comme moyen d'envisager l'établissement de limites pour la sensibilité et la spécificité. Les définitions utilisées sont présentées dans le tableau standard 2x2 (tableau 1), couramment utilisé pour comparer une nouvelle méthode d'analyse qualitative à une méthode de référence ou à une vérité clinique.
Tableau 1 : tableau standard 2x2 utilisé pour comparer un nouvel essai à une méthode de référence
Où : TP (vrai positif) = positif de référence
- TP (vrai positif) = référence positive et méthode positive
- FP (faux positif) = référence négative et méthode positive
- FN (faux négatif) = positif de référence et négatif de la méthode
- TN (vrai négatif) = référence négative et méthode négative
Définitions des principales statistiques de performance :
- Précision = 100 x (TP+TN)/N
- Sensibilité = 100 x TP/(TP+FN)
- Spécificité = 100 x TN/(FP+TN)
- Prévalence de la maladie = 100x(TP+FN)/N
- Valeur prédictive positive (VPP) = 100x TP/(TP+FP)
- Valeur prédictive négative (VPN) = 100xTN/(FN+TN)
Ce tableau 2x2 montre que la sensibilité et la spécificité sont indépendantes de la prévalence. Examinons cela de plus près à l'aide d'un exemple qui démontre cette indépendance.
Si nous réalisons une étude pour estimer la sensibilité et la spécificité, la performance attendue sous-jacente de la sensibilité et de la spécificité reste la même si la prévalence passe de 50 % à 1 % (tableaux 2a et 2b).
Tableau 2 : Exemples de sensibilité et de spécificité avec A.) une prévalence de 50 % et B.) une prévalence de 1 %.
Prévalence = 100/200 = 50
Sensibilité = 95/100 = 95%
Spécificité = 99/100 = 99%
PPV = 95/96 = 99%
NPV = 99/104 = 95.2%
Prévalence = 100/10000 = 1%
Sensibilité = 95/100 = 95%
Spécificité = 9801/9900 = 99%
PPV = 95/194 = 49%
NPV = 9801/9806 = 99,9%
Il est important de se rappeler que la sensibilité et la spécificité examinent les performances par rapport à la vérité clinique du patient ou du test de référence. Si le patient est positif ou négatif, dans quel pourcentage de cas ce test est-il correct (sensibilité et spécificité) par rapport à la vérité clinique ou au test de référence ?
La valeur prédictive positive et la valeur prédictive négative examinent le tableau 2x2 dans le sens du résultat du nouveau test. Les valeurs prédictives sont, étant donné un résultat positif (ou négatif) du nouveau test, le pourcentage de fois où le nouveau test est correct par rapport au nombre de résultats positifs rapportés par le nouveau test ? En d'autres termes, quel est le pourcentage de résultats positifs (ou négatifs) du nouveau test qui sont en fait positifs (ou négatifs) cliniquement ou avec le test de référence ? La VPP est une estimation des résultats positifs et la VPN est la même pour les résultats négatifs, du point de vue du nouveau test.
Il s'agit d'éléments d'information essentiels dont le clinicien a besoin pour déterminer l'étape suivante du parcours diagnostique. Le résultat du test est positif (ou négatif), quelle est la probabilité qu'il soit vrai ?
Par exemple, la série de tableaux 2x2 ci-dessus (test A et test B, tableaux 2a et 2b) a exactement la même sensibilité et la même spécificité (95 % et 99 % respectivement), le test A ayant une prévalence de 50 % et le test B une prévalence de 1 %. La VPP passe de 99 % avec une prévalence de 50 % à 49 % avec une prévalence de 1 %. Une VPP de 99 % indique qu'un résultat positif a 99 % de chances d'être correct. De même, avec une VPP de 49 %, il n'y a que 49 % de chances que le patient soit réellement positif. En fonction de l'utilisation prévue du produit, l'une de ces valeurs prédictives, les deux ou aucune d'entre elles peuvent être suffisantes. Ce qu'il faut retenir, c'est que la VPP (et la VPN) indique la probabilité que le résultat d'un nouveau test soit correct.
Comme les valeurs prédictives impliquent la sensibilité et la spécificité du test et la prévalence de la maladie ou de l'affection dans la population à laquelle il est destiné, on peut voir que des utilisations différentes d'un même test peuvent donner lieu à des valeurs prédictives très différentes. Pour déterminer les exigences de sensibilité et de spécificité d'un test, il est essentiel d'examiner la prévalence attendue pour estimer la VPP et la VPN attendues et de les examiner dans le contexte de l'utilisation prévue.
Les DIV ont différentes utilisations ou finalités, par exemple le dépistage, le diagnostic, le pronostic, etc. La façon dont le clinicien utilisera le résultat du test doit déterminer les exigences en matière de VPP et de VPN. La probabilité qu'un résultat incorrect se produise lors de l'utilisation du nouveau test et les différents risques de faux positifs et de faux négatifs doivent être pris en compte. Jusqu'à quel point la VPP et la VPN peuvent-elles être faibles tout en conservant un rapport bénéfice-risque positif pour l'utilisation de ce nouveau test ? Cela déterminera les exigences en matière de sensibilité et de spécificité, compte tenu de la prévalence estimée dans la population visée.
Par exemple, supposons qu'il existe un besoin pour un test dont la VPP doit être ≥ 90 % et la VPN ≥ 99 %, avec une prévalence attendue de 20 %. Cela signifie qu'il faut un niveau de confiance élevé lorsque le résultat du nouveau test est négatif et que les cliniciens peuvent tolérer quelques nouveaux tests positifs supplémentaires qui sont faux. Voici un ensemble de sensibilité et de spécificité qui répondent aux exigences de VPP et de VPN pour une prévalence de 20 % (tableau 3).
Tableau 3 : Ensemble de VPP et de VPN par prévalence pour une sensibilité de 96 % et une spécificité de 98 %.
Une sensibilité de 96 % et une spécificité de 98 % à une prévalence de 20 % satisfont aux exigences de VPP (≥90 %) et de VPN (≥99 %). Il existe de nombreuses combinaisons de sensibilité et de spécificité à une prévalence de 20 % qui répondent aux exigences de VPP et de VPN. En fonction des spécificités du test, il peut être plus facile de satisfaire à une série de critères de sensibilité et de spécificité qu'à une autre afin de respecter les critères de VPP et de VPN. Il convient d'en tenir compte avant de fixer les exigences de sensibilité et de spécificité pour le test.
Une autre raison d'examiner l'impact de la prévalence sur la VPP et la VPN pour un ensemble donné de valeurs de sensibilité et de spécificité est que toutes les valeurs de prévalence sont des estimations. La prévalence doit être estimée à partir d'un essai clinique qui représente réellement la population d'utilisation prévue et qui est basé sur la vérité clinique ou le test de référence (et non sur le nouveau test). Dans l'exemple ci-dessus, si la meilleure estimation de la prévalence était de 20 %, mais qu'elle pouvait être aussi basse que 10 %, cela pourrait poser un problème car la VPP tomberait en dessous de 90 %. Il est donc important de comprendre la qualité des estimations de la prévalence et leur lien avec la population spécifique à laquelle le test est destiné.
Lorsque l'on envisage de fixer des exigences pour un essai DIV, il est important de comprendre comment l'essai sera utilisé, quels niveaux minimaux de VPP et de VPN peuvent être tolérés dans le contexte de l'utilisation clinique et de la prévalence dans la population d'utilisation prévue. Au début d'un nouveau projet de développement d'un essai, tout ou partie de ces informations peuvent être inconnues. Il est essentiel, au cours des premières phases de développement, de combler ces lacunes à un degré ou à un autre afin d'éviter de mettre au point un essai DIV qui ne répond à aucun besoin clinique.