La pondération inverse (ou IPTW), une technique alternative à l’appariement par score de propension

Last Updated: 21 January 2022Tags: , ,

Contexte

Dans le cadre d’analyses rétrospectives visant à analyser deux traitements (A et B), il est fort probable que certaines des caractéristiques des patients (âge, sexe, groupe sanguin, co-morbidités, antécédents médicaux, etc.) soient déséquilibrées entre les groupes de traitement. Ces variables qui ne sont pas distribuées/réparties de la même manière entre deux groupes ou plus sont appelés facteurs confondants. Lorsqu’on analyse l’effet de notre traitement sur une variable réponse (que ce soit un événement comme la survie ou la rechute, une mesure biologique, etc.), il devient nécessaire, voire indispensable, de pouvoir corriger le tir pour estimer un effet ajusté, c’est-à-dire sans biais, en tenant compte de ces facteurs confondants, qui deviennent des co-variables d’ajustement.

La problématique

La méthode courante pour ajuster l’effet du traitement est le modèle multivarié intégrant les facteurs confondants mais un des soucis est que l’ajout de variables d’intérêt « sur-paramètre »
le modèle. Une des solutions pour créer les conditions d’une « pseudo-randomisation » :
le score de propension servant de critère d’appariement afin de créer 2 groupes de traitement de taille et caractéristiques similaires. Mais cette méthode n’est pas toujours applicable, d’où la pondération inversée.

La réponse

Rappel : le calcul du score de propension (SP) s’obtient à partir d’une régression logistique multivariée ayant comme réponse le fait d’être exposé au traitement B (si A est choisi comme traitement de référence) en fonction des facteurs confondants (plus d’autres variables cliniquement pertinentes le cas échéant). Ce score obtenu pour chaque patient donne donc bien la probabilité d’être réparti dans le groupe de traitement B par rapport au groupe A.

La méthode de pondération inversée revient à donner pour chaque patient un poids, qui peut être calculé de deux manières :

  • si l’on considère que le traitement est susceptible d’être donné à n’importe quel patient, alors ce poids se calcule comme étant l’inverse du SP (soit 1/SP) pour les patients prenant le traitement B et 1/(1-SP) pour les patients recevant le traitement A. On parle alors de pondération suivant « l’effet moyen du traitement » ou ATE, pour average treatment effect ;
  • dans le cas où les variables confondantes peuvent potentiellement influer sur le choix du traitement, ce poids est égal à Traitement (variable codée A=0/B=1) + PS x (1−Traitement)/(1−PS). Selon cette formule, les patients du groupe B ont un poids égal à 1. On parle de pondération selon « l’effet moyen du traitement sur les personnes traités » ou ATT en anglais pour average treatment effect in the treated (traitement B dans notre cas présent).

Ce poids peut être ensuite pris en compte dans les modèles de régression, qu’ils soient linéaires, logistiques, de Cox, etc., afin d’estimer l’effet ajusté du traitement B par rapport à A. Il existe pour ce faire une option ‘weight’ à compléter dans les commandes de régressions dans les divers logiciels de statistiques.

Actuellement, de nouvelles techniques de pondération sont de plus en plus recommandées, notamment celle « doublement robuste » (‘doubly robust’ en anglais) qui est de plus en plus utilisée pour à la fois limiter les biais et améliorer la prédiction des modèles. Pour cela, on utilise des pondérations dites « augmentées » en passant non pas par une régression logistique classique pour le calcul du SP mais par un outil de machine learning, la régression généralisée « boostée » qui se base sur des arbres de décisions.

Ce qu’il faut retenir

  • La méthode de la pondération inverse se base sur le score de propension.
  • C’est une bonne alternative pour étudier l’effet d’une variable en soustrayant les biais lorsqu’on on est en présence d’un petit échantillon de patients.
  • Il existe de nouvelles méthodes plus robustes pour améliorer la performance des modèles passant par cette méthode.

Pour aller plus loin

  1. S. R. Cole and M. A. Hernán, “Constructing inverse probability weights for marginal structural models,” American journal of epidemiology, vol. 168, no. 6, pp.656–664, 2008
  2. Robins, J.M., Hernán, M.A. & Brumback, B.A. (2000). “Marginal structural models and causal inference in epidemiology”. Epidemiology, 11, 550-560.
  3. Peter C Austin. “Variance estimation when using inverse probability of treatment weighting (IPTW) with survival analysis”. Statistics of Medecine, 35(30): 5642–5655, 2016.

Auteur/autrice

Leave A Comment