Posté le 1er octobre 2018 par Eveliina Ilola
La confusion désigne la distorsion de l’association entre les variables indépendantes et dépendantes parce qu’une troisième variable est indépendamment associée aux deux.
Une relation causale entre deux variables est souvent décrite comme la manière dont la variable indépendante affecte la variable dépendante. La variable indépendante peut prendre différentes valeurs indépendamment, et la variable dépendante varie en fonction de la valeur de la variable indépendante.
Disons que vous voulez découvrir comment la consommation d’alcool affecte la mortalité…
Vous décidez de comparer les taux de mortalité entre deux groupes – l’un composé de gros consommateurs d’alcool, l’autre composé de teetotallers. Dans ce cas, la consommation d’alcool serait votre variable indépendante et la mortalité serait votre variable dépendante.
Si vous constatez que les personnes qui consomment plus d’alcool sont plus susceptibles de mourir, il pourrait sembler intuitif de conclure que la consommation d’alcool augmente le risque de décès. En réalité, cependant, la situation pourrait être plus complexe. Il est possible que la consommation d’alcool ne soit pas le seul facteur affectant la mortalité qui diffère entre les deux groupes.
Les personnes qui consomment moins d’alcool pourraient être plus susceptibles d’avoir une alimentation plus saine ou moins susceptibles de fumer, par exemple. Le fait d’avoir un régime alimentaire sain ou de fumer pourrait à son tour affecter la mortalité. Ces autres facteurs d’influence sont appelés variables de confusion. Si vous les ignorez et supposez que toute différence de mortalité est due à une différence de consommation d’alcool, vous risquez d’obtenir des résultats qui ne reflètent pas vraiment la réalité. Vous pourriez trouver des associations là où en réalité il n’y en a pas, ou ne pas trouver d’associations là où elles existent bel et bien.
Comment minimiser les effets de confusion pendant la conception de l’étude
Si vous étudiez les effets d’une intervention, vous pouvez répartir les personnes de manière aléatoire dans un groupe d’intervention et un groupe témoin. L’objectif de la randomisation est de répartir uniformément les facteurs de confusion connus et inconnus entre les deux groupes. Les groupes peuvent encore différer en termes de facteurs de confusion potentiels par hasard, mais la randomisation minimise ces différences.
Dans d’autres types d’études, vous pouvez traiter les facteurs de confusion par la restriction ou l’appariement. La restriction consiste à n’étudier que des personnes similaires en termes de variable confondante – par exemple, si vous pensez que l’âge est une variable confondante, vous pourriez choisir de n’étudier que les personnes âgées de plus de 65 ans. (Cela limiterait évidemment l’applicabilité de vos résultats à d’autres groupes). L’appariement consiste à jumeler les personnes dans les deux groupes en fonction des facteurs de confusion potentiels.
Comment minimiser les effets de la confusion pendant l’analyse statistique
Après avoir terminé l’étude, vous pouvez minimiser les effets de la confusion en utilisant des méthodes statistiques.
S’il n’y a qu’un petit nombre de facteurs de confusion potentiels, vous pouvez utiliser la stratification. Dans la stratification, vous produisez des groupes plus petits dans lesquels les variables confondantes ne varient pas, puis vous examinez la relation entre la variable indépendante et la variable dépendante dans chaque groupe. Dans l’exemple que nous avons utilisé précédemment, par exemple, vous pourriez vouloir diviser l’échantillon en groupes de fumeurs et de non-fumeurs et examiner la relation entre la consommation d’alcool et la mortalité au sein de chacun d’eux.
S’il y a un plus grand nombre de facteurs de confusion potentiels, vous pouvez utiliser une analyse multivariée, par exemple une régression logistique ou linéaire.
Conclusions
L’association entre deux variables pourrait être modifiée par une troisième variable, et cela peut conduire à des résultats faussés. Même après en avoir tenu compte dans la conception de l’étude et l’analyse des données, vos données pourraient encore être faussées par la confusion – il pourrait par exemple y avoir d’autres facteurs de confusion dont vous n’avez pas connaissance – mais les premières étapes pour réduire ses effets consistent à être conscient de son potentiel à fausser vos résultats et à planifier en conséquence.
Sources :
Pourhoseingholi, M. A., Baghestani, A. R., & Vahedi, M. (2012). Comment contrôler les effets confondants par l’analyse statistique. Gastroentérologie et hépatologie Du lit au banc, 5(2), 79-83.
Catalogue of bias collaboration, Aronson JK, Bankhead C, Nunan D. Confounding. In Catalogue Of Biases. 2018. https://catalogofbias.org/biases/confounding/
http://www.ucl.ac.uk/ich/short-courses-events/about-stats-courses/stats-rm/chapter_1_content/Confounding_Factors
.