Accéder au contenu principal

Corrélation et causalité


La causalité est le domaine des statistiques qui est le plus souvent mal utilisé et mal interprété par des non-spécialistes. Des sources médiatiques, des politiciens et des groupes de pression souvent sautent sur une corrélation perçue, et l'utilisent pour «prouver» leurs propres croyances. Ils ne comprennent pas que, simplement parce que les résultats montrent une corrélation, il n'existe aucune preuve d'un lien de causalité sous-jacente.

La mesure la plus courante de la corrélation est le coefficient de corrélation Pearson. C’est une mesure linéaire de la corrélation entre deux variables.  

Coefficient de corrélation de pearson

Toutefois, la corrélation entre deux variables n’est pas tout le temps linéaire. Une corrélation peut être quadratique, exponentiel ou polynomial.

Corrélation quadratique
Correlation exponentiel
Correlation polynomial

La causalité est une tout autre chose. La causalité explique la raison pour laquelle un certain événement se produit se produit. La causalité est beaucoup plus difficile à prouver que la corrélation. Egalement, la corrélation n'implique pas la causalité.

Corrélation spurious   


Ceci qualifie les corrélations qui n'ont pas de relation de causalité entre elles. Ceci peut être dû à la coïncidence ou peut être qu'une variable externe fait que les deux variables sont corrélées.

Ainsi le coefficient de corrélation doit être interprété avec attention, car il peut être significatif pour deux variables qui n'ont pas de rapport entre elles. De plus, une corrélation forte n'implique pas statistiquement que la corrélation entre deux variables est significative. Pour cela il faut faire un test de corrélation.

Commentaires