La causalité est le domaine des
statistiques qui est le plus souvent mal utilisé et mal interprété par des
non-spécialistes. Des sources médiatiques, des politiciens et des groupes de
pression souvent sautent sur une corrélation perçue, et l'utilisent pour
«prouver» leurs propres croyances. Ils ne comprennent pas que, simplement parce
que les résultats montrent une corrélation, il n'existe aucune preuve d'un lien
de causalité sous-jacente.
La mesure la
plus courante de la corrélation est le coefficient de corrélation Pearson.
C’est une mesure linéaire de la corrélation entre deux variables.
Coefficient de corrélation de pearson
|
Toutefois, la corrélation entre deux variables n’est
pas tout le temps linéaire. Une corrélation peut être quadratique, exponentiel
ou polynomial.
Corrélation quadratique
|
Correlation exponentiel
|
Correlation polynomial
|
La causalité est une tout autre chose. La causalité explique la raison pour laquelle un certain événement se produit se produit. La causalité est beaucoup plus difficile à prouver que la corrélation. Egalement, la corrélation n'implique pas la causalité.
Corrélation spurious
Ceci qualifie les corrélations qui n'ont pas de relation de causalité entre elles. Ceci peut être dû à la coïncidence ou peut être qu'une variable externe fait que les deux variables sont corrélées.
Ainsi le coefficient de corrélation doit être interprété avec attention, car il peut être significatif pour deux variables qui n'ont pas de rapport entre elles. De plus, une corrélation forte n'implique pas statistiquement que la corrélation entre deux variables est significative. Pour cela il faut faire un test de corrélation.
Commentaires
Enregistrer un commentaire