Hvorfor indikerer ikke en R-kvadreret værdi noget om årsagssammenhæng?

Hvorfor indikerer ikke en R-kvadreret værdi noget om årsagssammenhæng?
Anonim

Svar:

En R-kvadreret angiver, hvor godt de observerede data passer til de forventede data, men det giver kun oplysninger om korrelation.

Forklaring:

En R-kvadreret værdi angiver, hvor godt dine observerede data, eller de data, du har samlet, passer til en forventet tendens. Denne værdi fortæller dig styrken af forholdet, men ligesom alle statistiske tests er der intet givet, der fortæller årsagen bag forholdet eller dets styrke.

I eksemplet nedenfor kan vi se grafen til venstre har intet forhold, som angivet ved lav R-kvadreret værdi. Grafen til højre har et meget stærkt forhold, som indikerer med R-kvadreret værdi på 1. I ingen af disse grafer kan vi fortælle, hvad der i sidste ende forårsager dette forhold.

Korrelation betyder ikke årsagssammenhæng. Dine X-værdier kan meget vel påvirke dine Y-værdier, men andre faktorer kan være i spil, eller forholdet kan skyldes tilfældigheder. Du kan udlede årsag, men det er din fortolkning, og det kan ikke bevises ved statistisk testning. At have en høj R-kvadreret værdi fortæller dig kun styrken af forholdet, men ikke dens årsag.

At bevise årsagssammenhæng er en meget stor opgave. Hvis du vil forstå årsagssammenhæng, er din bedste indsats gennem eksperimenter.