Hvad er forholdet mellem R-Squared og korrelationskoefficienten af en model?

Hvad er forholdet mellem R-Squared og korrelationskoefficienten af en model?
Anonim

Svar:

Se dette. Kredit til Gaurav Bansal.

Forklaring:

Jeg forsøgte at tænke på den bedste måde at forklare dette på, og jeg snuble over en side, der gør et rigtig flot job. Jeg vil hellere give denne fyr kredit for forklaringen. Hvis linket ikke virker for nogle, har jeg medtaget nogle oplysninger nedenfor.

Kort sagt: # R ^ 2 # værdi er simpelthen kvadratet af korrelationskoefficienten # R #.

Det korrelationskoefficient (# R #) af en model (sig med variabler #x# og # Y #) tager værdier mellem #-1# og #1#. Det beskriver hvordan #x# og # Y # er korrelerede.

  • Hvis #x# og # Y # er i perfekt sammenhæng, så vil denne værdi være positiv #1#
  • Hvis #x# stiger under # Y # falder på nøjagtigt den modsatte måde, så vil denne værdi være #-1#
  • #0# ville være en situation, hvor der ikke er nogen sammenhæng mellem #x# og # Y #

Men dette # R # Værdien er kun nyttig for en simpel lineær model (bare en #x# og # Y #). Når vi overvejer mere end en uafhængig variabel (nu har vi # X_1 #, # X_2 #, …), er det meget svært at forstå, hvad korrelationskoefficienten betyder. Sporing, hvilken variabel der bidrager til, hvad til korrelationen er ikke så klart.

Det er her # R ^ 2 # værdi kommer i spil. Det er simpelthen kvadratet af korrelationskoefficienten. Det tager værdier mellem #0# og #1#, hvor værdier tæt på #1# indebære mere korrelation (enten positivt eller negativt korreleret) og #0# indebærer ingen sammenhæng. En anden måde at tænke på er som den fraktionelle variation i den afhængige variabel, der er resultatet af alle de uafhængige variabler. Hvis den afhængige variabel er stærkt afhængig af alle dens uafhængige variabler, vil værdien være tæt på #1#. Så # R ^ 2 # er meget mere nyttigt, da det også kan bruges til at beskrive multivariate modeller.

Hvis du vil have en diskussion om nogle af de matematiske begreber, der er involveret i forbindelse med de to værdier, se dette.