Hvad er begrænsningerne ved at bruge R-Squared som et mål for en model's validitet?

Hvad er begrænsningerne ved at bruge R-Squared som et mål for en model's validitet?
Anonim

Svar:

R-kvadratet bør ikke bruges til modelvalidering. Dette er en værdi, du ser på, når du har valideret din model.

Forklaring:

En lineær model valideres, hvis dataene er homogene, følger en normal fordeling, de forklarende variabler er uafhængige, og hvis du ved præcis værdien af dine forklarende variabler (smal fejl på X)

R-kvadratet kan bruges til at sammenligne to modeller, som du allerede har valideret. Den med den højeste værdi er den, der bedst passer til dataene. Det kan dog eksistere bedre indeks, som AIC (Akaike kriterium)