Hvordan udfører jeg lineær regression på data?

Hvordan udfører jeg lineær regression på data?
Anonim

Svar:

Du skal se det fulde svar for at forstå

Forklaring:

Jeg ved ikke helt, hvad du mener først, får du dit datasæt, hvor du regress y på x for at finde ud af, hvordan en ændring i x-effekter y.

x y

1 4

2 6

3 7

4 6

5 2

Og du vil finde forholdet mellem x og y så sig, at du tror, at modellen er som

# Y = mx + c #

eller i stats

# Y = beta_0 + beta_1x + u #

Disse # Beta_0, beta_1 # er parametrene i befolkningen og # U # er effekten af uobserverede variabler ellers kaldt fejlperioden, så du vil have estimatorer # Hatbeta_0, hatbeta_1 #

# Haty = hatbeta_0 + hatbeta_1x #

Dette fortæller dig, at de forudsagte koefficienter giver dig den forudsagte y-værdi.

Så nu vil du finde de bedste estimater for disse koefficienter, som vi gør ved at finde den laveste forskel mellem den faktiske y-værdi og forudsagt.

#min sum_ (i = 1) ^ nhatu_i ^ 2 ~ hatbeta_0, hatbeta_1 #

Dette siger dybest set, at du vil have det mindste af summen af forskellene mellem de acutale y-værdier og forudsagte y-værdier for din regressionslinje

Så formlerne for at finde dem er

# hatbeta_1 = (sum_ (i = 1) ^ n (x_i-barx) (y_i-bary)) / (sum_ (i = 1) ^ n (x_i-barx) ^ 2)

# Hatbeta_0 = Bary-hatbeta_1barx #