Middelværdien er det mest anvendte mål for centret, men der er tidspunkter, hvor det anbefales at bruge medianen til datavisning og analyse. Hvornår kan det være hensigtsmæssigt at bruge medianen i stedet for middelværdien?

Middelværdien er det mest anvendte mål for centret, men der er tidspunkter, hvor det anbefales at bruge medianen til datavisning og analyse. Hvornår kan det være hensigtsmæssigt at bruge medianen i stedet for middelværdien?
Anonim

Når der er et par ekstreme værdier i dit datasæt.

Eksempel:

Du har et datasæt på 1000 tilfælde med værdier, der ikke er for langt fra hinanden. Deres gennemsnit er 100, ligesom deres median. Nu erstatter du kun ét tilfælde med en sag, der har værdi 100000 (bare for at være ekstrem). Den gennemsnitlige vil stige dramatisk (til næsten 200), mens medianen vil blive upåvirket.

Beregning:

1000 tilfælde, gennemsnit = 100, sum af værdier = 100000

Tab en 100, tilføj 100000, summen af værdier = 199900, middel = 199,9

Median (= sag 500 + 501) / 2 forbliver den samme.