Razlika između centralne tendencije i disperzije

Razlika između centralne tendencije i disperzije
Razlika između centralne tendencije i disperzije

Video: Razlika između centralne tendencije i disperzije

Video: Razlika između centralne tendencije i disperzije
Video: Amines and Amides 2024, Juli
Anonim

Centralna tendencija vs disperzija

U deskriptivnoj i inferencijalnoj statistici, nekoliko indeksa se koristi za opisivanje skupa podataka koji odgovaraju njegovoj centralnoj tendenciji, disperziji i iskrivljenosti: tri najvažnija svojstva koja određuju relativni oblik distribucije skupa podataka.

Šta je centralna tendencija?

Centralna tendencija se odnosi na i locira centar distribucije vrijednosti. Srednja vrijednost, mod i medijan su najčešće korišteni indeksi za opisivanje centralne tendencije skupa podataka. Ako je skup podataka simetričan, tada se i medijan i srednja vrijednost skupa podataka poklapaju jedno s drugim.

Dati skup podataka, srednja vrijednost se izračunava uzimanjem sume svih vrijednosti podataka, a zatim dijeljenjem sa brojem podataka. Na primjer, težine 10 ljudi (u kilogramima) mjere se na 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Tada srednja težina deset osoba (u kilogramima) može biti izračunati na sledeći način. Zbir težina je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Srednja vrijednost=(zbir) / (broj podataka)=710 / 10=71 (u kilogramima). Podrazumijeva se da outliers (tačke podataka koje odstupaju od normalnog trenda) imaju tendenciju da utiču na srednju vrijednost. Dakle, u prisustvu odstupnika samo sredstvo neće dati tačnu sliku o centru skupa podataka.

Medijan je tačka podataka koja se nalazi na tačnoj sredini skupa podataka. Jedan od načina da se izračuna medijana je da poredate tačke podataka uzlaznim redom, a zatim locirate tačku podataka u sredini. Na primjer, ako se jednom naruči prethodni skup podataka izgleda kao, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Dakle, (70+72)/2=71 je u sredini. Iz ovoga se vidi da medijan ne mora biti u skupu podataka. Medijana nije pod utjecajem prisutnosti izvanrednih vrijednosti. Dakle, medijana će poslužiti kao bolja mjera centralne tendencije u prisustvu outliers-a.

Režim je vrednost koja se najčešće pojavljuje u skupu podataka. U prethodnom primjeru, vrijednosti 70 i 72 se pojavljuju dvaput i stoga su oba načina rada. Ovo pokazuje da u nekim distribucijama postoji više od jedne modalne vrijednosti. Ako postoji samo jedan način rada, skup podataka se kaže da je unimodalni, u ovom slučaju, skup podataka je bimodalan.

Šta je disperzija?

Disperzija je količina širenja podataka o centru distribucije. Raspon i standardna devijacija su najčešće korištene mjere disperzije.

Raspon je jednostavno najveća vrijednost minus najniža vrijednost. U prethodnom primjeru, najviša vrijednost je 80, a najniža vrijednost je 62, tako da je raspon 80-62=18. Ali raspon ne daje dovoljnu sliku o disperziji.

Za izračunavanje standardne devijacije prvo se izračunavaju odstupanja vrijednosti podataka od srednje vrijednosti. Kvadratna sredina odstupanja naziva se standardna devijacija. U prethodnom primjeru, odgovarajuća odstupanja od srednje vrijednosti su (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 i (79 – 71)=8. Zbir kvadrati devijacije su (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Standardna devijacija je √(366/10)=6,05 (u kilogramima). Osim ako je skup podataka u velikoj mjeri iskrivljen, iz ovoga se može zaključiti da se većina podataka nalazi u intervalu 71±6,05, a to je zaista tako u ovom konkretnom primjeru.

Koja je razlika između centralne tendencije i disperzije?

• Centralna tendencija se odnosi na i locira centar distribucije vrijednosti

• Disperzija je količina širenja podataka oko centra skupa podataka.

Preporučuje se: