Disperzija vs Skewness
U statistici i teoriji vjerovatnoće, često varijacije u distribucijama moraju biti izražene na kvantitativan način u svrhu poređenja. Disperzija i Kosina su dva statistička koncepta u kojima je oblik distribucije predstavljen u kvantitativnoj skali.
Više o disperziji
U statistici, disperzija je varijacija slučajne varijable ili njene distribucije vjerovatnoće. To je mjera koliko su tačke podataka udaljene od centralne vrijednosti. Da bi se ovo kvantitativno izrazilo, mjere disperzije se koriste u deskriptivnoj statistici.
Varijanca, standardna devijacija i interkvartilni raspon su najčešće korištene mjere disperzije.
Ako vrijednosti podataka imaju određenu jedinicu, zbog skale, mjere disperzije također mogu imati iste jedinice. Interdecilni raspon, domet, srednja razlika, srednja apsolutna devijacija, prosječna apsolutna devijacija i standardna devijacija udaljenosti su mjere disperzije s jedinicama.
Nasuprot tome, postoje mjere disperzije koje nemaju jedinice, tj. bezdimenzionalne. Varijanca, koeficijent varijacije, kvartilni koeficijent disperzije i relativna srednja razlika su mjere disperzije bez jedinica.
Disperzija u sistemu može proizaći iz grešaka, kao što su instrumentalne i opservacijske greške. Također, slučajne varijacije u samom uzorku mogu uzrokovati varijacije. Važno je imati kvantitativnu ideju o varijacijama u podacima prije donošenja drugih zaključaka iz skupa podataka.
Više o Skewness
U statistici, asimetrija je mjera asimetrije distribucije vjerovatnoće. Iskrivljenost može biti pozitivna ili negativna, ili u nekim slučajevima nepostojeća. Takođe se može smatrati mjerom odstupanja od normalne distribucije.
Ako je kosina pozitivna, tada je većina tačaka podataka centrirana lijevo od krive, a desni rep je duži. Ako je kosina negativna, većina tačaka podataka je centrirana desno od krive, a lijevi rep je prilično dugačak. Ako je kosina nula, tada je populacija normalno raspoređena.
U normalnoj distribuciji, to jest kada je kriva simetrična, srednja vrijednost, medijan i mod imaju istu vrijednost. Ako skewness nije nula, ovo svojstvo ne vrijedi, a srednja vrijednost, mod i medijan mogu imati različite vrijednosti.
Pearsonov prvi i drugi koeficijent asimetrije se obično koriste za određivanje asimetrije distribucija.
Pearsonov prvi kofeicent=(srednja - mod) / (standardna devijacija)
Pearsonov drugi kofeicent=3 (srednja - mod) / (satndard devijacija)
U osjetljivijim slučajevima koristi se prilagođeni Fisher-Pearson standardizirani koeficijent momenta.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
Koja je razlika između disperzije i iskrivljenosti?
Disperzija se tiče opsega u kojem su raspoređene tačke podataka, a nagnutost se tiče simetrije distribucije.
Obje mjere disperzije i asimetrije su deskriptivne mjere, a koeficijent zakrivljenosti daje indikaciju oblika raspodjele.
Mjere disperzije se koriste za razumijevanje raspona tačaka podataka i pomaka od srednje vrijednosti, dok se iskrivljenost koristi za razumijevanje tendencije varijacije tačaka podataka u određenom smjeru.