Mean vs Median vs Mode
Srednja vrijednost, medijan i mod su primarne mjere centralne tendencije koje se koriste u deskriptivnoj statistici. One su potpuno različite jedna od druge i slučajevi u kojima se koriste za sumiranje podataka su također različiti.
Mean
Aritmetička sredina je zbir vrijednosti podataka podijeljen sa brojem vrijednosti podataka, tj.
[lateks]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Ako su podaci iz prostora uzorka, oni se nazivaju srednja vrijednost uzorka ([latex]\bar{x} [/latex]), što je deskriptivna statistika uzorka. Iako je to najčešće korištena deskriptivna mjera za uzorak, to nije čvrsta statistika. Veoma je osjetljiv na vanjske vrijednosti i oscilacije.
Na primjer, uzmite u obzir prosječan prihod građana određenog grada. Budući da se sve vrijednosti podataka sabiraju i potom dijele, prihod izuzetno bogate osobe značajno utiče na srednju vrijednost. Stoga srednje vrijednosti nisu uvijek dobar prikaz podataka.
Također, u slučaju naizmjeničnog signala, struja koja prolazi kroz element periodično varira od pozitivnog smjera do negativnog smjera i obrnuto. Ako uzmemo prosječnu struju koja prolazi kroz element u jednom periodu, to će dati 0, što znači da struja nije prošla kroz element, što očigledno nije tačno. Stoga, ni u ovom slučaju, aritmetička sredina nije dobra mjera.
Aritmetička sredina je dobar pokazatelj kada su podaci ravnomjerno raspoređeni. Za normalnu distribuciju, srednja vrijednost je jednaka modu i medijanu. Takođe ima najniže ostatke kada se uzme u obzir srednja kvadratna greška; stoga, najbolja deskriptivna mjera kada je potrebno predstaviti skup podataka jednim brojem.
Medijan
Vrijednosti srednje tačke podataka nakon sređivanja svih vrijednosti podataka u rastućem redoslijedu definiraju se kao medijana skupa podataka. Medijan je 2. kvartil, 5. decil i 50. percentil.
• Ako je broj zapažanja (tačaka podataka) neparan, tada je medijana zapažanje tačno u sredini naređene liste.
• Ako je broj zapažanja (tačaka podataka) paran, tada je medijana srednja vrijednost dvaju srednjih zapažanja u poređanoj listi.
Medijan deli posmatranje u dve grupe; tj. grupa (50%) vrijednosti viših i grupa (50%) vrijednosti nižih od medijane. Medijani se posebno koriste u iskrivljenim distribucijama i predstavljaju podatke prilično bolje od aritmetičke sredine.
Način
Mode je broj koji se najčešće pojavljuje u skupu zapažanja. Način rada skupa podataka se izračunava pronalaženjem frekvencije svakog elementa unutar skupa.
• Ako se nijedna vrijednost ne pojavi više od jednom, tada skup podataka nema način rada.
• U suprotnom, bilo koja vrijednost koja se javlja s najvećom frekvencijom je način rada skupa podataka.
U setu može postojati više od 1 načina rada; stoga, mod nije jedinstvena statistika skupa podataka. U uniformnoj distribuciji postoji jedan mod. Način diskretne distribucije vjerovatnoće je tačka u kojoj funkcija mase vjerovatnoće doseže svoju najvišu tačku. Rendering iz gornjih interpretacija, možemo reći da su globalni maksimumi modovi.
Razmotrite primjenu sve tri mjere na sljedeći skup podataka.
PODACI: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Mean=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Medijan=9 (13. element)
Režim=9 (učestalost 9=5)
Koja je razlika između srednje vrijednosti, medijane i moda?
• Aritmetička sredina je zbir vrijednosti (zapažanja) podijeljen sa brojem opservacija. To nije robusna statistika i u velikoj mjeri ovisi o prirodi normalne distribucije unutar razmatrane distribucije. Jedan izuzetak može uzrokovati značajan pomak srednje vrijednosti dajući relativno pogrešne vrijednosti. Koncept se može proširiti na geometrijsku sredinu, harmonijsku sredinu, ponderisanu sredinu i tako dalje.
• Medijan je srednja vrijednost skupa opservacija i na njega relativno manje utječu outliers. Može dati dobru procjenu kao sumarna statistika u vrlo iskrivljenim slučajevima.
• Mod je najčešće vrijednosti zapažanja u skupu podataka. Ako je distribucija pozitivno iskrivljena, mod leži lijevo od medijane, a ako je negativno iskrivljen, mod leži desno od medijane.
• Ako je pozitivno iskrivljeno, srednja vrijednost je točno na medijanu; ako je negativno iskrivljena srednja vrijednost je lijevo od medijane.
• U normalnoj distribuciji, sva tri, srednja vrijednost, mod i medijana su jednaki.