Razlika između varijanse i kovarijanse

Razlika između varijanse i kovarijanse
Razlika između varijanse i kovarijanse

Video: Razlika između varijanse i kovarijanse

Video: Razlika između varijanse i kovarijanse
Video: Normalna distribucija - Mustafa Bevrnja 2024, Novembar
Anonim

Varijanca vs Kovarijansa

Varijanca i kovarijansa su dvije mjere koje se koriste u statistici. Varijanca je mjera raspršenosti podataka, a kovarijansa označava stepen promjene dvije slučajne varijable zajedno. Varijanca je prilično intuitivan koncept, ali kovarijansa je matematički definirana u početku ne tako intuitivno.

Više o varijansi

Varijanca je mjera disperzije podataka iz srednje vrijednosti distribucije. Ona govori koliko su tačke podataka udaljene od srednje vrednosti distribucije. To je jedan od primarnih deskriptora distribucije vjerovatnoće i jedan od momenata distribucije. Također, varijansa je parametar populacije, a varijansa uzorka iz populacije djeluje kao procjena varijanse populacije. Iz jedne perspektive, definira se kao kvadrat standardne devijacije.

Na jednostavnom jeziku, može se opisati kao prosek kvadrata udaljenosti između svake tačke podataka i srednje vrednosti distribucije. Sljedeća formula se koristi za izračunavanje varijanse.

Var(X)=E[(X-µ)2] za populaciju, i

Var(X)=E[(X-‾x)2] za uzorak

Može se dalje pojednostaviti da se da Var(X)=E[X2]-(E[X])2.

Varijanca ima neka svojstva potpisa i često se koristi u statistici kako bi se upotreba učinila jednostavnijom. Varijanca je nenegativna jer je kvadrat udaljenosti. Međutim, raspon varijanse nije ograničen i ovisi o određenoj distribuciji. Varijanca konstantne slučajne varijable je nula, a varijansa se ne mijenja u odnosu na lokacijski parametar.

Više o kovarijansi

U statističkoj teoriji, kovarijansa je mjera koliko se dvije slučajne varijable mijenjaju zajedno. Drugim riječima, kovarijansa je mjera jačine korelacije između dvije slučajne varijable. Također, može se smatrati generalizacijom koncepta varijanse dvije slučajne varijable.

Kovarijansa dvije slučajne varijable X i Y, koje su zajednički raspoređene sa konačnim drugim momentom, poznata je kao σXY=E[(X-E[X])(Y-E[Y])]. Iz ovoga se varijansa može posmatrati kao poseban slučaj kovarijanse, gdje su dvije varijable iste. Cov(X, X)=Var(X)

Normalizacijom kovarijance može se dobiti linearni koeficijent korelacije ili Pearsonov koeficijent korelacije, koji je definisan kao ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Grafički, kovarijansa između para tačaka podataka može se videti kao površina pravougaonika sa tačkama podataka na suprotnim vrhovima. Može se tumačiti kao mjera veličine razdvajanja između dvije tačke podataka. Uzimajući u obzir pravokutnike za cijelu populaciju, preklapanje pravokutnika koji odgovaraju svim tačkama podataka može se smatrati jačinom razdvajanja; varijanse dvije varijable. Kovarijansa je dvodimenzionalna, zbog dvije varijable, ali pojednostavljivanjem na jednu varijablu dobiva se varijansa jedne kao razdvajanja u jednoj dimenziji.

Koja je razlika između varijance i kovarijance?

• Varijanca je mjera širenja/disperzije u populaciji dok se kovarijansa smatra mjerom varijacije dvije slučajne varijable ili jačine korelacije.

• Varijanca se može smatrati posebnim slučajem kovarijanse.

• Varijanca i kovarijansa zavise od veličine vrednosti podataka i ne mogu se porediti; dakle, oni su normalizovani. Kovarijansa je normalizirana u koeficijent korelacije (dijeleći se proizvodom standardnih devijacija dvije slučajne varijable), a varijansa je normalizirana u standardnu devijaciju (uzimanjem kvadratnog korijena)

Preporučuje se: