Regresija vs korelacija
U statistici je važno određivanje odnosa između dvije slučajne varijable. Daje mogućnost predviđanja jedne varijable u odnosu na druge. Regresiona analiza i korelacija se primjenjuju u vremenskoj prognozi, ponašanju finansijskog tržišta, uspostavljanju fizičkih odnosa eksperimentima iu mnogo više stvarnih scenarija.
Šta je regresija?
Regresija je statistička metoda koja se koristi za crtanje odnosa između dvije varijable. Često kada se podaci prikupljaju mogu postojati varijable koje zavise od drugih. Tačan odnos između tih varijabli može se utvrditi samo regresijskim metodama. Određivanje ovog odnosa pomaže da se razumije i predvidi ponašanje jedne varijable prema drugoj.
Najčešća primjena regresione analize je procjena vrijednosti zavisne varijable za datu vrijednost ili raspon vrijednosti nezavisnih varijabli. Na primjer, pomoću regresije možemo uspostaviti odnos između cijene robe i potrošnje, na osnovu podataka prikupljenih iz slučajnog uzorka. Regresijska analiza proizvodi funkciju regresije skupa podataka, što je matematički model koji se najbolje uklapa u dostupne podatke. Ovo se lako može predstaviti dijagramom raspršenosti. Grafički, regresija je ekvivalentna pronalaženju krive koja se najbolje uklapa za dati skup podataka. Funkcija krivulje je funkcija regresije. Koristeći matematički model, potražnja za robom može se predvidjeti za datu cijenu.
Stoga, regresiona analiza se široko koristi u predviđanju i predviđanju. Takođe se koristi za uspostavljanje odnosa u eksperimentalnim podacima, u oblastima fizike, hemije i mnogih prirodnih nauka i inženjerskih disciplina. Ako je odnos ili funkcija regresije linearna funkcija, tada je proces poznat kao linearna regresija. Na dijagramu raspršenja može se predstaviti kao prava linija. Ako funkcija nije linearna kombinacija parametara, tada je regresija nelinearna.
Šta je korelacija?
Korelacija je mjera jačine odnosa između dvije varijable. Koeficijent korelacije kvantificira stepen promjene jedne varijable na osnovu promjene druge varijable. U statistici, korelacija je povezana sa konceptom zavisnosti, što je statistički odnos između dve varijable.
Pearsonsov koeficijent korelacije ili samo koeficijent korelacije r je vrijednost između -1 i 1 (-1≤r≤+1). To je najčešće korišteni koeficijent korelacije i vrijedi samo za linearni odnos između varijabli. Ako je r=0, odnos ne postoji, a ako je r≥0, odnos je direktno proporcionalan; tj. vrijednost jedne varijable raste sa povećanjem druge. Ako je r≤0, odnos je obrnuto proporcionalan; tj. jedna varijabla opada kako se druga povećava.
Zbog uslova linearnosti, koeficijent korelacije r se takođe može koristiti za utvrđivanje prisutnosti linearne veze između varijabli.
Koja je razlika između regresije i korelacije?
Regresija daje oblik odnosa između dvije slučajne varijable, a korelacija daje stepen jačine veze.
Regresijska analiza proizvodi regresijsku funkciju, koja pomaže u ekstrapolaciji i predviđanju rezultata dok korelacija može pružiti samo informacije o tome u kom smjeru se može promijeniti.
Precizniji modeli linearne regresije su dati analizom, ako je koeficijent korelacije veći. (|r|≥0.8)