Razlika između rudarenja podataka i OLAP-a

Razlika između rudarenja podataka i OLAP-a
Razlika između rudarenja podataka i OLAP-a

Video: Razlika između rudarenja podataka i OLAP-a

Video: Razlika između rudarenja podataka i OLAP-a
Video: huge #sheer vintage lingerie try on haul 2024, Novembar
Anonim

Data Mining vs OLAP

I rudarenje podataka i OLAP su dvije uobičajene tehnologije poslovne inteligencije (BI). Poslovna inteligencija se odnosi na kompjuterski zasnovane metode za identifikaciju i izdvajanje korisnih informacija iz poslovnih podataka. Data mining je oblast računarske nauke koja se bavi izdvajanjem zanimljivih obrazaca iz velikih skupova podataka. Kombinira mnoge metode od umjetne inteligencije, statistike i upravljanja bazom podataka. OLAP (online analytical processing) kao što ime sugerira je kompilacija načina za ispitivanje višedimenzionalnih baza podataka.

Iskopavanje podataka poznato je i kao otkrivanje znanja u podacima (KDD). Kao što je već spomenuto, to je oblast računarstva koja se bavi ekstrakcijom ranije nepoznatih i zanimljivih informacija iz sirovih podataka. Zbog eksponencijalnog rasta podataka, posebno u oblastima kao što je poslovanje, rudarenje podataka postalo je vrlo važan alat za pretvaranje ovog velikog bogatstva podataka u poslovnu inteligenciju, jer je ručno izdvajanje obrazaca postalo nemoguće u posljednjih nekoliko decenija. Na primjer, trenutno se koristi za različite aplikacije kao što su analiza društvenih mreža, otkrivanje prijevara i marketing. Data mining se obično bavi sljedeća četiri zadatka: grupiranje, klasifikacija, regresija i asocijacija. Grupiranje je identificiranje sličnih grupa iz nestrukturiranih podataka. Klasifikacija je pravila učenja koja se mogu primijeniti na nove podatke i obično će uključivati sljedeće korake: prethodnu obradu podataka, dizajniranje modeliranja, učenje/odabir karakteristika i evaluaciju/validaciju. Regresija je pronalaženje funkcija s minimalnom greškom za modeliranje podataka. A asocijacija traži odnose između varijabli. Data mining se obično koristi da se odgovori na pitanja poput toga koji su glavni proizvodi koji bi mogli pomoći da se ostvari visok profit sljedeće godine u Wal-Martu.

OLAP je klasa sistema, koji daju odgovore na višedimenzionalne upite. Obično se OLAP koristi za marketing, budžetiranje, predviđanje i slične aplikacije. Podrazumeva se da su baze podataka koje se koriste za OLAP konfigurisane za složene i ad-hoc upite sa brzim performansama na umu. Obično se matrica koristi za prikaz izlaza OLAP-a. Redovi i stupci su formirani prema dimenzijama upita. Često koriste metode agregacije na više tabela kako bi dobili sažetke. Na primjer, može se koristiti za saznanje o prodaji ove godine u Wal-Martu u odnosu na prošlu godinu? Kakvo je predviđanje prodaje u narednom kvartalu? Šta se može reći o trendu gledajući procentualne promjene?

Iako je očigledno da su Data mining i OLAP slični jer rade na podacima da bi stekli inteligenciju, glavna razlika dolazi u tome kako rade na podacima. OLAP alati pružaju multidimenzionalnu analizu podataka i daju sažetke podataka, ali nasuprot tome, data mining se fokusira na omjere, obrasce i utjecaje u skupu podataka. To je OLAP dogovor sa agregacijom, koji se svodi na rad podataka putem „zbrajanja“, ali rudarenje podataka odgovara „podjeli“. Druga značajna razlika je u tome što dok alati za rudarenje podataka modeliraju podatke i vraćaju primjenjiva pravila, OLAP će provoditi tehnike poređenja i kontrasta duž poslovne dimenzije u realnom vremenu.

Preporučuje se: