Razlika između hijerarhijskog i parcijalnog grupiranja

👤 Autor Alex Aldridge 📧 aldridge@what-difference.com.
⏱ Public 2023-12-17 13:33.
🖍 Zadnja izmjena 2025-01-23 11:01.

Hijerarhijsko naspram parcijalnog grupiranja

Clustering je tehnika mašinskog učenja za analizu podataka i podjelu u grupe sličnih podataka. Ove grupe ili skupovi sličnih podataka poznati su kao klasteri. Analiza klastera razmatra algoritme grupisanja koji mogu automatski identifikovati klastere. Hijerarhijski i Particijski su dvije takve klase algoritama za grupisanje. Algoritmi hijerarhijskog klasteriranja razbijaju podatke u hijerarhiju klastera. Paricijski algoritmi dijele skup podataka u međusobno disjunktne particije.

Šta je hijerarhijsko grupiranje?

Algoritmi hijerarhijskog grupisanja ponavljaju ciklus spajanja manjih klastera u veće ili dijeljenja većih klastera na manje. U svakom slučaju, proizvodi hijerarhiju klastera koji se naziva dendogram. Strategija aglomerativnog klasteriranja koristi pristup odozdo prema gore spajanja klastera u veće, dok strategija klastera podjele koristi pristup odozgo prema dolje razdvajanja na manje. Tipično, pohlepni pristup se koristi u odlučivanju koji se veći/manji klasteri koriste za spajanje/podjelu. Euklidska udaljenost, udaljenost Manhattana i kosinusna sličnost neke su od najčešće korištenih metrika sličnosti za numeričke podatke. Za nenumeričke podatke koristi se metrika kao što je Hamingova udaljenost. Važno je napomenuti da stvarna opažanja (instance) nisu potrebna za hijerarhijsko grupisanje, jer je dovoljna samo matrica udaljenosti. Dendogram je vizuelni prikaz klastera, koji vrlo jasno prikazuje hijerarhiju. Korisnik može dobiti različito grupisanje u zavisnosti od nivoa na kojem je dendogram izrezan.

Šta je particionalno grupisanje?

Algoritmi za particiono grupisanje generišu različite particije i onda ih procenjuju po nekom kriterijumu. Oni se takođe nazivaju nehijerarhijskim jer je svaka instanca smeštena u tačno jedan od k međusobno isključivih klastera. Budući da je samo jedan skup klastera izlaz tipičnog algoritma za particiono grupisanje, od korisnika se traži da unese željeni broj klastera (obično se naziva k). Jedan od najčešće korišćenih algoritama za particiono grupisanje je k-means algoritam grupisanja. Od korisnika se traži da navede broj klastera (k) prije pokretanja i algoritam prvo pokreće centre (ili centre) k particija. Ukratko, k-means algoritam grupiranja zatim dodjeljuje članove na osnovu trenutnih centara i ponovo procjenjuje centre na osnovu trenutnih članova. Ova dva koraka se ponavljaju dok se ne optimiziraju određena ciljna funkcija sličnosti unutar klastera i ciljna funkcija inter-klastera različitosti. Stoga je razumna inicijalizacija centara veoma važan faktor u dobijanju kvalitetnih rezultata iz algoritama particionog grupisanja.

Koja je razlika između hijerarhijskog i parcijalnog grupiranja?

Hijerarhijsko i particiono klasterisanje imaju ključne razlike u vremenu rada, pretpostavkama, ulaznim parametrima i rezultujućim klasterima. Tipično, particiono grupisanje je brže od hijerarhijskog klasterisanja. Hijerarhijsko grupisanje zahtijeva samo mjeru sličnosti, dok particiono klasteriranje zahtijeva jače pretpostavke kao što su broj klastera i početni centri. Hijerarhijsko grupisanje ne zahtijeva nikakve ulazne parametre, dok algoritmi za particiono klasteriranje zahtijevaju broj klastera za pokretanje. Hijerarhijsko klasteriranje daje mnogo značajniju i subjektivniju podelu klastera, ali particiono klasterisanje rezultira tačno k klastera. Hijerarhijski algoritmi za grupisanje su pogodniji za kategoričke podatke sve dok se mjera sličnosti može definirati u skladu s tim.

Preporučuje se:

Razlika između hijerarhijskog i parcijalnog grupiranja

Preporučuje se:

Razlika između hijerarhijskog i sekvenciranja puške cijelog genoma

Razlika između grupiranja i klasifikacije

Razlika između ključne razlike između metalnih i nemetalnih minerala

Razlika između i između

Razlika između pritiska pare i parcijalnog pritiska

Razlika između Firefoxa 5 i Firefoxa 6

Razlika između nanotehnologije i molekularne nanotehnologije (MNT)

Razlika između bezolovnog i E10

Razlika između mandarine i mandarine

Razlika između nominalne i nominalne vrijednosti

Razlika između izdavačke kompanije i kompanije za izdavanje

Razlika između serije Harry Potter za djecu i odrasle

Razlika između vizualizacije i obrade slike

Razlika između muzičke ploče i muzičkog albuma

Razlika između cijelih veličina u cipelama za pse rakete

Razlika između tibije i fibule

Razlika između piramide i prizme

Razlika između pare i dima

Razlika između ponosa i taštine

Razlika između Twistera i Tornada