Razlika između Semi Join-a i Bloom Join-a

Razlika između Semi Join-a i Bloom Join-a
Razlika između Semi Join-a i Bloom Join-a

Video: Razlika između Semi Join-a i Bloom Join-a

Video: Razlika između Semi Join-a i Bloom Join-a
Video: Workshop "Разминки и интерактивные упражнения для онлайн-тренинга" 2024, Novembar
Anonim

Semi Join vs Bloom Join

Semi join i Bloom join su dvije metode spajanja koje se koriste u obradi upita za distribuirane baze podataka. Prilikom obrade upita u distribuiranim bazama podataka, podatke je potrebno prenijeti između baza podataka koje se nalaze na različitim lokacijama. Ovo bi mogla biti skupa operacija ovisno o količini podataka koju treba prenijeti. Stoga, kada obrađujete upite u okruženju distribuirane baze podataka, važno je optimizirati upite kako biste minimizirali količinu podataka koji se prenose između lokacija. Polu spajanje i bloom spajanje su dvije metode koje se mogu koristiti za smanjenje količine prijenosa podataka i izvođenje efikasne obrade upita.

Šta je polupridruživanje?

Semi spoj je metoda koja se koristi za efikasnu obradu upita u okruženjima distribuirane baze podataka. Razmotrite situaciju u kojoj se baza podataka o zaposlenima (koja sadrži informacije kao što su ime zaposlenika, broj odjela za koji radi, itd.) nalazi na lokaciji 1 i baza podataka odjela (koja sadrži informacije kao što su broj odjela, naziv odjela, lokacija, itd.) locirana na lokaciji 2. Na primjer, ako želimo da dobijemo ime zaposlenika i naziv odjela za koji ona radi (samo od odjela koji se nalaze u “New Yorku”), izvršavanjem upita u procesoru upita koji se nalazi na lokaciji 3, postoji nekoliko načina da podaci bi se mogli prenositi između tri lokacije kako bi se postigao ovaj zadatak. Ali prilikom prijenosa podataka, važno je napomenuti da nije potrebno prenositi cijelu bazu podataka između lokacija. Samo neki od atributa (ili tuple) koji su potrebni za spajanje moraju se prenijeti između lokacija da bi se upit efikasno izvršio. Polu spajanje je metoda koja se može koristiti za smanjenje količine podataka koji se šalju između lokacija. U polupridruživanju, samo se stupac spajanja prenosi s jedne lokacije na drugu, a zatim se ta prenesena kolona koristi za smanjenje veličine otpremljenih relacija između drugih lokacija. Za gornji primjer, možete jednostavno prenijeti broj odjela i naziv odjela torki sa location=”New York” sa lokacije 2 na lokaciju 1 i izvršiti spajanje na lokaciji 1 i prenijeti konačnu relaciju nazad na lokaciju 3.

Šta je Bloom Join?

Kao što je ranije spomenuto, bloom join je još jedan metod koji se koristi da se izbjegne prijenos nepotrebnih podataka između lokacija prilikom izvršavanja upita u okruženjima distribuirane baze podataka. U bloom spoju, umjesto prijenosa samog stupca spajanja, kompaktna reprezentacija spojne kolone se prenosi između lokacija. Bloom join koristi bloom filter koji koristi vektor bita za izvršavanje upita o članstvu. Prvo, bloom filter se gradi pomoću stupca spajanja i prenosi se između lokacija, a zatim se izvode operacije spajanja.

Koja je razlika između Semi Join-a i Bloom Join-a?

Iako se metode polupridruživanja i bloom pridruživanja koriste za minimiziranje količine podataka koji se prenose između lokacija prilikom izvršavanja upita u okruženju distribuirane baze podataka, bloom join smanjuje količinu podataka (broj torkova) prenijetih u poređenju sa semi join korištenjem koncepta bloom filtera, koji koriste vektor bita za određivanje članstva skupa. Stoga će korištenje bloom spoja biti efikasnije od korištenja poluspajanja.

Preporučuje se: