Razlika između RDBMS-a i Hadoop-a

Sadržaj:

Razlika između RDBMS-a i Hadoop-a
Razlika između RDBMS-a i Hadoop-a

Video: Razlika između RDBMS-a i Hadoop-a

Video: Razlika između RDBMS-a i Hadoop-a
Video: Histone acetylation and methylation 2024, Juli
Anonim

Ključna razlika između RDBMS-a i Hadoop-a je u tome što RDBMS pohranjuje strukturirane podatke dok Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.

RDBMS je sistem upravljanja bazom podataka zasnovan na relacionom modelu. Hadoop je softver za pohranjivanje podataka i pokretanje aplikacija na klasterima robnog hardvera.

Slika
Slika

Šta je RDBMS?

RDBMS je skraćenica za Relational Database Management System baziran na relacionom modelu. U RDBMS-u, tabele se koriste za skladištenje podataka, a ključevi i indeksi pomažu u povezivanju tabela. Tabela je skup elemenata podataka, a oni su entiteti. Sadrži redove i stupce. Redovi predstavljaju jedan unos u tabeli. Kolone predstavljaju atribute.

Na primjer, baza podataka prodaje može imati entitete kupaca i proizvoda. Kupac može imati atribute kao što su customer_id, name, address, phone_no. Stavka može imati atribute kao što su product_id, ime itd. Primarni ključ tabele kupaca je customer_id dok je primarni ključ tabele proizvoda product_id. Postavljanje product_id u tablicu kupaca kao stranog ključa povezuje ova dva entiteta. Isto tako, tabele su takođe povezane jedna s drugom. Oni pružaju integritet podataka, normalizaciju i još mnogo toga. Nekoliko uobičajenih RDBMS-a su MySQL, MSSQL i Oracle. Oni koriste SQL za postavljanje upita.

Šta je Hadoop?

Hadoop je Apache okvir otvorenog koda napisan u Javi. Pomaže u skladištenju i obradi velike količine podataka u klasterima računara koristeći jednostavne modele programiranja. Glavni cilj Hadoop-a je pohranjivanje i obrada velikih podataka, koji se odnose na veliku količinu složenih podataka. Propusnost Hadoop-a, koja predstavlja kapacitet obrade velikog broja podataka u određenom vremenskom periodu, je visoka.

Razlika između RDBMS-a i Hadoop-a
Razlika između RDBMS-a i Hadoop-a

Postoje četiri modula u Hadoop arhitekturi. To su Hadoop common, YARN, Hadoop Distributed File System (HDFS) i Hadoop MapReduce. Zajednički modul sadrži Java biblioteke i uslužne programe. Takođe ima fajlove za pokretanje Hadoopa. Hadoop YARN vrši raspoređivanje poslova i upravljanje resursima klastera.

Dalje, Hadoop Distributed File System (HDFS) je Hadoop sistem za skladištenje podataka. Koristi arhitekturu master-slave. Glavni čvor je NameNode i on upravlja metapodacima sistema datoteka. Ostali računari su slave čvorovi ili DataNodes. Oni pohranjuju stvarne podatke. S druge strane, Hadoop MapReduce radi distribuirano računanje. Ima algoritme za obradu podataka. U HDFS-u, glavni čvor ima praćenje poslova. Pokreće poslove smanjenja mape na slave čvorovima. Za svaki podređeni čvor postoji Task Tracker za dovršetak obrade podataka i slanje rezultata natrag glavnom čvoru. Sve u svemu, Hadoop pruža ogromnu pohranu podataka sa velikom snagom obrade.

Koja je razlika između RDBMS-a i Hadoop-a?

RDBMS vs Hadoop

RDBMS je sistemski softver za kreiranje i upravljanje bazama podataka koji se zasnivaju na relacionom modelu. Hadoop je kolekcija softvera otvorenog koda koji povezuje mnoge računare za rješavanje problema koji uključuju veliku količinu podataka i računanja.
Raznolikost podataka
RDBMS pohranjuje strukturirane podatke. Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.
Skladištenje podataka
RDBMS pohranjuje prosječnu količinu podataka. Hadoop pohranjuje veliku količinu podataka od RDBMS-a.
Brzina
U RDBMS-u, čitanje je brzo. U Hadoop-u čitanje i pisanje su brzi.
Skalabilnost
RDBMS ima vertikalnu skalabilnost. Hadoop ima horizontalnu skalabilnost.
Hardver
RDBMS koriste vrhunske servere. Hadoop koristi robni hardver.
Protok
RDBMS propusnost je veća. Hadoop protok je manji.

Sažetak – RDBMS vs Hadoop

Ovaj članak govori o razlici između RDBMS-a i Hadoop-a. Ključna razlika između RDBMS-a i Hadoop-a je u tome što RDBMS pohranjuje strukturirane podatke dok Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.

Preporučuje se: