Što je Apache Hadoop?

Apache Hadoop je naziv za skup algoritama za velike podatke, distribuirano pohranjivanje i distribuirani softver za obradu koji je stvorio Apache Software Foundation. Dizajniran je za podršku aplikacija za podatkovne usluge velikih količina; automatsko rukovanje hardverskim kvarovima bez gubitka usluge.

Hadoop koristi distribuirani datotečni sustav poznat kao HDFS i softver za obradu velikih skupova podataka poznatih kao MapReduce. Izuzetno velike datoteke podijeljene su na dijelove, obično 64 ili 128 MB svaki. Softver se uglavnom piše u Javi, s nekim kodom nižeg stupnja napisanom na C.

Apache poslužitelj, veliki podaci, usluge, softverski uvjeti