Big Data: 9 technologii open-source, które warto śledzić (1 z 9)
Apache Hadoop to otwarta platforma umożliwiające tworzenie działających w rozproszeniu aplikacji, które przeprowadzają obliczenia na dużych zasobach nieustrukturyzowanych danych. Pierwotnie utworzona przez Douga Cuttinga by wspierać pracę nad Nutch, otwartymi źródłami wyszukiwarki Web. Aby sprostać uniwersalnym wymaganiom przetwórczym Nutch , Cutting wdrożył MapReduce oraz rozproszone pliki systemowe, które w połączeniu stworzyły Hadoop. Nazwa pochodzi od słonika, którym bawił się jego syn. Poprzez MapReduce, Hadoop rozprowadza duże ilości danych w kawałkach po serii więzów działających na hardware. Aktualnie, Hadoop jest jedną z najpopularniejszych technologii do przechowywania strukturalnych, pół-strukturalnych oraz nieuporządkowanych danych, które składają się na „Big Data”. Platforma jest dostępna na licencji Apache 2.0.