Hadoop 2.0 – wady i zalety

Jak wiadomo, symbolem platformy Hadoop jest słoń. W dziewiętnastym wieku amerykański poeta John Godfrey Saxe napisał poemat noszący tytuł „ Ballada o słoniu i ślepcach”, w którym opisuje jak sześciu ślepców stara się opisać słonia, dotykając poszczególnych jego części. Okazuje, że każdy zna dobrze tę część słonia, którą dotykał, ale razem nie mogą dojść do porozumienia i określić, jak naprawdę słoń wygląda, gdy próbują skleić w całość swoje odczucia. Czy tak samo jest z platformą Hadoop?

Poemat kończy się znamienną sentencją: „każdy przy swojej trwa opinii, każdy ma rację swą jak inni, lecz wspólnie jej nie mają”. W oryginale ostatnie zdanie poematu brzmi: "each was partly in the right, and all were in the wrong”. Wydaje się, że podobnie jest z platformą Hadoop. Wiele osób (znających tę platformę niejednokrotnie tylko po części) zachwyca się nią, twierdząc iż jest to przełomowe rozwiązanie, podczas gdy inni są przeciwnego zdania. Tak czy inaczej, opinie na jej temat bywają skrajnie różne.

Dlatego warto najpierw odpowiedzieć na pytanie, czym jest Hadoop i do czego służy? Podstawowa definicja brzmi, iż jest to otwarta platforma służąca do zarządzania dużymi zbiorami danych (środowisko Big Data). Panuje powszechna opinia, że pozwala ona efektywnie przetwarzać dane w trybie transakcyjnym, można jej używać do wyszukiwania informacji czy też stosować ją w aplikacjach analitycznych. A są to przecież zupełnie różne zadania. Jakby tego było mało, mówi się też, że środowiska Hadoop nadają się doskonale do analizowania danych, zarówno strukturalnych, niestrukturalnych, jak i mających postać pół-strukturalną. Czytając to można by dojść do wniosku, że Hadoop jest dobry na wszystko bez wyjątku. A nie jest to przecież prawda.

Zobacz również:

W gruncie rzeczy Hadoop jest dość prostą, nie wyróżniającą się niczym nadzwyczajnym platformą, której można używać do różnych zadań. Przyglądając się wszystkim znanym metodom pisania programów, platformie Hadoop jest bliżej do takich języków programowania niskiego poziomu, jak C i Java, niż do programów zarządzających bazami danych czy takich aplikacji jak arkusze kalkulacyjne.

Jak widać, ludzie postrzegają platformę Hadoop na różne sposoby, wyrażając opinie, że znajduje ona zastosowanie w różnych obszarach IT. Po części mają rację, ponieważ jest to swego rodzaju spoiwo, które jest w stanie połączyć ze sobą zgoła różne środowiska i aplikacje. Ale tylko po części, gdyż Hadoop nie jest tylko prostym łącznikiem, ale zaawansowaną technologią, wymagającą znajomości programowania i rzetelnego profesjonalizmu. Wydawało się, że Hadoop 2.0 zmieni tę sytuację i spowoduje, że projektowanie aplikacji na bazie tej platformy będzie łatwiejsze. Nic takiego jednak się nie stało i Hadoop 2.0 dalej wymaga sporej wiedzy w zakresie programowania.


TOP 200