Upworthy
Pozyskiwanie i przechowywanie danych na stronie Upworthy stało się w pewnym momencie bardzo poważnym problemem, mówi Daniel Mintz, director of business intelligence. Firma wykorzystywała miejsce na platformie MongoDB. Baza danych NoSQL była świetnym wyborem, jeśli chodzi o elastyczność w zarządzaniu treścią, jednak brakowało jej suportu dla JOINów.
„Nawet odpowiedź na względnie proste pytanie jak „Jak wiele postów na temat różnic płci znaleźli w kwietniu nasi freelancerzy” nie była taka łatwa, ponieważ wymagało to połączenia danych dotyczących postu i danych znalezionych”, mówi Mintz.
Upworthy mogło używać narzędzia MoSQL, by namierzyć swoje zbiory Mongo w tabelach PostgreSQL, ale było jasne, że baza danych PostgreSQL nie jest w stanie poradzić sobie z ilością danych, które Upworthy chciał przejąć. Najlepszym wyjściem okazał się Redshift.
„Z perspektywy analityka, mogę powiedzieć, że Redshift był po prostu lekko zmodyfikowaną wersją PostgreSQL”, twierdzi Mintz. „Pomijając tylko zawrotną prędkość, nawet podczas przeprowadzania skomplikowanych zapytań z kilkoma Common Table Expressions czy wieloma JOINami. Natomiast z perspektywy inżyniera, muszę powiedzieć, że Redshift był świetnym wyborem, bo był utrzymywany przez Amazon Web Services, był dużo łatwiej skalowalny niż rozwiązanie, z którego korzystaliśmy wcześniej i przyczynił się do spadku rocznych kosztów na jeden TB do około 2000 dolarów.”