Meeting nr 1

Termin spotkania 19 marca

Tematy spotkania:

Wybór technologii potrzebnych do działania systemu w architekturze lambda.
Problemy, które chcielibyśmy rozwiązać

Podczas spotkania

Batch layer – to jest warstwa, która będzie przetrzymywać wszystkie historyczne dane, odatkowo może być odpowiedzialna za przetważanie danych OLAP. Może obsługiwać analize predefiniowanych danych jak i analizować je na poczekaniu.

Speed layer – jest to warstwa w której przetwarzamy dane w czasie rzeczywistym (w momencie kiedy dane zostaną dostarczone do systemu). Tak samo jak poprzednia warstwa przeprowadza ona analizę danych. Obliczenia przeprowadzone bardzo szybko z małym opóźnieniem.

Serve layer – tutaj są zapisywane dane z warstwy wsadowej

Problemy które chcemy rozwiązać to:

NoSQL
ACID (Atomicity Consistency Isolation Durability)

Zastosowanie bazy danych NewSQL pozwala na zrealizowanie 2 powyższych reguł (ACID I NoSQL) Dodatkowo, aby przetwarzać dane za pomocą SQL-a na klastrze Sparka można wykorzystać Spark SQL.

W przydadku Hadoop-a nie zastosujemy technologii Hbase z powodu niepełnego pokrycia metody ACID.

Complexity

Założenia po spotkaniu: Potrzebne maszyny do wygenerowania

Porównania Spark + Hadoop / Storm Zastosowanie bazy NoSQL – pozwoli na

Pytania po spotkaniu: Jaki mamy mieć generator danych?

Podział prac na dzień dzisiejszy: Dawid – mam obsługiwać data source Bartek – będzie obsługiwał Sparca Darek – NewSQL

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Meeting nr 1

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Clone this wiki locally