Niniejsze repozytorium zawiera projekt zaliczeniowy przygotowany na potrzeby przedmiotu Przygotowanie i walidacja danych. Projekt stanowi rezultat pracy zespołowej zespołu w składzie: Daniel Faltynowski, Kacper Hołowaty, Maciej Wysocki, Filip Zawiszewski. Jego celem było wyselekcjonowanie odpowiedniego zbioru danych z obszaru sprzedaży detalicznej, który umożliwiłby praktyczne zastosowanie wiedzy i narzędzi poznanych podczas zajęć.
Dodatkowym założeniem projektu było pozyskanie możliwie szerokiego zestawu zmiennych kategoryzujących, co pozwoliło na pogłębioną analizę trendów sprzedażowych oraz sformułowanie i weryfikację postawionych pytań badawczych.
W ramach realizacji projektu zdecydowaliśmy się podzielić zadania w taki sposób, aby każda osoba wykonywała role najlepiej dopasowane do swoich kompetencji, co pozwalało zarówno na efektywne wykonanie zadań, jak i rozwój umiejętności w danym obszarze. Podział obowiązków przedstawia się następująco:
- Daniel Faltynowski –- pełni rolę kierownika projektu, odpowiadając za koordynację prac zespołu, harmonogram projektu oraz kompleksową weryfikację danych pod kątem poprawności statystycznej i jakościowej.
- Kacper Hołowaty –- zajmuje się analizą eksploracyjną danych, weryfikacją pytań badawczych oraz formułowaniem wniosków na podstawie odkrytych zależności, zapewniając spójność i rzetelność interpretacji danych.
- Maciej Wysocki –- odpowiedzialny za przygotowanie i oczyszczenie zbioru danych gotowego do analizy, w tym integrację, standaryzację i dokumentację poszczególnych zmiennych, aby dane były w pełni użyteczne do dalszych analiz.
- Filip Zawiszewski –- koordynuje proces dokumentacji projektu, tworzy wizualizacje danych surowych oraz nadzoruje proces modelowania danych, w tym implementację transformacji i przygotowanie danych do potencjalnych modeli analitycznych.
Dane wykorzystane w analizie pochodzą z publicznie udostępnionego zbioru Retail Transactional Dataset dostępnego na platformie Kaggle.