Personal Data Warehouse & Analytics

This repository contains my personal data warehouse project, where raw e-commerce data is cleaned, transformed, and structured into fact tables and data marts. The goal is to create datasets that can be used both for BI dashboards and machine learning models, providing insights into sales performance, top products, and seller activities across cities and categories.

So far, the project has reached the gold layer stage, and a customer/order-centric data mart (mart_sales_performance) has been created. It aggregates:

Total sales per seller, city, and product category
Average order value and number of items
Weekly trends for better time-based analysis

The Medallion Layer architecture has been applied in this project to organize data into multiple stages:

Bronze Layer → raw ingested data, minimal transformations
Silver Layer → cleaned and harmonized data ready for analytics
Gold Layer → aggregated, high-quality data ready for data marts, BI dashboards, and ML datasets

Tools & Data Used

Dataset Source: Kaggle (extracted to local CSV files)
Initial Data Profiling & Insights: Jupyter Notebook
Temporary Database / Local Engine: DuckDB
Data Transformation & Quality Checks: dbt
Querying & Data Integrity Checks: DBeaver

Architecture

Here's the data warehouse architecture I've designed:

Star Schema

The star schema that consolidates all fact and dimension tables:

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
data/raw		data/raw
notebooks		notebooks
src/dbt_olist		src/dbt_olist
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Personal Data Warehouse & Analytics

Tools & Data Used

Architecture

Star Schema

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Personal Data Warehouse & Analytics

Tools & Data Used

Architecture

Star Schema

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages