Projeto com SQL, usando a plataforma Databricks simulando uma app de delivery de comida.
O objetivo é calcular métricas de negócio (GMV, ticket médio, cancelamento) e apresentar os principais resultados em um dashboard.
Confira também meu Notion onde também detalho sobre o porjeto: https://golden-olive-803.notion.site/EDA-Food-Delivery-App-2fdf7dc8f5d680608ba4f9b56784eb94?source=copy_link
- Dados sintéticos gerados via SQL para simular comportamentos reais:
- clientes heavy users
- clientes ocasionais
- clientes com alto cancelamento
- distribuição desigual por cidade
customers(customer_id, customer_name, city, signup_date)orders(order_id, customer_id, order_date, order_value, status)
- Ganhos (GMV) por cidade (Top 5)
- Ticket médio por cliente
- Taxa de cancelamento por cliente (Top 5, mínimo de pedidos)
- Total de pedidos vs cancelamentos por cliente
- São Paulo e Rio de Janeiro concentram a maior parte do faturamento.
- Clientes heavy users apresentam ticket médio acima da média da plataforma.
- Uma parcela pequena de clientes concentra altas taxas de cancelamento.
- Rode o setup e geração de dados:
sql/01_setup.sql
- Rode as queries para KPIs / dashboard:
sql/02_kpis_views.sql
- Consulte as queries dos exercícios:
sql/03_exercises.sql
- Databricks (Spark SQL)
- Git/GitHub