Data Engineering + Automation
Microservicio de limpieza de datos diseñado para integrarse en flujos de automatización (n8n, Make, Airflow). Utiliza Pydantic para validación estricta y Phonenumbers para estandarización internacional antes de inyectar datos en HubSpot CRM.
Los CRMs suelen llenarse de "basura":
- Nombres como "JUAN PEREZ" o "juan perez" (Inconsistencia)
- Teléfonos sin código de país: "3001234567" (Inutilizable para WhatsApp API)
- Emails inválidos
Este servicio actúa como un Firewall de Calidad de Datos dentro de tus pipelines.
- Normalización de Texto: Title Case automático para nombres.
- Formato E.164: Convierte teléfonos locales a formato internacional (+57...) automáticamente.
- Validación Estricta: Rechaza registros que no cumplen esquemas de negocio.
- Stateless & CLI: Diseñado para pipes de Unix (
cat data.json | python main.py).
- En tu workflow de n8n, usa un nodo Execute Command.
- Comando:
echo '$json' | python3 /path/to/hubspot-n8n-data-cleaner/main_n8n.py- El script devolverá un JSON estructurado con
clean_data(para insertar) yerrors(para reportar/alertar).
Input:
[
{"firstname": "DIMA", "email": "dima@test.com", "phone": "3001234567"}
]Output:
{
"stats": {"valid": 1, "failed": 0},
"clean_data": [
{
"firstname": "Dima",
"email": "dima@test.com",
"phone": "+573001234567"
}
]
}