Leonardo Vila — Data Engineer

Experiencia Verificable

Trayectoria Profesional

💼

Data Ingestion Engineer — Wealth Reader

Extracción de datos financieros y bancarios

2 años y medio de experiencia · Fintech · España (remoto)

Empresa española de agregación de datos bancarios y financieros, donde me desempeñé en el desarrollo de sistemas de scraping para extracción sistemática de datos. Diseño de pipelines de ingesta, limpieza y normalización desde fuentes heterogéneas. Manejo de anti-bot, rate limiting, sesiones concurrentes y parsing de formatos propietarios en entornos de producción.

Experiencia en Fintech Datos financieros & bancarios Sistemas en producción

🌐

Data Engineer

Freelancer

Septiembre 2025 — Presente

Operación de infraestructura propia que opera 24/7, montada en AWS. Suministro de datasets financieros en Fiverr con clientes recurrentes y valoración de 5 estrellas. Desarrollo de plataformas web para clientes particulares.

Data Ingestion ETL Automation AWS

Proyectos en Producción

Sistemas Vivos, No Mockups

Cada proyecto es una plataforma operativa desplegada en produccion. Hacé click y explorá los datos en tiempo real.

Plataforma de Datos Financieros

Plataforma corporativa full-stack sobre AWS (ECS Fargate, RDS, S3, Lambda, EventBridge, CloudFront, ALB) con CI/CD vía GitHub Actions + OIDC. ETL distribuido con capacidad para 2,425 símbolos vía WebSocket, cómputo vectorizado de métricas derivadas (volatilidad, performance, momentum) y persistencia dual OLTP/OLAP: RDS PostgreSQL para serving operacional, BigQuery como data warehouse modelado en arquitectura medallion (bronze → silver → gold) con DBT y star schema de Kimball. Orquestación programada vía EventBridge + Lambda; una API FastAPI recomputa métricas en memoria y las transmite por WebSocket con latencia sub-milisegundo.

EN VIVO

AWS (Fargate + RDS + S3 + Lambda + EventBridge) BigQuery DBT (Medallion) Star Schema (Kimball) PostgreSQL 16 Python (asyncio) FastAPI Pandas (Vectorizado) WebSocket React 19 Docker GitHub Actions (OIDC) CloudFront + ALB

ETL Distribuido (Fargate) → RDS PostgreSQL (OLTP) → S3 → BigQuery (OLAP) → DBT Medallion (Bronze / Silver / Gold) → Star Schema → FastAPI (Live WS)

2,425

Capacidad de símbolos rastreados

1.2M+

Filas en data warehouse

1994

Profundidad histórica

<1ms

Latencia de cómputo live

Explorar en Vivo Acceso al Código

Arbitraje de Precio y Explorador de Catálogo — Costco US

Pipeline full-stack de price intelligence corriendo en VPS que scrapea el catálogo completo de Costco.com (~10,000 SKUs en 1,000+ categorías) diariamente con Python asíncrono, concurrencia throttleada por semáforo y delays anti-detección. Base SQLite con modelo snapshot — rebuild completo en cada ejecución, sin migraciones ni drift. Motor de deltas que compara estado previo vs. actual para surfear caídas de precio, nuevos ingresos y bajas, con reconciliación semántica que detecta rotaciones de SKU y elimina falsos positivos. FastAPI sirve 7 endpoints read-only detrás de Nginx; un dashboard React 19 con charts Tremor expone un Catalog Explorer y una pestaña de Business Intelligence con tablas de arbitraje ordenables. Safety stop aborta el pipeline si el conteo de productos cae por debajo del umbral, protegiendo la base de scrapes parciales.

EN VIVO

Python FastAPI aiohttp asyncio SQLite React 19 Zustand Tremor Tailwind CSS

Extracción Asíncrona → Limpieza & Parsing → Árbol de Categorías → SQLite + Delta → Detección de Arbitraje → API REST → Dashboard

1,274

Categorías mapeadas

Async

Fan-out concurrente

Delta

Tracking de precios

Explorar en Vivo Acceso al Código

Stack Técnico

Herramientas & Competencias

⚙

Pipelines & ETL

Diseño y construcción de pipelines de datos end-to-end: ingesta, transformación, persistencia y orquestación de stages con observabilidad integrada.

⚡

Infraestructura montada en la nube

Sistema montado en AWS. ETL operando como ECS task. API montada como ECS Service. Frontend servido desde S3 + Cloudfront. Base de datos en PostgreSQL montada en RDS

🛠

APIs & Sistemas de Streaming

Desarrollo de microservicios stateless de alto rendimiento con FastAPI y Python asíncrono (asyncio). Orquestación de conexiones WebSocket concurrentes para transmisión de datos con latencia sub-milisegundo. Gestión de connection pooling optimizado para RDS, rate limiting estricto y diseño preparado para balanceo de carga en entornos auto-escalables.

📊

Data Ingestion

Data ingestion asíncrono con aiohttp y asyncio.gather para concurrencia masiva. Parsing de protocolos propietarios, manejo de rate-limits y detección de deltas. Charles proxy y escaneo de endpoints para ingesta de data de difícil acceso. Capacidad para superar cifrados y captchas.

🗃

Almacenamiento y Analítica

Separación estricta de dominios: PostgreSQL para serving operacional de baja latencia y BigQuery como Data Warehouse masivo. Orquestación de transformaciones complejas con dbt (Arquitectura Medallion), garantizando escalabilidad y consultas analíticas sin impacto en producción.

🌐

Frontend & Visualización

React 19, TypeScript, Zustand, Tailwind CSS. Interfaces responsive con actualización en tiempo real vía WebSocket.

Construyo infraestructura de datos que opera 24/7