Sistemas en Producción

Construyo infraestructura de datos que opera 24/7

Data Engineer. Diseño y despliego arquitecturas multi-cloud reales. Ingesta de alta frecuencia, separación de cargas transaccionales/analíticas y orquestación de contenedores. Fierros de verdad, corriendo en vivo.

2,400+
Símbolos en vivo
<1ms
Latencia por tick
24/7
Uptime
Leonardo Vila

Trayectoria Profesional

💼

Data Ingestion Engineer — Wealth Reader

Extracción de datos financieros y bancarios
1 año de experiencia · Fintech · España (remoto)

Empresa española de agregación de datos bancarios y financieros, donde me desempeñé en el desarrollo de sistemas de scraping para extracción sistemática de datos. Diseño de pipelines de ingesta, limpieza y normalización desde fuentes heterogéneas. Manejo de anti-bot, rate limiting, sesiones concurrentes y parsing de formatos propietarios en entornos de producción.

Experiencia en Fintech Datos financieros & bancarios Sistemas en producción
🌐

Profesional Independiente

Ingeniería de Datos — Desarrollo de sistemas end-to-end
Septiembre 2025 — Presente

Operación de infraestructura propia que opera 24/7, montada en AWS. Suministro de datasets financieros en Fiverr con clientes recurrentes y valoración de 5 estrellas. Desarrollo de plataformas web para clientes particulares.

Data Ingestion ETL Automation AWS

Sistemas Vivos, No Mockups

Cada proyecto es una plataforma operativa desplegada en produccion. Hacé click y explorá los datos en tiempo real.

Plataforma de Datos Financieros

Plataforma corporativa full-stack sobre AWS (ECS Fargate, RDS, S3, Lambda, EventBridge, CloudFront, ALB) con CI/CD vía GitHub Actions + OIDC. ETL distribuido con capacidad para 2,425 símbolos vía WebSocket, cómputo vectorizado de métricas derivadas (volatilidad, performance, momentum) y persistencia dual OLTP/OLAP: RDS PostgreSQL para serving operacional, BigQuery como data warehouse modelado en arquitectura medallion (bronze → silver → gold) con DBT y star schema de Kimball. Orquestación programada vía EventBridge + Lambda; una API FastAPI recomputa métricas en memoria y las transmite por WebSocket con latencia sub-milisegundo.

EN VIVO
AWS (Fargate + RDS + S3 + Lambda + EventBridge) BigQuery DBT (Medallion) Star Schema (Kimball) PostgreSQL 16 Python (asyncio) FastAPI Pandas (Vectorizado) WebSocket React 19 Docker GitHub Actions (OIDC) CloudFront + ALB
ETL Distribuido (Fargate) RDS PostgreSQL (OLTP) S3 → BigQuery (OLAP) DBT Medallion (Bronze / Silver / Gold) Star Schema FastAPI (Live WS)
2,425
Capacidad de símbolos rastreados
1.2M+
Filas en data warehouse
1994
Profundidad histórica
<1ms
Latencia de cómputo live

Infraestructura de Datos E-Commerce

Scraper asíncrono que extrae el catálogo completo de Costco, estructura la jerarquía de categorías, detecta cambios de precios entre crawls y expone una API REST con dashboard interactivo para exploración de productos y arbitraje.

EN VIVO
Python FastAPI aiohttp asyncio SQLite React 19 Zustand Tremor Tailwind CSS
Extracción Asíncrona Limpieza & Parsing Árbol de Categorías SQLite + Delta Detección de Arbitraje API REST Dashboard
1,274
Categorías mapeadas
Async
Fan-out concurrente
Delta
Tracking de precios

Herramientas & Competencias

Pipelines & ETL

Diseño y construcción de pipelines de datos end-to-end: ingesta, transformación, persistencia y orquestación de stages con observabilidad integrada.

Infraestructura montada en la nube

Sistema montado en AWS. ETL operando como ECS task. API montada como ECS Service. Frontend servido desde S3 + Cloudfront. Base de datos en PostgreSQL montada en RDS

🛠

APIs & Sistemas de Streaming

Desarrollo de microservicios stateless de alto rendimiento con FastAPI y Python asíncrono (asyncio). Orquestación de conexiones WebSocket concurrentes para transmisión de datos con latencia sub-milisegundo. Gestión de connection pooling optimizado para RDS, rate limiting estricto y diseño preparado para balanceo de carga en entornos auto-escalables.

📊

Data Ingestion

Data ingestion asíncrono con aiohttp y asyncio.gather para concurrencia masiva. Parsing de protocolos propietarios, manejo de rate-limits y detección de deltas. Charles proxy y escaneo de endpoints para ingesta de data de difícil acceso. Capacidad para superar cifrados y captchas.

🗃

Almacenamiento y Analítica

Separación estricta de dominios: PostgreSQL para serving operacional de baja latencia y BigQuery como Data Warehouse masivo. Orquestación de transformaciones complejas con dbt (Arquitectura Medallion), garantizando escalabilidad y consultas analíticas sin impacto en producción.

🌐

Frontend & Visualización

React 19, TypeScript, Zustand, Tailwind CSS. Interfaces responsive con actualización en tiempo real vía WebSocket.

Hablemos

¿Te interesa lo que hago? Te escucho.

Email
leonardolevil96@gmail.com
WhatsApp
+54 11 2654 2270
👥
LinkedIn
Leonardo Vila
💻
GitHub
leonardovila

Certificaciones Oficiales

Certificaciones verificables emitidas por Coursera y otras plataformas, vinculadas a mi perfil de LinkedIn.

🎓

Ver todas mis certificaciones en LinkedIn →

Certificaciones de Coursera en Python, Data Engineering, SQL, y más. Todas verificables.