Data Engineer. Diseño y despliego arquitecturas multi-cloud reales. Ingesta de alta frecuencia, separación de cargas transaccionales/analíticas y orquestación de contenedores. Fierros de verdad, corriendo en vivo.
Empresa española de agregación de datos bancarios y financieros, donde me desempeñé en el desarrollo de sistemas de scraping para extracción sistemática de datos. Diseño de pipelines de ingesta, limpieza y normalización desde fuentes heterogéneas. Manejo de anti-bot, rate limiting, sesiones concurrentes y parsing de formatos propietarios en entornos de producción.
Operación de infraestructura propia que opera 24/7, montada en AWS. Suministro de datasets financieros en Fiverr con clientes recurrentes y valoración de 5 estrellas. Desarrollo de plataformas web para clientes particulares.
Cada proyecto es una plataforma operativa desplegada en produccion. Hacé click y explorá los datos en tiempo real.
Plataforma corporativa full-stack sobre AWS (ECS Fargate, RDS, S3, Lambda, EventBridge, CloudFront, ALB) con CI/CD vía GitHub Actions + OIDC. ETL distribuido con capacidad para 2,425 símbolos vía WebSocket, cómputo vectorizado de métricas derivadas (volatilidad, performance, momentum) y persistencia dual OLTP/OLAP: RDS PostgreSQL para serving operacional, BigQuery como data warehouse modelado en arquitectura medallion (bronze → silver → gold) con DBT y star schema de Kimball. Orquestación programada vía EventBridge + Lambda; una API FastAPI recomputa métricas en memoria y las transmite por WebSocket con latencia sub-milisegundo.
Scraper asíncrono que extrae el catálogo completo de Costco, estructura la jerarquía de categorías, detecta cambios de precios entre crawls y expone una API REST con dashboard interactivo para exploración de productos y arbitraje.
Diseño y construcción de pipelines de datos end-to-end: ingesta, transformación, persistencia y orquestación de stages con observabilidad integrada.
Sistema montado en AWS. ETL operando como ECS task. API montada como ECS Service. Frontend servido desde S3 + Cloudfront. Base de datos en PostgreSQL montada en RDS
Desarrollo de microservicios stateless de alto rendimiento con FastAPI y Python asíncrono (asyncio). Orquestación de conexiones WebSocket concurrentes para transmisión de datos con latencia sub-milisegundo. Gestión de connection pooling optimizado para RDS, rate limiting estricto y diseño preparado para balanceo de carga en entornos auto-escalables.
Data ingestion asíncrono con aiohttp y asyncio.gather para concurrencia masiva. Parsing de protocolos propietarios, manejo de rate-limits y detección de deltas. Charles proxy y escaneo de endpoints para ingesta de data de difícil acceso. Capacidad para superar cifrados y captchas.
Separación estricta de dominios: PostgreSQL para serving operacional de baja latencia y BigQuery como Data Warehouse masivo. Orquestación de transformaciones complejas con dbt (Arquitectura Medallion), garantizando escalabilidad y consultas analíticas sin impacto en producción.
React 19, TypeScript, Zustand, Tailwind CSS. Interfaces responsive con actualización en tiempo real vía WebSocket.
¿Te interesa lo que hago? Te escucho.
Certificaciones verificables emitidas por Coursera y otras plataformas, vinculadas a mi perfil de LinkedIn.
Certificaciones de Coursera en Python, Data Engineering, SQL, y más. Todas verificables.