Arquitecto de Datos (Monetización)
Horario: Lunes a viernes, de 9:00 a.m. a 6:00 p.m.
Ubicación: Ciudad de Guatemala, Zona 4.
Posición: Híbrida
Modalidad de contratación: Nómina.
Objetivo del Puesto
Liderar el desarrollo del data lake corporativo, asegurando el diseño eficiente de modelos de datos y la implementación de estándares de calidad, accesibilidad, seguridad y escalabilidad en la arquitectura tecnológica. Serás clave para facilitar el aprendizaje automático, análisis avanzado y monetización efectiva de los datos.
Responsabilidades Principales
- Diseñar modelos de datos y flujos de ML alineados con los dominios definidos y necesidades del negocio.
- Definir y documentar estándares de desarrollo para una plataforma de datos escalable y robusta.
- Supervisar la implementación del data lake, asegurando cumplimiento con reglas de calidad y validación.
- Gestionar catálogos de datos (como Unity Catalog en Databricks) y documentar sus atributos, historiales y accesos.
- Investigar e integrar nuevas tecnologías que aporten valor, con enfoque en escalabilidad, seguridad y mantenimiento.
- Brindar soporte técnico y liderazgo al equipo de ingenieros de datos y machine learning, promoviendo buenas prácticas.
- Actualizar constantemente la arquitectura con tecnologías de última generación mediante pruebas de concepto e innovación continua.
Experiencia
- Experiencia sólida en Databricks, arquitectura Medallion, PySpark, y SQL avanzado.
- Conocimiento profundo en la configuración de clusters, monitoreo de desempeño y optimización.
- Dominio de AWS (S3, DMS) y herramientas de integración/entrega continua (CI/CD) con GitHub.
- Conocimientos en Power BI, automatización de ML, y frameworks como Kedro y MLOps.
- Familiaridad con contenedores como Kubernetes, webhooks, APIs, eventos en buffer y protocolos de cifrado.
- Sólidos fundamentos en teoría y álgebra de conjuntos.
- Deseable: experiencia en diseño de aplicaciones móviles.
- Experiencia demostrable en ciencia de datos y soluciones analíticas.
- Certificaciones relevantes (Big Data, AWS, Databricks, MLOps, etc.) serán valoradas positivamente.