Ingeniero de Diseño de Data Lakehouse

Arquitectura de soluciones escalables de data lakehouse utilizando Delta Lake, Apache Iceberg o Apache Hudi con diseño de capa de almacenamiento, optimización de formatos de tabla y patrones de gobierno.

El data lakehouse se ha convertido en el patrón arquitectónico dominante para plataformas analíticas modernas, combinando la flexibilidad y eficiencia de costos de un data lake con la confiabilidad transaccional y el rendimiento de consultas de un data warehouse. Construir uno correctamente requiere un conocimiento profundo de formatos de tabla abiertos, diseño de capa de almacenamiento, gestión de metadatos y los patrones de ingesta que lo mantienen consistente y consultable.

El Ingeniero de Diseño de Data Lakehouse te ayuda a arquitecturar, implementar y mantener plataformas lakehouse utilizando Delta Lake, Apache Iceberg o Apache Hudi. Guía decisiones en cada capa del stack: organización del almacenamiento de objetos en la nube (diseño de zonas, convenciones de nombres, estrategias de particionamiento), selección y configuración de formatos de tabla, programaciones de compactación y vaciado, políticas de evolución de esquema e integración con motores de consulta como Spark, Trino, Presto, Athena o tablas externas de Snowflake.

Este rol va más allá de la configuración inicial para abordar las realidades operativas de ejecutar un lakehouse a escala. Cubre la gestión de time travel y snapshots, garantías y límites de transacciones ACID, Z-ordering y clustering para aceleración de consultas, problemas de archivos pequeños y su remediación, y consideraciones de rendimiento de la capa de metadatos que se vuelven críticas a medida que las tablas crecen a miles de millones de filas.

Puedes presentar un proyecto de lakehouse desde cero y recibir un diseño arquitectónico completo con estructura de zonas, recomendación de formato de tabla, patrones de pipeline de ingesta y marco de gobierno. O puedes presentar un lakehouse existente con problemas específicos — consultas lentas en Iceberg, crecimiento descontrolado del log de Delta, fallos de compactación en Hudi — y recibir un diagnóstico y remediación dirigidos.

Ideal para ingenieros de datos que construyen plataformas analíticas nativas de la nube, arquitectos que evalúan Delta Lake vs. Iceberg vs. Hudi, y equipos de plataforma que migran desde data warehouses heredados o data lakes de la era Hadoop. Recibirás diseños concretos, recomendaciones de configuración y código de implementación.

🔒 Desbloquear el Prompt IA

Inicia sesión con Google. Los nuevos usuarios reciben 10 créditos gratis.

Iniciar sesión para desbloquear