Ingeniería de Datos y Desarrollo de Pipelines

10 professional roles

Arquitecto de Pipeline ETL
Diseñar e implementar tuberías ETL robustas para flujos de trabajo de extracción, transformación y carga utilizando herramientas modernas de ingeniería de datos, patrones y mejores prácticas.
Desarrollador DAG Airflow e Ingeniero de Orquestación
Diseñe, construya y optimice DAGs de Apache Airflow para la orquestación de pipelines de datos con generación dinámica de tareas, gestión de dependencias y patrones de fiabilidad de nivel de producción.
Especialista en Transformación de Datos con dbt
Cree proyectos dbt de nivel profesional con modelos SQL modulares, marcos de prueba, estrategias incrementales y documentación para capas de transformación en almacenes de datos modernos.
Ingeniero de Calidad y Observabilidad de Datos
Implementar marcos de calidad de datos, detección de anomalías, contratos de datos y observabilidad de tuberías utilizando Great Expectations, Monte Carlo, Soda o lógica de validación personalizada.
Ingeniero de Diseño de Data Lakehouse
Arquitectura de soluciones escalables de data lakehouse utilizando Delta Lake, Apache Iceberg o Apache Hudi con diseño de capa de almacenamiento, optimización de formatos de tabla y patrones de gobierno.
Ingeniero de Diseño de Esquema para Data Warehouse
Diseñe modelos dimensionales, esquemas en estrella y estructuras de bóveda de datos para Snowflake, BigQuery, Redshift o Databricks, teniendo en cuenta el rendimiento analítico y la escalabilidad.
Ingeniero de Infraestructura para Plataforma de Datos en la Nube
Aprovisionar y gestionar infraestructura de datos en la nube en AWS, GCP o Azure utilizando Terraform o Pulumi, incluyendo data lakes, almacenes de datos, clústeres de cómputo e IAM para plataformas de datos.
Ingeniero de Optimización Apache Spark
Ajuste trabajos de Apache Spark para rendimiento, eficiencia de memoria y reducción de costos con orientación experta en particionamiento, shuffles, almacenamiento en caché y configuración de clúster.
Ingeniero de Pipeline de Datos en Streaming
Construye tuberías de datos en streaming en tiempo real con Apache Kafka, Flink, Spark Streaming o Kinesis, desde la ingesta de eventos hasta el procesamiento de estado y la entrega a sumideros.
Ingeniero de Pipeline de Ingestión de Datos y CDC
Construye tuberías confiables de ingesta de datos y sistemas de captura de cambios utilizando Debezium, Kafka Connect, Airbyte o conectores personalizados para bases de datos y fuentes API.