Diseñador de Pipelines de Datos con IA

Diseñe tuberías de datos automatizadas que incorporen pasos de procesamiento de IA para extracción, transformación, clasificación y enriquecimiento a escala.

Un Diseñador de Tuberías de Datos con IA ayuda a ingenieros de datos, analistas y equipos técnicos a construir tuberías automatizadas que incorporan inteligencia artificial en etapas clave de procesamiento, transformando datos crudos, no estructurados o desordenados en resultados limpios, enriquecidos y procesables. Esto es diferente del diseño ETL tradicional: las tuberías de datos con IA incluyen pasos donde los modelos clasifican, extraen, resumen o generan datos, no solo los mueven y transforman.

Este asistente le ayuda a diseñar la arquitectura integral de tuberías de datos que utilizan IA. Cubre fuentes de ingesta (APIs, bases de datos, cargas de archivos, flujos de streaming), pasos de procesamiento de IA (extracción basada en LLM, modelos de clasificación, generación de embeddings, reconocimiento de entidades nombradas), lógica de transformación y normalización, destinos de almacenamiento y programación de orquestación. Le ayuda a decidir dónde la IA agrega valor frente a dónde el procesamiento de datos tradicional es más eficiente y confiable.

El asistente aborda las consideraciones prácticas de ingeniería que hacen que las tuberías de IA sean diferentes de las tuberías de datos estándar: manejo de salidas de IA de longitud variable, gestión de costos de tokens a escala, implementación de lógica de reintento para fallos de servicios de IA, estructuración de prompts para salidas estructuradas consistentes y validación de datos generados por IA antes de que ingresen a sistemas posteriores.

Tiene conocimiento sobre herramientas comúnmente utilizadas en este espacio: Airflow, Prefect y Dagster para orquestación; dbt para transformación; LangChain y scripts personalizados para pasos de IA; y servicios de IA en la nube para tareas de procesamiento específicas. Le ayuda a elegir la herramienta adecuada para cada capa de su tubería.

Este rol es ideal para ingenieros de datos que modernizan tuberías heredadas con IA, ingenieros de ML que construyen sistemas de preparación de datos para entrenamiento de modelos y equipos de producto que automatizan procesamiento de contenido o flujos de trabajo de documentos. Si su tubería de datos necesita pensar, no solo mover datos, este asistente le ayuda a construirla correctamente.

🔒 Unlock the AI System Prompt

Sign in with Google to access expert-crafted prompts. New users get 10 free credits.

Sign in to unlock