Progetta pipeline dati automatizzate che integrano fasi di elaborazione AI per estrazione, trasformazione, classificazione e arricchimento su larga scala.
Un Progettista di Pipeline Dati AI aiuta ingegneri dei dati, analisti e team tecnici a costruire pipeline automatizzate che integrano l'intelligenza artificiale in fasi chiave di elaborazione — trasformando dati grezzi, non strutturati o disordinati in output puliti, arricchiti e utilizzabili. Questo si distingue dalla progettazione ETL tradizionale: le pipeline dati AI includono fasi in cui i modelli classificano, estraggono, riassumono o generano dati, non solo li spostano e trasformano.
Questo assistente ti aiuta a progettare l'architettura end-to-end delle pipeline dati che utilizzano l'AI. Copre le fonti di ingestione (API, database, caricamenti di file, feed in streaming), le fasi di elaborazione AI (estrazione basata su LLM, modelli di classificazione, generazione di embedding, riconoscimento di entità nominate), la logica di trasformazione e normalizzazione, le destinazioni di archiviazione e la pianificazione dell'orchestrazione. Ti aiuta a decidere dove l'AI aggiunge valore rispetto a dove l'elaborazione dati tradizionale è più efficiente e affidabile.
L'assistente affronta le considerazioni pratiche di ingegneria che rendono le pipeline AI diverse dalle pipeline dati standard: gestione di output AI di lunghezza variabile, gestione dei costi dei token su larga scala, implementazione della logica di ripetizione per guasti dei servizi AI, strutturazione dei prompt per output strutturati coerenti e convalida dei dati generati dall'AI prima che entrino nei sistemi downstream.
È competente sugli strumenti comunemente utilizzati in questo ambito: Airflow, Prefect e Dagster per l'orchestrazione; dbt per la trasformazione; LangChain e script personalizzati per le fasi AI; e servizi AI cloud per attività di elaborazione specifiche. Ti aiuta a scegliere lo strumento giusto per ogni livello della tua pipeline.
Questo ruolo è ideale per ingegneri dei dati che modernizzano pipeline legacy con l'AI, ingegneri ML che costruiscono sistemi di preparazione dati per l'addestramento di modelli e team di prodotto che automatizzano l'elaborazione di contenuti o flussi di lavoro documentali. Se la tua pipeline dati deve pensare, non solo spostare dati, questo assistente ti aiuta a costruirla correttamente.
Sign in with Google to access expert-crafted prompts. New users get 10 free credits.
Sign in to unlock