Costruisci e integra pipeline di dati utilizzando strumenti ETL/ELT, Apache Airflow, dbt, Spark e connettori per data warehouse cloud per analisi e operazioni.
Data Pipeline Implementation Engineer è un assistente AI per ingegneri dei dati, ingegneri analitici e team di piattaforma che progettano, costruiscono e mantengono le pipeline che spostano e trasformano i dati attraverso i sistemi di un'organizzazione. Senza pipeline affidabili, i data warehouse diventano obsoleti, i dashboard mostrano numeri errati e i modelli di machine learning si addestrano su dati spazzatura — questo assistente ti aiuta a costruire l'infrastruttura che mantiene il flusso corretto dei dati.
L'assistente copre l'intero stack di data engineering: strumenti di ingestione come Fivetran, Airbyte e Stitch; piattaforme di orchestrazione come Apache Airflow, Prefect e Dagster; framework di trasformazione come dbt (data build tool); motori di elaborazione come Apache Spark e Flink; e sistemi di destinazione tra cui Snowflake, BigQuery, Databricks, Redshift e Azure Synapse. Aiuta a progettare architetture di pipeline sia batch che streaming appropriate per i volumi di dati e i requisiti di latenza.
Per l'implementazione di nuove pipeline, l'assistente aiuta a progettare flussi di dati dalla fonte alla destinazione, selezionare la strategia di ingestione corretta (caricamento completo vs. incrementale, basato su CDC vs. polling API), scrivere modelli e test dbt, configurare DAG Airflow e impostare controlli di qualità dei dati e avvisi. Consiglia sulla progettazione dello schema, strategie di partizionamento e modelli di data modeling inclusi il dimensional modeling di Kimball e l'approccio Data Vault.
Per la risoluzione dei problemi, l'assistente aiuta a diagnosticare guasti alle pipeline, problemi di freschezza dei dati, record duplicati, deriva dello schema e degrado delle prestazioni. Aiuta a scrivere query di riconciliazione dei dati, impostare il monitoraggio del conteggio delle righe e del tasso di nulli e costruire logiche di avviso per la salute della pipeline.
Questo assistente è ideale per team di data engineering che costruiscono un moderno stack di dati, team di analisi che assumono la proprietà del proprio livello di trasformazione e organizzazioni che migrano da strumenti ETL legacy a pipeline native del cloud. Accelera l'implementazione, riduce i guasti alle pipeline e aiuta i team ad adottare le migliori pratiche di ingegneria del software — controllo versione, test, documentazione — nel loro lavoro con i dati.
Accedi con Google per accedere ai prompt professionali. I nuovi utenti ricevono 10 crediti gratuiti.
Accedi per sbloccare