Implementieren Sie Datenqualitäts-Frameworks, Anomalieerkennung, Datenverträge und Pipeline-Überwachbarkeit mit Great Expectations, Monte Carlo, Soda oder benutzerdefinierter Validierungslogik.
Schlechte Daten sind gefährlicher als keine Daten – sie erzeugen selbstbewusste falsche Antworten, die sich stillschweigend über Dashboards, Modelle und Geschäftsentscheidungen verbreiten. Data Quality und Observability Engineering ist die Disziplin, Datenprobleme zu erkennen, zu verhindern und sichtbar zu machen, bevor sie nachgelagerte Verbraucher erreichen. Sie hat sich zu einem anspruchsvollen technischen Bereich mit speziellen Tools, Mustern und Praktiken entwickelt.
Der Data Quality & Observability Engineer hilft Ihnen, umfassende Datenqualitäts-Frameworks für Ihre Datenplattform zu entwerfen und zu implementieren. Dies umfasst die Gestaltung und Implementierung von Validierungsregeln mit Great Expectations, Soda Core, dbt-Tests oder benutzerdefinierten SQL-basierten Prüfungen; Anomalieerkennungsmuster für Volumen, Aktualität, Schemaabweichungen und Verteilungsverschiebungen; Definition und Durchsetzung von Datenverträgen zwischen Produzenten und Verbrauchern; sowie Instrumentierung der Pipeline-Überwachbarkeit mit Alarmierung, Linienverfolgung und Incident-Response-Workflows.
Diese Rolle hilft Ihnen, von reaktivem Qualitätsmanagement – Probleme entdecken, nachdem Benutzer sich beschweren – zu proaktiver Überwachung überzugehen, die Probleme bei der Erfassung, Transformation und Bereitstellung erfasst. Sie entwirft Validierungssuiten, die auf die spezifischen Eigenschaften Ihrer Daten zugeschnitten sind, nicht auf generische Vorlagen, und integriert sie ohne übermäßigen Aufwand in Ihre bestehende Pipeline-Orchestrierung.
Sie können ein spezifisches Datenqualitätsproblem mitbringen – eine Dimensionstabelle, die während der Transformation stillschweigend Zeilen verliert, eine Berichtstabelle mit intermittierenden Null-Explosionen, eine Pipeline ohne Aktualitätsüberwachung – und erhalten eine vollständige Validierungsstrategie mit Implementierungscode und Alarmierungskonfiguration. Sie können auch eine Neuentwicklung der Datenqualitätsarchitektur für eine neue Plattform anfordern.
Ideal für Data-Engineering-Teams, die wiederkehrende Datenvorfälle erleben, Organisationen, die Data Mesh einführen und domänenspezifische Qualitätsverantwortung benötigen, Analytics Engineers, die dbt-Projekte mit umfassenden Tests instrumentieren, und Plattform-Teams, die Daten-observability-Tools evaluieren.
Mit Google anmelden. Neue Nutzer erhalten 10 kostenlose Credits.
Anmelden zum Freischalten