Specialista di Analisi Esplorativa dei Dati

Esegui un'analisi esplorativa strutturata dei dati per scoprire distribuzioni, outlier, correlazioni e pattern. Genera report EDA, visualizzazioni e riepiloghi statistici in Python o R.

Prima che qualsiasi modello di machine learning venga addestrato o venga presa una decisione aziendale, i dati devono essere compresi a fondo. L'Analisi Esplorativa dei Dati è il processo strutturato di esaminare un dataset da ogni angolazione — distribuzioni, tendenze centrali, dispersione, asimmetria, correlazioni e anomalie — per costruire un modello mentale accurato di ciò che i dati contengono e di ciò che possono supportare. Questo ruolo AI ti guida attraverso quel processo con rigore ed efficienza.

L'assistente ti aiuta a progettare ed eseguire un flusso di lavoro EDA completo per qualsiasi dataset tabellare. Genera grafici di distribuzione e riepiloghi statistici per ogni variabile, identifica distribuzioni asimmetriche o a coda pesante che potrebbero richiedere trasformazioni, calcola matrici di correlazione ed evidenzia la multicollinearità, rileva outlier utilizzando sia metodi statistici (IQR, z-score) che tecniche di visualizzazione (box plot, scatter plot), e valuta i pattern di dati mancanti per distinguere i dati mancanti completamente a caso da quelli mancanti in modo strutturato.

Descrivi il tuo dataset — la sua fonte, dimensioni, tipi di variabili e obiettivo analitico — e ricevi un piano EDA strutturato insieme a codice Python o R eseguibile. L'output include codice annotato per report pandas-profiling o ydata-profiling, visualizzazioni matplotlib e seaborn e interpretazione narrativa di ogni risultato. L'assistente spiega non solo cosa mostrano le statistiche, ma cosa implicano per la modellazione o l'analisi a valle.

Oltre all'analisi univariata e bivariata, l'assistente aiuta con l'esplorazione multivariata: pair plot, heatmap, anteprime di riduzione della dimensionalità tramite PCA e confronti a livello di gruppo utilizzando riepiloghi stratificati. Segnala problemi di qualità dei dati — righe duplicate, codifiche categoriali incoerenti, intervalli di valori inaspettati — e suggerisce passaggi di remediation.

Ideale per data scientist che iniziano un nuovo progetto, analisti che ereditano un dataset sconosciuto e team che preparano dati per pipeline di machine learning che necessitano di una comprensione approfondita e documentata dei propri dati prima di iniziare la modellazione.

🔒 Sblocca il Prompt AI

Accedi con Google per accedere ai prompt professionali. I nuovi utenti ricevono 10 crediti gratuiti.

Accedi per sbloccare