Caratterizzare distribuzioni a variabile singola con test statistici, analisi di bontà di adattamento e raccomandazioni di trasformazione. Esperto in test di normalità, correzione dell'asimmetria e fitting di distribuzioni.
Comprendere la distribuzione di una singola variabile è il fondamento di un'analisi statistica solida. Che una variabile segua una distribuzione normale, una legge di potenza, una forma bimodale o qualcosa di intermedio ha implicazioni dirette su quali test statistici siano validi, quali trasformazioni siano necessarie e come si comporteranno i modelli. Questo ruolo AI è specializzato nella caratterizzazione approfondita delle distribuzioni di variabili individuali — andando ben oltre un semplice istogramma.
L'assistente esamina ogni variabile da molteplici angolazioni. Calcola l'intera suite di statistiche descrittive: media, mediana, moda, varianza, deviazione standard, coefficiente di variazione, asimmetria e curtosi in eccesso, con interpretazioni di ciò che ogni valore significa per il comportamento della variabile. Genera visualizzazioni tra cui istogrammi con selezione ottimale dei bin (regola di Freedman-Diaconis), stime di densità kernel, grafici Q-Q rispetto a distribuzioni teoriche, box plot e grafici della funzione di distribuzione cumulativa empirica.
La valutazione della normalità è rigorosa: l'assistente applica Shapiro-Wilk per campioni piccoli, D'Agostino-Pearson per campioni medi e Kolmogorov-Smirnov o Anderson-Darling per dataset più grandi, spiegando cosa implica il risultato di ogni test e perché l'ispezione visiva Q-Q è altrettanto importante. Per variabili non normali, diagnostica la specifica deviazione — asimmetria destra o sinistra, code pesanti, bimodalità — e raccomanda trasformazioni appropriate: log, radice quadrata, Box-Cox, Yeo-Johnson o approcci basati sui ranghi, implementando ciascuna con grafici di confronto prima e dopo.
Oltre alla normalità, l'assistente adatta distribuzioni teoriche alternative — esponenziale, Poisson, gamma, beta, Weibull, log-normale — utilizzando la stima di massima verosimiglianza e valuta la qualità dell'adattamento usando AIC/BIC e grafici di sovrapposizione visiva. Ciò è particolarmente utile per dati di conteggio, variabili tempo-evento, dati di proporzione e metriche finanziarie che seguono distribuzioni non gaussiane.
Ideale per statistici, ricercatori biomedici, analisti finanziari, ingegneri della qualità e data scientist che necessitano di caratterizzare correttamente le distribuzioni delle variabili prima di applicare test parametrici o inserire dati nei modelli.
Accedi con Google per accedere ai prompt professionali. I nuovi utenti ricevono 10 crediti gratuiti.
Accedi per sbloccare