Explore relaciones entre múltiples variables mediante matrices de correlación, gráficos de pares, análisis VIF e información mutua. Experto en detección de multicolinealidad, asociaciones no lineales y correlación de tipos mixtos.
Comprender cómo se relacionan las variables entre sí es esencial antes de construir cualquier modelo estadístico o tomar decisiones basadas en datos. El análisis de correlación va mucho más allá de calcular un coeficiente de Pearson: diferentes tipos de variables requieren diferentes medidas de asociación, las relaciones no lineales son invisibles para la correlación lineal y la multicolinealidad entre predictores puede distorsionar gravemente las estimaciones del modelo. Este rol de IA se especializa en la exploración integral de relaciones multivariantes en conjuntos de datos de tipos mixtos.
El asistente diseña y ejecuta un análisis de correlación completo adaptado a sus tipos de variables. Para pares numéricos, calcula correlaciones de Pearson, Spearman y Kendall, explicando cuándo es apropiada cada una y visualizando las tres en mapas de calor anotados. Para pares categóricos, aplica la V de Cramér y el coeficiente de contingencia. Para pares numérico-categóricos, utiliza la correlación punto-biserial, eta-cuadrado y estadísticos F de ANOVA. Los conjuntos de datos de tipos mixtos reciben una matriz de asociación unificada que combina la medida adecuada para cada combinación de tipos de variables.
Las asociaciones no lineales se detectan mediante puntuaciones de información mutua, que capturan dependencias estadísticas arbitrarias independientemente de la forma funcional, y correlación de distancia (dCor), que es cero solo para variables verdaderamente independientes. Estas se visualizan junto con las correlaciones lineales para que pueda identificar de inmediato los pares donde las relaciones no lineales son sustancialmente más fuertes que las lineales.
El análisis de multicolinealidad se cubre en profundidad para contextos de regresión y modelado: cálculo del Factor de Inflación de la Varianza para cada predictor, número de condición y análisis de valores propios de la matriz de diseño, e identificación de grupos de correlación mediante agrupamiento jerárquico de la matriz de correlación. El asistente ayuda a interpretar los umbrales de VIF y decidir qué variables eliminar, combinar o transformar.
También se producen, a solicitud, gráficos de pares con superposiciones de regresión, matrices de correlación parcial que controlan por factores de confusión y análisis de correlación retardada para datos indexados en el tiempo. Ideal para científicos de datos que preparan características para modelos de regresión o clasificación, investigadores que investigan relaciones entre variables y analistas que construyen paneles que requieren comprensión de las interdependencias de los datos.
Inicia sesión con Google. Los nuevos usuarios reciben 10 créditos gratis.
Iniciar sesión para desbloquear