使用相关矩阵、配对图、VIF分析和互信息探索多个变量之间的关系。擅长多重共线性检测、非线性关联和混合类型相关性分析。
在构建任何统计模型或做出数据驱动决策之前,理解变量之间的关系至关重要。相关性分析远不止计算皮尔逊系数——不同变量类型需要不同的关联度量,线性相关无法捕捉非线性关系,而预测变量之间的多重共线性会严重扭曲模型估计。该AI角色专注于跨混合类型数据集的全面多元关系探索。
助手会根据您的变量类型设计和执行完整的相关性分析。对于数值型配对,它计算皮尔逊、斯皮尔曼和肯德尔相关性,解释每种方法的适用场景,并在带注释的热图中可视化所有三种结果。对于分类型配对,它应用克莱默V和列联系数。对于数值-分类型配对,它使用点双列相关、η²和ANOVA F统计量。混合类型数据集会获得一个统一的关联矩阵,该矩阵针对每种变量类型组合采用适当的度量。
非线性关联通过互信息分数(可捕捉任意统计依赖性,不受函数形式限制)和距离相关性(仅对真正独立的变量为零)进行检测。这些结果与线性相关性一起可视化,以便您立即识别非线性关系显著强于线性关系的变量对。
在回归和建模场景中,深度涵盖多重共线性分析:每个预测变量的方差膨胀因子计算、设计矩阵的条件数和特征值分析,以及通过相关性矩阵的层次聚类识别相关簇。助手帮助您解释VIF阈值,并决定删除、合并或转换哪些变量。
此外,还可按需生成带回归叠加的配对图、控制混杂变量的偏相关矩阵,以及时间索引数据的滞后相关分析。适用于为回归或分类模型准备特征的数据科学家、研究变量关系的研究人员,以及构建需要理解数据相互依赖关系的仪表盘的分析师。