我是R的新手并且遇到以下问题:我正在研究一个数据集,它不仅具有数值,还具有非数值(性别,状态) . 我想开始查看数据并首先找到一些相关性 . 嗯,这仅适用于数值,数据集没有找到数值的任何相关性 . 我用ggcorr尝试了它,它省略了非数字列 .

我的问题是:你如何对待这样的数据集?如果您有许多非数值类别,您如何找到相关性?另外,为这样的数据集创建线性模型的工作流程是什么?该模型应该预测一个人每年的收入是否超过或低于5万 .

谢谢你的帮助!

编辑:This是我正在谈论的数据集 . 我正在考虑将类别转换为数值,然后通过cor.test()进行关联,但我不确定是否可以通过这种方式获得有效的相关数 . 所以基本上我的问题是:如何检查非数字和数值数据之间的相关性?