我想计算两组数字之间的相关分数,但这些数字在每一行内
背景是我正在编译一个推荐系统,使用PCA为每个用户和每个项目给出每个派生特征的分数(在这种情况下为1,2,3)
user item user_score_1 user_score_2 user_score_3 item_score_1 item_score_2 item_score_3
A 1 0.5 0.6 -0.2 0.2 0.8 -0.3
A 2 0.5 0.6 -0.2 0.4 0.1 -0.8
A 3 0.5 0.6 -0.2 -0.2 -0.4 -0.1
B 1 -0.6 -0.1 0.9 0.2 0.8 -0.3
B 2 -0.6 -0.1 0.9 0.4 0.1 -0.8
B 3 -0.6 -0.1 0.9 -0.2 -0.4 -0.1
我将每个用户和项目的输出组合到这个全x表中 . 对于此表中的每一行,我需要计算用户得分1,2,3和项目得分1,2,3之间的相关性(例如,对于第一行,0.5,0.6,-0.2和0.2,0.8之间的相关性是什么,-0.3)查看用户和项目的匹配程度 .
在我将用户和项目加入全部x全部数据集之前,另一种选择是相关性,但我不确定如何做到这一点 .
我不认为我可以转换表,因为实际上用户和项目总数非常大 .
对好方法的任何想法?
谢谢,安德鲁