我不确定在下面的问题中使用哪些数字我试图解决这个问题涉及使用Pearson Correlation公式 .
A B C D E F
Bob 4 5 4 2
Fra 2 2 2 3 2
Lee 2 4 3 5
Cha 5 4 4 1
“使用Pearson Correlation和加权平均值描述基于邻域的方法,以生成Bob是否喜欢”F“的预测 . 您的答案应概述基于邻域的方法中的主要步骤,并显示生成预测所需的步骤”
所以我想知道Bob是否会喜欢F ...(5 =喜欢1 =不喜欢)我理解Pearson Formula但是我不确定其他'用户'来比较Bob,或者我应该考虑所有用户的观点 .
我也理解如何回避回答类似家庭作业的问题,但我花了几个小时在网上搜索,试图解决这个问题 .
任何帮助将不胜感激,谢谢你提前 .
1 回答
可能需要查看问题的具体细节,以便为问题本身提出最佳答案,但一种似乎可行的方法是计算Bob与彼此之间的相关性(Fra,Lee和Cha),以及通过这些相关性对F的分数进行加权 .
在这种情况下,由于你只有Fra和Lee的F分数,所以只需要
(corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2