对于像为用户推荐项目这样的任务,我可以将数据集拆分为两个:训练和测试数据集,我可以使用平均绝对误差来评估结果 . 但是,当我需要找到项目的类似项目时,我不知道如何评估结果 . 例如,
输入:
userid,itemid,score
1, 123, 5
2, 222, 1
....
svd.similar(123)
输出可能是:(222,0.98),(121,0.78)......我不知道从svd找到的类似项目是好还是不好,如何评估结果?
1 回答
您可能希望首先定义相似度函数(距离函数),例如余弦距离/欧几里德距离 . 然后可以确定和比较相似性 .