-
3 votesanswersviews
除了Levenshtein之外,对于有序字集和随后的聚类,更好的距离度量
我试图解决一个问题,包括比较大量的单词集,每个单词集包含一组单词(大约600,非常高维度!)的大量有序数量的单词,用于相似性,然后将它们聚类成不同的分组 . 解决方案需要尽可能无人监督 . 数据看起来像 [Apple,Banana,Orange ......][Apple,Banana,Grape ......][果冻,茴香,橘子......][草莓,香蕉,橙...]...等等 每组中单词的顺序很... -
376 votesanswersviews
获得最接近的字符串匹配
我需要一种方法来将多个字符串与测试字符串进行比较,并返回与其非常相似的字符串: TEST STRING: THE BROWN FOX JUMPED OVER THE RED COW CHOICE A : THE RED COW JUMPED OVER THE GREEN CHICKEN CHOICE B : THE RED COW JUMPED OVER THE RED COW CHOI...