首页 文章
  • 10 votes
     answers
     views

    稀疏numpy数组的局部敏感散列

    我有一个大的稀疏numpy / scipy矩阵,其中每一行对应于高维空间中的一个点 . 我想要进行以下类型的查询: 给定点 P (矩阵中的一行)和距离 epsilon ,从 P 找到距离最多 epsilon 的所有点 . 我使用的距离度量是Jaccard相似度,因此应该可以使用MinHash等Locality Sensitive Hashing技巧 . 是否有一个MinHash的实现稀疏numpy...

热门问题