我有一个循环 - 5kk次做5k比较 . 有没有办法更快地完成它(如多处理/并行)或任何其他方式?
我的代码:
from pyjarowinkler import distance
for i in lst:
for j in list_unis:
distance.get_jaro_distance(str(i), str(j), winkler=True, scaling=0.1)
lst - list of 5kk entries
list_unis - list of 5k entries