首页 文章

快速训练和scikit-learn中的DBSCAN算法

提问于
浏览
0

我试图找到一个聚类算法来使用python聚类名义数据 . 为此,我尝试使用RapidMiner进行DBSCAN算法,并使用标称数据 . 但是当我使用scikit-learn提供的DBSCAN算法尝试相同的数据集时,它给出了错误,即函数无法将字符串转换为浮点数 .

DBSCANs是否在快速模拟和scikit-learn中有所不同,我该如何解决这个问题?另外,如果你告诉我另一个与标称数据一起使用的聚类算法,那会很棒吗?

2 回答

  • 2

    SciPy默认为欧几里德距离( metric='euclidean' ),它不是为标称数据定义的 .

    你需要指定你的距离测量!

  • 1

    RapidMiner实现各种距离测量,包括标称距离 . 这由DBSCAN和其他算法使用 .

    如果属性的值相同则两个示例之间的距离为零,否则为1 . 换句话说,“覆盆子”距离“Apple”和“计算机”的距离为1 . 另外“Apple”是一款远离“Raspberry”和“Computer”等等 .

相关问题