首页 文章
  • 0 votes
     answers
     views

    为什么我使用训练有素的互补和标准朴素贝叶斯模型获得相同的测试结果?

    我有一个关于Mahout的问题:当我用补充模型和标准模型方法测试训练有素的朴素贝叶斯模型时,为什么我会在混淆矩阵中得到相同的测试结果(相同的模型测试精度--80%)? 以下是我使用的步骤: 向矢量转换: # mahout seq2sparse --input /user/root/data-seq/chunk-0 --output /user/root/vectors -ow -wt tfid...
  • 2 votes
     answers
     views

    学习字符串模式的机器学习技术

    我是机器学习的新手,我正在寻找一种基于训练数据集学习字符串模式的技术 . My problem: 我有不同类型的单词,属于不同的类别 . 每个类别都有自己的模式(例如,一个具有固定长度,只有特殊字符,另一个存在其他字符,只出现在此类别的_1556651中) . 例如: "ABC" -> type1 "ACC" -> type1 "a8 ...
  • 0 votes
     answers
     views

    无法获得集群输出Mahout

    我在Mahout中运行kmeans,作为输出,我得到文件夹clusters-x,clusters-x-final和clusteredPoints . 如果我理解得很好,cluster-x是每次迭代中的质心位置,cluster-x-final是最终的质心位置,clusteredPoints应该是聚类的簇,其中簇ID和权重代表属于簇的概率(取决于点与其质心之间的距离) . 另一方面,cluster-x...
  • 0 votes
     answers
     views

    Mahout TopItems中的NPE#getTopUsers

    我正在使用mahout版本0.9 . 我在演示服务器上有NPE,有以下堆栈跟踪 . HTTP Status 500 - Request processing failed; nested exception is java.lang.NullPointerException type Exception report message Request processing failed; neste...
  • 0 votes
     answers
     views

    如何向已购买N件商品的用户推荐K类似商品?

    假设用户从我的网站购买了n个项目;我需要一个算法或方法(使用Mahout可能?怎么样?)这样我就可以向用户推荐类似的k项 . 我没有用户评分 . k推荐需要基于用户的购买历史(他的n项) . 这些项目有“名称”,“作者”,“关键字”字段,例如,我需要推荐最相似的项目 . 如果我添加用户评级会怎么样?我该如何考虑到这一点? 我已经阅读了Mahout文档,但似乎总是需要某种评级 . 我如何提供评级,...
  • 4 votes
     answers
     views

    在Mahout中实现SVD推荐器

    我有一个包含5000万用户偏好的数据集,其中包含800万个不同的用户和180K个不同的产品 . 我目前正在使用布尔数据模型,并且具有基本的基于tanimoto相似性的推荐器 . 我正在尝试探索不同的算法以获得更好的建议,并开始使用带有ALSWR因子分解器的SVD . 我使用mahout中提供的基本SVD推荐器如下 . DataModel dataModel = new FileDataModel(...
  • 6 votes
     answers
     views

    Spark - 如何在 生产环境 中使用经过培训的推荐模型?

    我正在使用Spark来构建推荐系统原型 . 经过一些教程后,我能够从我的数据中训练 MatrixFactorizationModel . 然而,Spark mllib训练的模型只是一个 Serializable . 如何使用此模型为真实用户推荐?我的意思是,如果用户数据增加,我怎样才能将模型保存到某种数据库中或更新它? 例如,由Mahout推荐库训练的模型可以存储到像Redis这样的数据库中,...
  • 0 votes
     answers
     views

    如何使用Weka Java API执行线性回归时处理字符串值

    我正在使用Weka Java API执行线性回归 . 数据集包括UserId,用户访问的URL,页面上的时间花费 . 由于URL是String属性,因此在使用上述数据集执行线性回归时遇到问题 . 是他们任何准备使用的方法,它将字符串转换为Weka中的等效Int值 . 我在Mahout中看到了类似的功能,但在Weka中找不到它 . 我可以通过计算每个字符的ASCII总和来轻松创建一个函数来输出字符串...
  • 2 votes
     answers
     views

    Hadoop:在Apache Mahout中实现贝叶斯算法时出错

    我在Mahout中执行贝叶斯算法时遇到问题 . 我用Maven构建它,作业文件在目标目录中 . 当使用Hadoop从终端运行时,我收到ClassNotFoundException错误 . 应该做什么? $HADOOP_HOME/bin/hadoop jar mahout-core-0.3-SNAPSHOT.job org.apache.mahout.classifier.bayes.mapredu...
  • -1 votes
     answers
     views

    协同过滤方法,提供与注册课程相关的提示/建议

    我正在寻找一个特定的问题,我需要 Build 一个推荐人 . 广义问题如下,每个用户都注册了(比方说)x课程(c1,c2,c3,.. cx)根据每个课程,我需要向用户提供(比如说)前5个提示/建议(例如学习可能有用的材料等)我需要应用协作元素来了解哪些推荐对用户有用 .我查看了像Apache Mahout Taste这样的推荐引擎,但是我无法以一种看起来像示例的方式来模拟我的问题 . (用户与一...
  • 21 votes
     answers
     views

    使用机器学习来重复数据

    我有以下问题,并认为我可以使用机器学习但我不完全确定它将适用于我的用例 . 我有一个大约一亿条记录的数据集,其中包含客户数据,包括姓名,地址,电子邮件,电话等,并希望找到一种方法来清理这些客户数据并识别数据集中可能存在的重复数据 . 大多数数据都是使用没有验证的外部系统手动输入的,因此很多客户在我们的数据库中最终得到了多个配置文件,有时每条记录中都有不同的数据 . 对于实例我们可能为客户John ...
  • 0 votes
     answers
     views

    无法在Hadoop上停止datanode和namenode

    我刚刚在我的计算机上运行了一个Apache Mahout集群示例(安装了hadoop单节点),我已经使用命令(在HADOOP_HOME \ bin中找到)启动了hadoop进程(jobtracker,tasktracker,datanode,namenode)start-all .SH . 但是当我尝试使用命令stop-all.sh时,它告诉我没有运行namenode或datanode,尽管jps...
  • 0 votes
     answers
     views

    Apache Mahout Maven构建失败MRLegacy

    配置Apache Mahout时遇到此错误 . 我使用以下内容:Java版“1.8.0_31”Java(TM)SE运行时环境(版本1.8.0_31-b13)Java HotSpot(TM)64位服务器VM(版本25.31-b07,混合模式) Maven版本:Apache Maven 3.0.5(r01de14724cdef164cd33c7c8c2fe155faf9602da; 2013-02-1...

热门问题