首页 文章
  • 6 votes
     answers
     views

    确定为什么特征在决策树模型中很重要

    通常情况下,利益相关者不希望使用擅长预测的黑盒模型;他们希望深入了解功能,以便更好地了解他们的业务,因此他们可以向其他人解释 . 当我们检查xgboost或sklearn梯度增强模型的特征重要性时,我们可以确定特征的重要性......但我们不明白为什么这些特征很重要,对吗? Is there a way to explain not only what features are important...
  • 0 votes
     answers
     views

    XGBoost在Google Colab上支持GPU

    有没有办法在Google Collab上使用GPU支持导入XGBoost?最后,我昨天尝试了,加载的XGBoost没有GPU支持 . 您可以通过以下链接访问笔记本:https://colab.research.google.com/drive/1YxCw7eVHZDrbVBFqSN0-t1mZ-fBJJI7h 错误是:XGBoostError:b'[19:15:28] src / learner....
  • 0 votes
     answers
     views

    在python上找不到xgboost库

    我试着在python上安装xgboost,这要归功于以下指令: I - 安装MinGW在线获取安装程序:https://sourceforge.net/projects/mingw-w64/安装时,选择“Architecture”x86_64 . 安装过程完成后,将二进制文件路径添加到PATH环境变量:目录可以是C:\ Users \ username \ mingw-w64 \ x86_64...
  • 0 votes
     answers
     views

    将XGBoost模型转换为CoreML

    我试图将以下XGBoost模型转换为CoreML文件但我收到错误 . Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist- packages/coremltools/convert...
  • 0 votes
     answers
     views

    Xgboost预测模型缺少假期

    我正在 Build 一个预测系统,以预测在给定时间点断开连接的有线电视用户数量 . 我正在使用Python,并且在我尝试的不同模型中,XGBoost表现最佳 . 我有一个自我参照系统,它以移动的窗口方式工作,例如,当我用完实际,我开始使用我的滞后预测数字 . 为了 Build 预测系统,我使用了前800天的滞后(一天断开连接),移动平均线,比率,季节性,年,月,日,周等指标 . 但是,假期,哪里有...
  • 1 votes
     answers
     views

    当在python中导入xgboost时,“找不到版本`GOMP_4.0' - Ubuntu

    HiI使用以下Ubuntu 16.04.1 LTS平台链接安装了xgboost http://xgboost.readthedocs.io/en/latest/python/python_intro.html 当我在python终端中运行以下命令时,它会抛出异常,如下面的屏幕截图所示 将xgboost导入为xg 任何形式的帮助将不胜感激 我也试过以下命令,但没有运气 ==============...
  • 1 votes
     answers
     views

    使用RandomizedSearchCV对XGBClassifier进行Python超参数优化

    我试图获得XGBClassifier的最佳超参数,这将导致获得最具预测性的属性 . 我试图使用RandomizedSearchCV迭代并通过KFold进行验证 . 当我运行此过程总共5次(numFolds = 5)时,我希望将最佳结果保存在名为collector(下面指定)的数据框中 . 所以每次迭代,我都希望得到最好的结果和得分以附加到收集器数据帧 . from scipy import sta...
  • -2 votes
     answers
     views

    如何在Windows中安装XGBoost

    为python 36安装XGBoost时出现以下错误 C:\ Users \ Shrey Shivam \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ numpy \ distutils \ system_info.py:624:UserWarning:Lapack(http://www.net...
  • 0 votes
     answers
     views

    当你有大量的类时,为什么xgboost这么慢?

    我有一个维度 (40000, 21) 的稀疏数据集 . 我正在尝试使用 xgboost 为它构建分类模型 . 不幸的是它太慢了它永远不会终止我 . 但是,在相同的数据集上,scikit-learn的RandomForestClassifer大约需要1秒钟 . 这是我正在使用的代码: from xgboost import XGBClassifier from sklearn.ensemble im...
  • 0 votes
     answers
     views

    在r中的插入符号中创建RMSLE度量标准

    有人可以帮我解决以下问题:我需要将带有插入符号包的xgboost训练模型更改为默认度量标准RMSLE . 默认情况下,插入符号和xgboost在RMSE中训练和测量 . 以下是代码行: 以插入符号格式创建自定义汇总函数 custom_summary = function(data, lev = NULL, model = NULL){ out = rmsle(data[, "obs&qu...
  • 11 votes
     answers
     views

    使用xgboost和插入符号进行并行处理

    我想在使用插入符的同时并行化xgboost的模型拟合过程 . 从我在xgboost的documentation中看到的, nthread 参数控制在拟合模型时使用的线程数,在这种意义上,以并行方式构建树 . Caret的 train 函数将执行并行化,例如,在k-fold CV中为每次迭代运行一个进程 . 这种理解是否正确,如果是,是否更好: 注册核心数(例如,使用 doMC 包和 regi...
  • 2 votes
     answers
     views

    如何在python中执行xgboost的网格搜索?

    我有一些分类问题,我想使用xgboost . 我有以下内容: alg = xgb.XGBClassifier(objective='binary:logistic') 我正在测试它的日志丢失: cross_validation.cross_val_scoree(alg, train_cluster_x, train_cluster_y, cv=5, scoring='log_loss') 我试...
  • 0 votes
     answers
     views

    过度拟合总是一件坏事吗? [关闭]

    我正在参加几个机器学习比赛,因为我正在努力学习这个领域 . 对于回归问题,我使用 xgboost . 这是我使用的程序: 在特征工程之后,我像往常一样将数据分成2组,一组训练集和一组测试集 . 然后我将 xgboost 放在训练集上并在测试集上进行验证 . 以下是我得到的结果:(当我使用经过训练的算法预测提交目标时,我也会显示公共集结果,度量标准为mae) . Iteration traini...
  • 0 votes
     answers
     views

    spark-submit不会从http或hdfs获取jar

    在Mesos上使用Spark 2.0.1 . 尝试使用 sbt assembly 创建的一个超级jar和 --jars 选项中的其他jar文件提交spark作业 . 额外的jar不能直接放在工作节点上,所以我试图通过http或hdfs提供它 . 超级 jar 位于http . Problem: 永远不会获取额外的 jar 并使用相关的库 Exception in thread "main...
  • 1 votes
     answers
     views

    从插入10倍CV中提取训练和测试AUROC

    说我正在做如下分类: library(mlbench) data(Sonar) library(caret) set.seed(998) my_data <- Sonar fitControl <- trainControl( method = "cv", number = 10, classProbs = T, saveP...
  • 0 votes
     answers
     views

    Xgboost交叉验证模型访问

    有什么方法可以直接从 xgboost.cv 访问训练有素的 xgboost 模型吗?或者我是否需要手动循环折叠并在这种情况下执行拟合? xgb.cv(param, dtrain, num_round, nfold = 5, seed = 0, obj = logregobj, feval=evalerror)
  • 7 votes
     answers
     views

    GridSearchCV - XGBoost - 提前停止

    我试图在XGBoost上使用scikit-learn的GridSearchCV进行超级计量搜索 . 在网格搜索期间,我希望它能够提前停止,因为它可以大大减少搜索时间,并且(期望)在我的预测/回归任务上有更好的结果 . 我通过其Scikit-Learn API使用XGBoost . model = xgb.XGBRegressor() GridSearchCV(model, paramGri...
  • 3 votes
     answers
     views

    xgboost的最终模型是什么?

    我有三个关于XGBoost的问题 . XGBoost的最终型号是什么?也就是说,当我想做出预测时,最终的预测是所有树的平均值吗? 在R中,如何检查每棵树的预测? 在R中,如何解释助推器是gbtree和目标是reg:linear?这是否意味着使用基于树的模型,对于叶子,它是线性回归模型(而不是平均值)?如果是,每片叶子使用了哪些功能? 谢谢!
  • 1 votes
     answers
     views

    Xgboost时间序列模型不捕捉趋势

    我正在 Build 一个流失预测模型,使用的功能包括1年 Value 滞后,假期,移动平均线,日/天比率,从statsmodels中提取的季节性因素等 . 显然不是一个附加系列,每年假期流失的幅度更大比往年更多 . 我的XGB模型可以非常准确地预测每日流失,但它在假日时会失败(与峰值相比,预测的沟壑稍微好一些): 在我看来,该模型无法捕捉该系列的指数性质 . 这是目前的样子 . 有没有办法通过使用...
  • 2 votes
     answers
     views

    XGBoost最佳迭代

    我使用XGBoost算法运行回归, clf = XGBRegressor(eval_set = [(X_train, y_train), (X_val, y_val)], early_stopping_rounds = 10, n_estimators = 10, ...
  • 0 votes
     answers
     views

    安装后无法在PyCharm(Jupyter)中导入Xgboost包

    我使用Pycharm(2017.3.5)作为我的Python(3.6)IDE,我集成了Jupyter笔记本进行开发 . 直到现在,我没有安装新软件包的问题,我使用Pycharm做了 . 今天我正在努力学习名为xgboost的机器学习库 . 首先,安装错误是我需要更新pip . 我从版本9.7到10.1做了它 . 然后安装成功如下: 即使在“包安装成功”之后,它也没有在包列表中列出(我也尝试...
  • 1 votes
     answers
     views

    不同的roc_auc与XGBoost gridsearch评分= 'roc_auc'和roc_auc_score?

    我使用GridSearch进行分类问题: # A parameter grid for XGBoost params = { 'min_child_weight': [1, 5, 10], 'gamma': [0.5, 1, 1.5, 2, 5], 'subsample': [0.6, 0.8, 1.0], 'colsample_by...
  • 7 votes
     answers
     views

    Jupyter笔记本xgboost导入

    我有下面的问题(我在MAC上) 我可以用我的终端从python2.7或python3.6导入xgboost,但问题是我无法在我的Jupyter笔记本上导入它 . import xgboost as xgb ModuleNotFoundError Traceback(最近一次调用last)in()----> 1将xgboost导入为xgb ModuleNotFoundError:没有名为'x...
  • 1 votes
     answers
     views

    Xgboost在pycharm上工作,但在Jupyter NoteBook中没有

    我已经使用Pycharm Python在Windows中成功安装了Xgboost,它正在运行 . 但是,在Jupyter NoteBook中,它不起作用 . import xgboost as xgb ---> 12 import xgboost as xgb ModuleNotFoundError: No module named 'xgboost' 在Jupyter中,xgbo...
  • 1 votes
     answers
     views

    xgboost安装在tensorflow GPU支持上

    我已经安装了tensorflow GPU支持 . 尝试在tensorflow上安装xgboost 'conda install -c anaconda py-xgboost' 我想知道xgboost是不是支持GPU . 我没有安装https://xgboost.readthedocs.io/en/latest/build.html#building-with-gpu-support 只有tens...
  • 2 votes
     answers
     views

    CMake v3.4.1在Ubuntu 16.04上找到了CUDA 7.5而不是CUDA 8.0

    我正在尝试为XGBoost安装GPU支持但是当我尝试使用CMake构建它时出现以下错误: CMake Error at /usr/local/share/cmake-3.4/Modules/FindPackageHandleStandardArgs.cmake:148 (message): Could NOT find CUDA: Found unsuitable version "7....
  • 0 votes
     answers
     views

    在spark scala中保存Xgboost模型的问题

    我在火花scala中训练了一个xgboost模型,如下所示: val xgbParamGrid = new ParamGridBuilder() .addGrid(xgb.maxDepth, Array(5, 10)) .addGrid(xgb.maxBins, Array(2)) .addGrid(xgb.minChildWeight, Array(0.2)) .addGrid(...
  • 0 votes
     answers
     views

    中断Jupyter Notebook Kernel Corrupt Packages?

    我用xgboost运行RandomizedSearchCV并需要中断内核 . 在jupyter笔记本中断内核是行不通的,所以我回到了anaconda提示符,它产生了jupyter笔记本,让Cltr C停止内核 . 然后我重新运行导入单元格(有numpy,scipy等),并得到一堆关于numpy和scipy的导入错误 . 对于numpy: cannot import name 'add_newdoc...

热门问题