-
0 votesanswersviews
过度拟合总是一件坏事吗? [关闭]
我正在参加几个机器学习比赛,因为我正在努力学习这个领域 . 对于回归问题,我使用 xgboost . 这是我使用的程序: 在特征工程之后,我像往常一样将数据分成2组,一组训练集和一组测试集 . 然后我将 xgboost 放在训练集上并在测试集上进行验证 . 以下是我得到的结果:(当我使用经过训练的算法预测提交目标时,我也会显示公共集结果,度量标准为mae) . Iteration traini... -
2 votesanswersviews
无法将学习模型应用于R中的测试数据
我正在使用Kaggle的 Titanic 数据集,并希望学习一个简单的逻辑回归模型 . 我读了火车和测试数据, train$Survived , train$Sex , test$Survived 和 test$Sex 都是因素 . 我想进行一个非常简单的逻辑回归,Sex是唯一的自变量 . fit <- glm(formula = Survived ~ Sex, family = binom... -
1 votesanswersviews
错误:Kaggle Notebook中设备上没有剩余空间
我正在尝试使用scikit-learn的cross_val_score来交叉验证我的模型 . 我尝试通过设置n_jobs = -1来使用多个核心,但结果是 OSError: [Errno 28] No space left on device 下面给出的代码导致错误: cross_val_score(mod1, train_feats1, target, cv=5, scoring=make_sc... -
0 votesanswersviews
在我的Kaggle的SVM脚本代码中,我的行不匹配
我正在审查我的 e1071 代码,用于进行Kaggle Titanic数据的SVM . 最后我知道,这一部分是有效的,但现在我得到了一个相当奇怪的错误 . 当我尝试构建我的data.frame所以我可以提交给kaggle时,似乎我的预测是我的训练集的大小而不是测试集 . Problem data.frame中的错误(PassengerId = test $ passengerid,Survive... -
0 votesanswersviews
如何进行机器学习编程竞赛
许多机器学习比赛在Kaggle举行,其中给出训练集和一组特征和测试集,其输出标签将通过利用训练集来决定 . 很明显,这里有监督学习算法,如决策树,SVM等 . 我的问题是,我应该如何开始解决这些问题,我的意思是从决策树或SVM或其他算法开始,还是有其他方法,即我将如何决定? -
-2 votesanswersviews
eval(expr,envir,enclos)出错:找不到对象'PAY_0.1'(Boosting)
我正在尝试应用一个提升模型,但我一直收到这个错误 . 任何帮助都将非常感激 . 如果您想知道,这是来自kaggle,UCI信用卡数据的数据集 . DataSplit<-createDataPartition(UCIdata$default.payment.next.month,p=.8,list=FALSE) boosttrain<-UCIdata[DataSplit,] boostt... -
0 votesanswersviews
来自NASA的众所周知的涡轮风扇发动机退化数据集(计算故障时间)
此数据集的链接: https://c3.nasa.gov/dashlink/resources/139/ https://data.nasa.gov/widgets/vrks-gjie 我正在试图弄清楚我是否需要计算此数据集中每一行的失败时间,因为我没有看到它提供,是这样的吗?如果确实需要为训练数据集计算,有一个简单的方法可以解决这个问题吗? 细节:(我假设从我读到的每行代表一个时间序列中特定时间...