我最近通过一门课程收到了一份作业,我被要求构建一个预测 class 成员资格的逻辑回归模型 . 我已经交了一套训练集和测试集,其中包含响应变量和编码为虚拟变量的变量 . 当我运行GLM时,我的一些解释变量是微不足道的 .

我应该删除这些吗?如果我不删除无关紧要的变量并在测试数据上运行模型,我得到的准确度为0.96,logLik为-155,而删除了无关紧要变量的模型的准确度只有.072的准确度,但是logLik为-807 . 这是我用来获得准确性的示例代码:

pred1 <-ifelse(predict(model1,newdata=testcareval,type="response")>0.5,"unacc","acc")
classificationtablelog1 <- table(pred1,testcareval$Evaluation)
sum(diag(classificationtablelog1))/sum(classificationtablelog1)

最后,我被要求将这个逻辑回归模型与其他监督学习模型(SVM,KNN等)进行比较 . 在这些模型中,输出是通过包含TN,TP,FN,FP的分类表的准确性 .

我听到了不同的答案,所以我真的很感激任何帮助 .

提前致谢 .