首页 文章
  • 3 votes
     answers
     views

    R - 从插入符号和glmnet套索模型对象中提取因子预测符名称

    在下面的例子中,我设置了一个带有3个变量的df,预测,var1和var2(一个因子) . 当我在插入符或glmnet中运行模型时,该因子将转换为虚拟变量,例如var2b . 我想以编程方式提取变量名称并匹配原始变量名称,而不是虚拟变量名称 - 有没有办法做到这一点? 这只是一个例子,我的真实世界问题有许多不同级别的变量,因此,我想避免手动执行此操作,例如尝试子串出“b” . 谢谢! library...
  • 1 votes
     answers
     views

    glmnet beaviour与非独特的解决方案

    我正在使用R软件包glmnet来对二进制响应中的套索logit模型(alpha = 1)进行拟合,其中包含大约60,000个预测变量 . 通过http://www.stat.cmu.edu/~ryantibs/papers/lassounique.pdf中的结果,解决方案不应该是唯一的,但是,通过glmnet和cv.glmnet进行的估计都可以很好地结束,没有问题 . 所以我想知道glmnet如何...
  • 0 votes
     answers
     views

    glmnet lasso ROC排行榜

    我在 glmnet (实现套索回归)中使用了k-fold交叉验证,但我不能从中得到ROC图表 . library(glmnet) glm_net <- cv.glmnet(dev_x_matrix,dev_y_vector,family="binomial",type.measure="class") phat <- predict(glm_ne...
  • 0 votes
     answers
     views

    使用glmnet预测数据集中的连续变量

    我有这个数据集 . wbh 我想使用R软件包glmnet来确定哪些预测器可用于预测生育率 . 但是,我无法这样做,很可能是因为没有完全了解该包装 . 生育率变量是SP.DYN.TFRT.IN.我想看看数据集中的哪些预测因子为生育率提供了最具预测性的能力 . 我想使用LASSO或岭回归来缩小系数,我知道这个包可以做到 . 我只是在实施它时遇到了一些麻烦 . 我知道没有我为此道歉的代码片段,但我对如...
  • 0 votes
     answers
     views

    R:天真的套索回归

    我是套索回归的新手,我试图实现基于这个公式: 对于我在Elements of statistical learning book上读到的拦截,我只能使用y的平均值 . 为了计算beta,我使用了最小二乘法 . 然后我使用那些测试来估计beta套索 . 对于lambda,为简单起见,我只取了一个值(0.1) . 我不能真正做一个argmin,因为我只获得了一个beta套索值 . 在这种情况下我不明白...
  • 4 votes
     answers
     views

    使用Iris数据集重现LASSO / Logistic回归导致R与Python

    我试图在Python中重现以下R结果 . 在这种特殊情况下,R预测技能低于Python技能,但在我的经验中通常不是这种情况(因此想要在Python中重现结果的原因),所以请在此处忽略该细节 . 目的是预测花种('versicolor'0或'virginica'1) . 我们有100个标记样本,每个样本由4个花特征组成:萼片长度,萼片宽度,花瓣长度,花瓣宽度 . 我将数据分为训练(60%的数据)和测...
  • 2 votes
     answers
     views

    Scikit-learn的LassoCV评分指标

    我是'm using scikit-learn' s LassoCV功能 . 在交叉验证期间,默认使用scoring metric是什么? 我希望交叉验证基于"Mean squared error regression loss" . 可以将此指标与LassoCV一起使用吗?可以为LogisticRegressionCV指定评分指标,因此也可以使用LassoCV吗?

热门问题