首页 文章
  • 2 votes
     answers
     views

    线性回归精度为95%,但预测过去的数据

    拥有4行特征的熊猫数据框,我从“forecast_col”为它们创建标签,然后将它们移回过去以便稍后进行预测: pandasdf['label'] = pandasdf[forecast_col].shift(-forecast_out) 获取除“标签”列以外的所有行: X = np.array(pandasdf.drop(['label'], 1)) 规范化数据: X = preproces...
  • 0 votes
     answers
     views

    预测未用于估计R中的glm模型的分类值

    我估计了一个 glm 模型,现在希望根据新的数据集进行预测 . 但是,新数据具有一些不在原始数据集中的变量(分类变量) . 这给出了以下错误: Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) : factor Market has new levels TI 无...
  • 1 votes
     answers
     views

    如何在R中以不规则间隔的时间序列拟合自动ARIMA模型以预测未来值?

    我们有以下数据值和时间序列标记: Lines <- "date,time,data 20/03/2014,07:10,9996792524 21/04/2014,07:10,8479115468 21/09/2014,07:10,11394750532 16/10/2014,07:10,9594869828 18/11/2014,07:10,10850291677 08...
  • 0 votes
     answers
     views

    使用tbats将协变量添加到时间序列模型

    I want to predict the energy consumption every day +1. 例如:使用过去3个月的数据,我想预测第二天的能耗 . 因此,我使用的训练集范围从[今天 - 3个月:今天]到基本上是第二天的测试集 . 在我的数据集中,我每15分钟有一个消耗数据,以及诸如星 Cloud 和温度等气象数据 . 然后我设置季节性的参数: ## a data every 15...
  • 1 votes
     answers
     views

    使用HoltWinters预测每日数据

    首先,我已经咨询了这个article和this,但无法让它发挥作用 . 我的每日数据从 28-03-2015 开始直到 27-02-2017 . 我的 TS object 看起来像这样: bvg11_prod_ts <- ts(bvg11_data$MA_PROD, freq=365, start=c(2015, 87), end=c(2017, 58)) 下图显示了每日 Value :...
  • 0 votes
     answers
     views

    Holt-Winters时间序列预测与statsmodels

    我只是按照帖子here尝试使用下面的示例数据集进行我的第一次预测 . 我期待像Expected这样的预测图,但我得到的图形就像附在这里一样 . got this 我的示例代码是 import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.tsa.holtwinters import...
  • 1 votes
     answers
     views

    回归 - 样本外预测

    我试图找出如何处理我的预测问题,我不确定我的理解是否在这个领域是正确的,所以如果有人可以帮助我真的很好 . 首先,我的目标是用回归预测时间序列 . 我没有使用ARIMA模型或其他启发式模型,而是专注于机器学习技术,如随机森林回归,k-最近邻回归等回归 . 以下是数据集的概述: Timestamp UsageCPU UsageMemory Indicator Dela...
  • 0 votes
     answers
     views

    R中的格式用于生存分析的点预测

    我对使用R的 survival 包执行简单预测的格式感到困惑 library(survival) lung.surv <- survfit(Surv(time,status) ~ 1, data = lung) 所以拟合简单的指数回归(仅用于示例目的)是: lung.reg <- survreg(Surv(time,status) ~ 1, data = lung, dist=&qu...
  • 2 votes
     answers
     views

    绘制贝叶斯β回归模型的预测置信区间

    我有下面的示例数据和代码,非常感谢您帮助我们如何从贝叶斯β回归模型中绘制可靠的预测区间 . library(ggplot2) library(plotly) library(zoib) data("GasolineYield", package = "zoib") re.md <- zoib(yield ~ temp | 1 | 1, data=G...
  • 0 votes
     answers
     views

    随机森林 - 使用较少的估算器预测

    我使用scikit learn(python)训练了一个随机森林(在这种情况下为回归量)模型,我想根据所用估算器的数字在验证集上绘制错误率 . 换句话说,有一种方法可以预测只使用RandomForestRegressor中的一部分估算器吗? 使用predict(X)将根据每个树结果的平均值给出预测 . 有一种方法可以限制树木的使用吗?或者最终,为森林中的每棵树获取每个单独的输出?
  • 1 votes
     answers
     views

    Decission Tree方包预测错误 - 级别不匹配

    我正在使用party包在R中构建CART回归树模型,但是当我尝试将模型应用于测试数据集时,我收到错误消息,指出级别不匹配 . 过去一周我一直在阅读论坛上的主题,但仍无法找到解决问题的正确方法 . 所以我在这里使用我编写的假例子重新发布这个问题 . 有人可以帮助解释错误信息并提供解决方案吗? 我的训练数据集有大约1000条记录,测试数据集大约有150条 . 两个数据集中都没有NA或空白字段 . 在派...
  • 2 votes
     answers
     views

    使用交叉验证在“dismo”包中返回gbm.step函数的值

    我正在尝试使用dismo包中的gbm.step函数来使用交叉验证来适应gbm模型 . 根据dismo文档(https://cran.r-project.org/web/packages/dismo/dismo.pdf,第32页),gbm.step的返回值是一个gbm对象 . gbm对象具有"cv.fitted"值,该值指的是交叉验证预测值(https://cran.r-pro...
  • 2 votes
     answers
     views

    svm {e1071}预测会产生比预期更大的预测值数组

    我在R中使用支持向量机(SVM,包e1071)来构建分类模型和样本外预测7因子类 . 问题是,当使用预测函数时,我获得了一个比验证集中的行数大得多的数组 . 请参阅下面的代码和结果 . 关于出了什么问题的任何建议?我是否会错过 - 解释SVM包中的预测函数? install.packages("e1071","caret") library(e1071) l...
  • -1 votes
     answers
     views

    随机森林:用于识别特定正确预测记录的R代码

    使用简单的示例数据集“iris”,使用“trainData”训练随机森林模型,使用“testData”预测/分类物种 . # 1 - Create a Random Forest Model. iris.rf <- randomForest(Species ~ ., data=trainData) # 2 - Predict using Model and Test data set ...
  • 1 votes
     answers
     views

    R中线性回归的意外预测()结果

    我正在制作一个代码,根据历史数据预测每小时的自行车租赁率 . 数据具有许多属性(如下所示),为了适应模型,我使用了线性回归模型,然后我预测了结果,它向我显示了一些意外的结果,如负值和十进制数 . 这是我的火车对象的头部: > head(train) datetime season holiday workingday weather temp atemp humi...
  • 2 votes
     answers
     views

    Logistic回归的预测和置信区间

    下面是一组虚构的概率数据,我将其转换为带有 threshold of 0.5 的二项式 . 我在离散数据上运行了 glm() 模型来测试从glm()返回的间隔是'mean prediction intervals'("Confidence Interval")还是'point prediction intervals'("Prediction Interval&quo...
  • 4 votes
     answers
     views

    如何使用隐马尔可夫模型进行未来预测

    我有很多可变长度的序列 . 对于这些我想训练一个隐藏马尔可夫模型,我想稍后用它来预测(部分)序列的可能延续 . 到目前为止,我已经找到了两种使用HMM预测未来的方法: 1)幻觉延续并获得持续序列的可能性 . 选择具有最高可能性的那个作为您的预测 . 该方法需要明确知道持续的可能值 . 2)使用具有(部分)序列的维特比算法来获得最可能的隐藏状态序列 . 获取该序列中最后隐藏状态的发射分布并预测例如该...
  • 2 votes
     answers
     views

    为什么Pybrain总是预测相同的值?

    我正在尝试使用PyBrain进行预测,但是我的代码输出在测试集上给出了几乎总是相同的预测 . 谁能解释我为什么? 谢谢 ! ## ----------------------- Data ---------------------------- ## import pandas as pd bdata = pd.read_csv(r'C:\Users\philippe.colo\Projects...
  • 2 votes
     answers
     views

    基于小序列的跟随序列预测

    我是机器学习的新手,我有一个问题,我想用一些人工智能解决这个问题 . 如果您将向我推荐一些具体的算法,神经网络架构或一些相关的阅读,我将不胜感激 . 我正在研究如何基于鼠标移动来预测用户意图 . 目前我处于没有具体数据集的分析阶段 . 目标是通过预测鼠标轨迹来预测用户意图的目标(例如,用户将点击的按钮) . Let me introduce the problem 我有很多序列 . 每个序列的长度...
  • 3 votes
     answers
     views

    Keras总是预测相同的输出

    Keras将始终为我给出的每个输入预测同一个 class . 目前有四个 class . 新闻,天气,体育和经济 . 训练集由许多不同的文本组成,其中类与其主题相同 . 有更多的文本归类为新闻和体育,而不是天气和经济的文本 . 新闻:12112文本 天气:1685文本 体育:13669文 经济:1282文本 我原本预计该模型会偏向于体育和新闻,但它完全偏向于天气,每个输入都...
  • -1 votes
     answers
     views

    R:使用预测函数将标准误差和置信区间添加到预测中

    我做了这个模型: model <- lm(mpg ~ wt, mtcars) 我现在想要预测新数据,我可以用 effects 包来做 library(effects) effect_df <- as.data.frame(effect(c("wt"), model, list(wt = 1:5))) effect_df wt fit ...
  • 1 votes
     answers
     views

    如何使用具有嵌套效应的线性混合建模开发的模型来预测值?

    我有一个在R中使用5个变量开发的模型 . 选择线性混合建模方法来开发具有嵌套效应的模型 . 我的模型开发的R代码如下: model1 <- lmer(Reduction.factor ~ (1|PAI:Open.wind) + (1|PAI:Temp) + (1|PAI:Height)+ (1|PAI:Density)+ PAI , data = model) 4个参...
  • 0 votes
     answers
     views

    张量流服务预测为b64输出最高结果

    我有一个Keras模型我转换为tensorflow服务模型 . 我可以成功转换我的预训练keras模型以获取b64输入,预处理该输入,并将其提供给我的模型 . 我的问题是我不知道如何获取我得到的预测数据(这是巨大的)并且只导出最高结果 . 我正在做图像分割,所以我的输出预测是形状(?,473,473,3),我想获得最高结果并以b64编码格式返回 . 我目前只返回整个预测: sess = K.get...
  • 2 votes
     answers
     views

    tfidfvectorizer预测保存的分类器

    我使用TfIdfVectorizer和MultinomialNB训练了我的模型,并将其保存到pickle文件中 . 既然我正在尝试使用其他文件中的分类器来预测看不见的数据,我不能这样做,因为它告诉我分类器的特征数量与当前语料库的特征数量不同 . 这是我试图预测的代码 . 函数do_vectorize与训练中使用的完全相同 . def do_vectorize(data, stop_words=[]...
  • 2 votes
     answers
     views

    从具有随机截距的线性混合模型进行模拟

    我正在尝试扩展this question的答案:具体来说, how to build simulations for linear mixed effects models with a random intercept 'from scratch' (没有 simulate.merMod 或 arm ) . 我问,因为我有兴趣重新采样从拟合模型中获得的参数估计值来模拟 - 而不是预测 - 新值的...
  • 2 votes
     answers
     views

    在热图上绘制逻辑回归线

    我的数据是二元的,有两个线性自变量 . 对于两个预测因子,随着它们变大,有更多的积极响应 . 我将数据绘制在一个热图中,显示了沿两个变量的正响应密度 . 右上角有最积极的反应,左下角有负反应,沿两个轴可见渐变变化 . 我想在热图上绘制一条线,显示逻辑回归模型预测正负响应同样可能的位置 . (我的模型的形式是 response~predictor1*predictor2+(1|participan...
  • 2 votes
     answers
     views

    R中使用SVM的预测误差

    我在包“e1071”中使用了SVM功能, 第一个问题是当我尝试预测行数小于我训练的行数时,它会给我以下错误: td = wholeData[1:10000,] model <- svm(Type~.,data = td,type="C-classification") x =wholeData[1:5000,] p=predict(model,x) newdata中的...
  • 0 votes
     answers
     views

    “rpart”对象错误的预测无效

    我正在使用确切的代码进行此CRAN文档(https://cran.r-project.org/web/packages/FSelector/FSelector.pdf)第4页的最佳首次搜索,该文档使用了虹膜数据集 . 它在虹膜数据集上运行得很好,但不适用于我的ndata . 我的数据有37个预测变量(数字和分类),第38列是类预测 . 我收到错误: Error in predict.rpart(t...
  • 25 votes
     answers
     views

    条件错误 . 公式(公式):公式中的'.'并且没有'data'参数

    我想用神经网络进行预测 . 创建一些X: x <- cbind(seq(1, 50, 1), seq(51, 100, 1)) 创建Y: y <- x[,1]*x[,2] 给他们一个名字 colnames(x) <- c('x1', 'x2') names(y) <- 'y' 制作data.frame: dt <- data.frame(x, y) 而现在,我...
  • 2 votes
     answers
     views

    无法将学习模型应用于R中的测试数据

    我正在使用Kaggle的 Titanic 数据集,并希望学习一个简单的逻辑回归模型 . 我读了火车和测试数据, train$Survived , train$Sex , test$Survived 和 test$Sex 都是因素 . 我想进行一个非常简单的逻辑回归,Sex是唯一的自变量 . fit <- glm(formula = Survived ~ Sex, family = binom...

热门问题