-
2 votesanswersviews
QuantileRegression ValueError:操作数无法与形状一起广播
我试图在Python中使用分位数回归来预测我的目标变量 . 我正在考虑进行培训和验证的数据来自2015年10月 - 2017年12月31日 . 现在模型已经开发,我试图预测2018年1月的值,这会引发以下错误: ValueError:操作数无法与形状一起广播(34,)(33,) mod = smf.quantreg('ASBCU_SUM~Month+Year+WeekofMonth+DayN... -
1 votesanswersviews
确保statsmodels中的一致时间索引预测
我正在尝试将AR(1)模型拟合到Pandas时间序列并向前推进 . 数据是每年一次,每年从4月1日开始 . 当我使用 statsmodels.tsa.ar_model.AR.predict 从估计模型进行预测时,输出是一个熊猫时间序列,年度预测集中在12月31日 . 码: mod1 = sm.tsa.AR(ser['1972-01-04':'2007-01-04'], freq='A') res1... -
1 votesanswersviews
用于样本外预测的ARMA.predict不适用于浮点数?
在我开发了用于样本内分析的小型ARMAX预测模型之后,我想预测样本中的一些数据 . 我用于预测计算的时间序列从2013-01-01开始,到2013-12-31结束! 这是我正在使用的数据: hr = np.loadtxt("Data_2013_17.txt") index = date_range(start='2013-1-1', end='2013-12-31', freq... -
2 votesanswersviews
假设未知分布,从样本数据计算置信区间
我有样本数据,我想计算一个置信区间,假设分布不正常且未知 . 基本上,看起来分布是Pareto但我不确定 . 正态分布的答案: Compute a confidence interval from sample data Correct way to obtain confidence interval with scipy -
3 votesanswersviews
错误:安装python包时需要Microsoft Visual C 14.0
我正在尝试通过在命令提示符(admin)中运行此命令来下载包 statsmodels : pip3 install statsmodels 我收到这个错误 “错误:需要Microsoft Visual C 14.0 . 使用“Microsoft Visual C Build Tools”获取它:http://landinghub.visualstudio.com/visual-cpp-buil... -
1 votesanswersviews
限制scikit-learn或statsmodels中线性回归的调整参数的界限
是否可以限制scikit-learn或statsmodels中线性回归的调整参数的界限,例如:在statsmodels.regression.linear_model.OLS或sklearn.linear_model.LinearRegression? http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression... -
0 votesanswersviews
MANOVA使用统计模型
我'm looking for an example of a statsmodels MANOVA implementation. I can' t做Statsmodels website for MANOVA的正面或反面 . 我已经达到了: endog, exog = np.asarray(pre_post[feats_list]), np.asarray(pre_post[features]... -
0 votesanswersviews
根据另一个时间序列的季节性调整时间序列数据
因此,我将调用两个成本数据集:(1)成本(2)实现成本 (1)按日常频率和(2)按月计算 . 我想通过在一个月内取每日平均值将(2)投影到每日数字中,然后通过应用(1)中的季节性因子来基本调整(2) . 我有两年的两组数据,并希望从(1)中提取一周的趋势和一年中的一个月趋势,并将它们应用于(2)以进行调整 . 我不确定如何提取这些趋势 . 我尝试过为一周中的某一天和一年中创建指标变量(1,0),然... -
0 votesanswersviews
Statsmodels OLS回归:对数似然,使用和解释
我在statsmodels包中做了线性回归 . 在 R^2 , p 等的输出中,还有"log-likelihood" . 在文档中,这被描述为"The value of the likelihood function of the fitted model."我真的理解它正在做什么 . 阅读更多关于似然函数的内容,我仍然对这个“对数似然”值可能意味着或将被用... -
4 votesanswersviews
将ARMA模型拟合到python中按时间索引的时间序列
我试图将ARMA模型拟合到存储在pandas数据帧中的时间序列 . 数据框有一列值为numpy.float64的值,名为“val”,并且是pandas时间戳的索引 . 时间戳采用“年 - 月 - 日时:分:秒”格式 . 我理解以下代码: from statsmodels.tsa.arima_model import ARMA model = ARMA(df["val"], (1... -
1 votesanswersviews
来自Python数据帧的ANOVA和HSD测试
我正在寻找一种方法来从Python中的数据框执行ANOVA和HSD测试 . 我试着在论坛和教程上阅读一些例子,但我没有实现将它应用到我的工作中 . 这是一个简单的Pandas数据帧: Date Density Hour Repetition Glucose A HD AM 1 6.7 A HD AM 2 6.8 A ... -
2 votesanswersviews
Statsmodels Anova用于逻辑回归
我发现线性模型的anova测试的 statsmodels 实现非常有用(http://www.statsmodels.org/dev/generated/statsmodels.stats.anova.anova_lm.html#statsmodels.stats.anova.anova_lm),但我想知道,因为它不存在于库中,如何构建逻辑回归部分的等效版本 . 公式: from statsmod... -
0 votesanswersviews
使用statsmodels预测置信区间
我正在构建一个像这样的线性模型: import statsmodels.api as sm from statsmodels.stats.outliers_influence import summary_table import numpy as np import random x = np.arange(1,101, 1) y = random.sample(range(1,1000), ... -
4 votesanswersviews
使用PYMC3回归
我在这里发布了一个IPython笔记本http://nbviewer.ipython.org/gist/dartdog/9008026 我通过标准Statsmodels OLS和PYMC3与Pandas提供的数据一起工作,顺便说一下,这部分工作得很好 . 我看不出如何从PYMC3中获得更多标准参数?这些示例似乎只是使用OLS来绘制基本回归线 . 看来PYMC3模型数据应该能够给出回归线的参数吗?除... -
3 votesanswersviews
使用两个相邻的预测值和实际值列创建Pandas数据帧
我是初学者,我正在使用python中的statsmodel.formula.api.OLS()函数构建线性回归模型 . 我适合训练数据的模型,并在y_test(我的测试数据)上使用predict()函数来获得我的预测值 . 我将预测值存储在y_pred中 . import statsmodels.formula.api as sm result = sm.OLS(y_train, train_ne... -
1 votesanswersviews
如何使用statsmodels来拟合数据
我有一个数据集,我需要适应GEV发行版 . 数据是一维的,并存储在numpy数组中 . 目前,我正在使用 scipy.stats.genextreme.fit(data) ,它工作正常,但给出了完全不准确的结果(通过绘制pdf显而易见) . 经过一些调查后发现我的数据不适合日志空间,scipy在其MLE拟合算法中使用,因此我需要尝试像GMM这样的东西,而这只适用于statsmodels . 问题是... -
2 votesanswersviews
使用ols对非变量自变量进行回归
这是我的数据集: x y z 1 2 1 1 4 6 1 1 12 1 5 14 1 6 17 1 9 18 现在我想使用python中statsmodel库的ols函数对此进行回归 . 为此,我使用了: lm = smf.ols(formula ='z~x I(x y)',data = data).fit() 现在我将获得x,(x ... -
2 votesanswersviews
OLS回归python中的形状未对齐错误
我有一个 dataframe ,我试图运行 statsmodel.api OLS回归 . 它打印出摘要 . 但是当我使用 predict() 函数时,它给了我一个错误 - 形状(75,7)和(6,)未对齐:7(暗淡1)!= 6(暗淡0) 我的代码是: X = newdf.loc[:, newdf.columns != 'V-9'].values y = newdf.iloc[:,3].val... -
1 votesanswersviews
将本地数据集加载到Python 3.4时间序列的Pandas statsmodel中
我正在尝试使用Pandas n statsmodels在Python中实现时间序列预测 . 我想读取本地excel文件数据,然后将其分解为Trends和Seasonal组件,但我无法获得任何相关链接,显示如何从本地驱动器加载数据 . 我尝试使用以下代码: excel = pandas.ExcelFile( 'PET_PRI_SPT_S1_D.xls' ) df = excel.parse(... -
0 votesanswersviews
statsmodels - 鲁棒线性回归中的权重
我在查看statsmodels中的强大线性回归,但我找不到指定此回归“权重”的方法 . 例如,至少方形回归为每个观察分配权重 . 类似于WLS在statsmodels中的作用 . 或者有办法解决它吗? http://www.statsmodels.org/dev/rlm.html -
1 votesanswersviews
Statsmodels根据异方差一致的标准误差绘制平均置信区间
这个问题类似于confidence and prediction intervals with StatsModels,但有一个额外的细微差别: 我的数据是异方差的,我想使用statsmodels提供的任何一个异方差一致的标准误差(HC0_se,HC1_se等)来绘制均值上的置信区间 . 对于每个拟合值,我找不到任何容易访问此信息的方法(尽管获取每个系数的间隔非常容易) . 它似乎也没有像标准平均... -
0 votesanswersviews
覆盖要在sklearn上下文中使用的statsmodels GLM中的predict()
要在sklearn的上下文中使用statsmodel的Poisson GLM模型,我正在尝试 Build 一个自己的模型,它继承自GLM,BaseEstimator和RegressorMixin . 我的目标是做交叉验证之类的东西 . 这是我的代码: import statsmodels.api as sm from sklearn.base import BaseEstimator, Regre... -
0 votesanswersviews
如何从statsmodels MANOVA获得pvalue?
如何从这个获得MANOVA p值:https://www.statsmodels.org/stable/generated/statsmodels.multivariate.manova.MANOVA.html#statsmodels.multivariate.manova.MANOVA? -
0 votesanswersviews
Statsmodels MANOVA:IndexError:索引1超出轴0的大小为1的范围
我花了几个小时试图让statsmodels做我的MANOVA但没有成功 . 这是代码: from statsmodels.multivariate.manova import MANOVA df = data feats_list = ['col1', 'col2', 'col3' ... 'col4'] var_list = ['col5', 'col6'] endog, exog = np... -
6 votesanswersviews
Logistic回归statsmodels的概率预测置信区间
我正在尝试从“统计学习简介”重新创建一个情节,并且我试图重新创建该图的右侧面板(figure 7.1),该面板预测工资> 250的概率基于年龄为4的多项式相关的95%置信区间 . 如果有人关心,工资数据是here . 我可以使用以下代码预测并绘制预测概率 import pandas as pd import numpy as np import matplotlib.pyplot as pl... -
2 votesanswersviews
在Python statsmodels.tsa ARIMA中包含多个季节性术语
我试图使用python 2.7.11和优秀的statsmodels.tsa包在python中建模时间序列 . 我的数据包括几周内每小时交通强度的测量结果 . 因此,数据具有多个季节性成分,天数为24小时;周形成168小时 . 此时,statsmodels.tsa中的建模选项未设置为处理多个季节性,因为它们仅允许指定一个季节性因子 . 然而,我遇到了Rob Hyneman关于R的多个季节性的工作 ....