首页 文章
  • 2 votes
     answers
     views

    如何从ZIP或ZINB模型中获取贝叶斯p值的新样本

    希望有人可以帮助我这个,因为我真的卡住了,没有找到我的编码错误! 我在JAGS中使用零膨胀泊松/负二项式GLM(没有随机效应)(使用R2Jags),并且参数估计,先验,初始值和链收敛都很好 . 所有结果都完全符合例如pscl-package的估计值,包括我在模型中计算的皮尔逊残差... 我唯一无法工作的是从模型中采样一个新样本以获得贝叶斯p值来评估模型拟合 . 我之前拟合的“正常”泊松和负二项模型...
  • 4 votes
     answers
     views

    使用PYMC3回归

    我在这里发布了一个IPython笔记本http://nbviewer.ipython.org/gist/dartdog/9008026 我通过标准Statsmodels OLS和PYMC3与Pandas提供的数据一起工作,顺便说一下,这部分工作得很好 . 我看不出如何从PYMC3中获得更多标准参数?这些示例似乎只是使用OLS来绘制基本回归线 . 看来PYMC3模型数据应该能够给出回归线的参数吗?除...
  • 0 votes
     answers
     views

    PyMC3中的加权回归

    我正在尝试找到适合二项式调查数据的函数的参数 . 每个数据点实际上是大小为n的样本 . 如果我使用具有贝叶斯预测的动态模型(如West&Harrison的贝叶斯预测和动态模型第14.4章),我可以使用β二项式共轭先验方案来解释不同的样本大小 . 但是,我还希望以包含 data.n 列的方式在PyMC3中执行此操作 . 我已将模型设置如下: import pymc3 as pm import pan...
  • 4 votes
     answers
     views

    从pymc3中的推断参数预测

    我试图从非贝叶斯背景中理解这一点 . 在线性回归或黑盒机器学习工具中,工作流程类似于以下内容 . 获取数据 准备数据 模型数据(从中学习[或部分,训练集]) 测试模型(通常在测试集上) 如果模型根据某个指标是好的,转到6,否则调查和修改工作 . 模型足够好;用它来预测/分类等 因此,假设我使用pymc3来了解广告支出与销售商品收入之间的关系 . 如果从1到5的所有阶段都...
  • 0 votes
     answers
     views

    在建模PyMC3中的序数预测变量时使用度量预测器

    我试图在PyMC3中实现Doing Bayesian Data Analysis(Kruschke)第23.4章的有序概率回归模型 . 采样后,截距和斜率的后验分布与本书的结果不具有可比性 . 我认为模型定义存在一些基本问题,但我没有看到它 . 数据:X是度量预测器(标准化为zX),Y是序数结果(1-7) . nYlevels3 = df3.Y.nunique() # Setting the t...
  • 0 votes
     answers
     views

    贝叶斯与OLS

    我在网上发现了这个问题 . 有人可以详细解释一下,为什么使用OLS更好?是不是因为样本数量不足?另外,为什么不使用所有1000个样本来估计先前的分布呢? 我们有1000个随机抽样的数据点 . 目标是尝试使用k个回归变量中的一个响应变量构建回归模型 . 哪个更好? 1.(贝叶斯回归)使用前500个样本来估计假设的先验分布的参数,然后使用最后500个样本来更新后验分布之前的后验估计,以用于最终回归模...
  • 2 votes
     answers
     views

    绘制贝叶斯β回归模型的预测置信区间

    我有下面的示例数据和代码,非常感谢您帮助我们如何从贝叶斯β回归模型中绘制可靠的预测区间 . library(ggplot2) library(plotly) library(zoib) data("GasolineYield", package = "zoib") re.md <- zoib(yield ~ temp | 1 | 1, data=G...
  • 6 votes
     answers
     views

    PyMC3中的链条是什么?

    我正在学习PyMC3进行贝叶斯建模 . 您可以使用以下命令创建模型和示例: import pandas as pd import pymc3 as pm # obs is a DataFrame with a single column, containing # the observed values for variable height obs = pd.DataFrame(...) #...
  • 1 votes
     answers
     views

    使用贝叶斯多元回归来预测5个变量

    我有一个数据集,有大约350个数据点,我试图使用两个预测变量来尝试预测5个百分比变量(5加起来为100) . 我正在寻找一种方法来做到这一点,大多数人都把我推向贝叶斯多元回归,但我想在深入研究之前得到更多的建议 . 你认为这是一个接近它的好方法吗?如果是这样在R中有办法做到这一点?我一直在寻找并且未能找到关于这个主题的很多内容 . 谢谢!
  • 4 votes
     answers
     views

    与pymc3和信念的线性回归

    我试图用 pymc3 掌握Bayesain统计数据 我运行此代码进行简单的线性回归 #Generating data y=a+bx import pymc3 import numpy as np N=1000 alpha,beta, sigma = 2.0, 0.5, 1.0 np.random.seed(47) X = np.linspace(0, 1, N) Y = alpha + beta*...
  • 2 votes
     answers
     views

    用RJAGS约束贝叶斯线性回归中的参数

    我正在使用RJAGS构建一个分层贝叶斯线性回归模型,我想约束三个参数值的总和,以正态分布1.3 . 那是: 该模型是: Y = B1 * X1 B2 * X2 B3 * X3 ... BN * XN 和, B1 B2 B3~dnorm(1.3,1 /(0.2)^ 2) 有可能吗?使用一行代码来分配上一行中的参数总和似乎不起作用 . 第二个最好的选择是完全约束参数(B1 B2 B3 = 1.3),但...
  • 26 votes
     answers
     views

    使用贝叶斯优化的深度学习结构的超参数优化

    我已经为原始信号分类任务构建了CLDNN(卷积,LSTM,深度神经网络)结构 . 每个训练时期运行大约90秒,超参数似乎很难优化 . 我一直在研究各种方法来优化超参数(例如随机或网格搜索),并发现贝叶斯优化 . 虽然我还没有完全理解优化算法,但我喜欢它会对我有很大帮助 . 我想问几个关于优化任务的问题 . 如何针对深层网络设置贝叶斯优化?(我们尝试优化的成本函数是多少?) 我想要优化的功能...
  • 1 votes
     answers
     views

    使用RandomizedSearchCV对XGBClassifier进行Python超参数优化

    我试图获得XGBClassifier的最佳超参数,这将导致获得最具预测性的属性 . 我试图使用RandomizedSearchCV迭代并通过KFold进行验证 . 当我运行此过程总共5次(numFolds = 5)时,我希望将最佳结果保存在名为collector(下面指定)的数据框中 . 所以每次迭代,我都希望得到最好的结果和得分以附加到收集器数据帧 . from scipy import sta...
  • 1 votes
     answers
     views

    基于贝叶斯后验优化的曲线拟合

    我试图使用Python PYMC3包在我的数据上创建后验预测分布,得到累积和条件概率作为最终结果 . 我正在研究3种预期寿命:12个月,24个月和36个月 . 个人预期寿命群体在其生命中发生死亡时具有不同的历史形态 . 例如,这是基于历史信息的24个月预期寿命模式: 所以我正在探索用于曲线拟合的贝叶斯方法,并且一直在尝试使用负二项分布来创建适合这些数据的曲线 . (我认为lognormal会更合...
  • 6 votes
     answers
     views

    张量流中'tf.contrib.rnn.DropoutWrapper'究竟是做什么的? (三个政治问题)

    据我所知,DropoutWrapper使用如下 __init__( cell, input_keep_prob=1.0, output_keep_prob=1.0, state_keep_prob=1.0, variational_recurrent=False, input_size=None, dtype=None, seed=None ) . cell = tf.nn.rnn_cell.L...
  • 59 votes
     answers
     views

    提高朴素贝叶斯分类器准确性的方法?

    我正在使用朴素贝叶斯分类器将数千个文档分类为30个不同的类别 . 我已经实现了朴素贝叶斯分类器,并且通过一些特征选择(主要是过滤无用的词),我获得了大约30%的测试精度,45%的训练准确度 . 这明显优于随机,但我希望它更好 . 我已经尝试用NB实现AdaBoost,但它似乎没有给出明显更好的结果(文献似乎对此有所分歧,有些论文称AdaBoost与NB没有给出更好的结果,其他人这样做) . 你知道...
  • 2 votes
     answers
     views

    使用贝叶斯算法计算前10个产品

    所以在我用c#编写的系统中,用户可以用0.5分的块来评价产品从1到5,所以基本上这些点是 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0 现在我想计算顶级产品,并且让我们说最小的投票数需要10票 . 我需要2个样品,其信息如下: product 1 { total rating: 360.5, number of votes: 2...
  • 4 votes
     answers
     views

    向贝叶斯排名系统添加额外因子(点击次数)

    我为业余音乐家经营一个音乐网站,我们有一个基于10分的评分系统,然后计算出100分的总分 . 我们有一个“可信度”分数系统,直接影响平均分数的用户在评级点,但下一步是实施一个有效使用这些数据的图表系统 . 我会尝试解释它是如何工作的,这样你就可以看到我拥有哪些数据 . 网站成员对1到10之间的曲目进行评级 . 该网站成员的得分为"credibility",这只是网站周围...
  • 8 votes
     answers
     views

    测量分类算法的性能

    我手上有一个分类问题,我想用机器学习算法解决这个问题(可能是贝叶斯或马尔可夫,问题与要使用的分类器无关) . 鉴于一些培训实例,我正在寻找一种方法来衡量已实施的分类器的性能,同时考虑数据过度拟合问题 . 那就是:给定N [1..100]训练样本,如果我在每个样本上运行训练算法,并使用这个相同的样本来测量适应度,它可能会陷入数据过度拟合问题 - 分类器会知道训练实例的确切答案,没有太多的预测能力,使...
  • 8 votes
     answers
     views

    基于其他用户喜欢的用于查找用户想要的内容的算法

    我正在考虑编写一个应用程序,根据家庭成员的喜好对HTPC中的电影进行分类 . 我不知道统计数据或人工智能,但东西here看起来很多汁 . 我不知道从哪里开始做 . 这就是我想要完成的事情: 撰写每个用户喜欢的一组样本,分别对每个样本属性进行评级 . 例如,也许用户喜欢西方电影很多,所以西方流派会为该用户带来更多的权重(等等其他属性,如演员,导演等) . 用户可以根据其他用户的喜好获得建议 ...
  • 1 votes
     answers
     views

    Pymc线性回归起始问题(缩放输入参数?)

    跟着this example使用PYMC3进行非常简单的贝叶斯线性回归(学习,我希望)我得到了最初的例子来运行但是然后尝试使用我自己的数据并得到: ValueError: Optimization error: max, logp or dlogp at max have non-finite values. Some values may be outside of distribution ...
  • 2 votes
     answers
     views

    用PyMC3预测贝叶斯线性回归中的新数据后验

    使用PyMC3执行贝叶斯线性回归 . 我构建了我的模型,我想使用相同的模型预测新X值的后验 . 我一直在尝试按照文档网站上的说明进行操作:https://pymc-devs.github.io/pymc3/notebooks/posterior_predictive.html(参见预测) . 这包括在分析之前使您的X值成为theano共享变量,然后在模型构建之后更改值,并运行 run_ppc() ...
  • 1 votes
     answers
     views

    贝叶斯线性回归如何对非随机化的交通强度数据集起作用?

    我试图在接下来的15分钟内预测每条车道的强度(这是我论文研究的一部分) . 我有一个数据集,其中包含过去3个月每15分钟每条泳道的强度 . 我在 Azure Machine Learning 中使用了6种不同的机器学习算法来检查哪一种算法最准确 . 我选择了贝叶斯线性回归来描述算法以及它逐步完成的工作 . 我仍然不清楚该算法是如何工作的,因为我不擅长详细的数学 . 这就是为什么我使用 Cloud ...
  • 2 votes
     answers
     views

    pymc 3.0预测后验分布

    我似乎想知道如何从预测后验分布中采样(或获得MAP) . 根据文档中的建议(7.3模型检查和对角线诊断:拟合优度),我可以使用pymc 2.3通过添加未观察到的随机数来从该分布中进行采样 . 这是link to the notebook . 一切似乎都运作良好 . 但是当我在pymc 3.0尝试这样做时,会发生两件奇怪的事情 . MAP值甚至没有接近,好像未观察到的随机性正在影响最小化,并且未...
  • 2 votes
     answers
     views

    Hadoop:在Apache Mahout中实现贝叶斯算法时出错

    我在Mahout中执行贝叶斯算法时遇到问题 . 我用Maven构建它,作业文件在目标目录中 . 当使用Hadoop从终端运行时,我收到ClassNotFoundException错误 . 应该做什么? $HADOOP_HOME/bin/hadoop jar mahout-core-0.3-SNAPSHOT.job org.apache.mahout.classifier.bayes.mapredu...
  • 0 votes
     answers
     views

    Scipy Stats rv_continuous没有标准化常数

    我想从一个我不知道正常化常数的分布中绘制随机偏差 . 该分布是具有未知形状和比例= 1的伽马似然的共轭先验 . pdf在维基百科上给出https://en.wikipedia.org/wiki/Conjugate_prior#Table_of_conjugate_distributions as 此pdf的积分没有封闭形式 . 在这里使用scipy.stats.rv_continuous选项吗...
  • 1 votes
     answers
     views

    是否可以用作者信息补充朴素贝叶斯文本分类算法?

    我正在进行一个文本分类项目,我正在尝试将主题分类分配给国会记录中的演讲 . 使用国会法案项目(http://congressionalbills.org/)中的主题代码,我've tagged speeches that mention a specific bill as belonging to the topic of the bill. I' m使用此作为模型的"training...
  • 1 votes
     answers
     views

    Naive Bayes Python 3:除以零错误

    需要一些关于python中朴素贝叶斯代码的建议 . 我一直用我的csv(NB.csv)命中“ZeroDivisionError:float division by zero”错误,但是另一个csv(data.csv)运行正常......我正在运行python 3.6(也试过2.7) . # Example of Naive Bayes implemented from Scratch in Pyt...
  • 5 votes
     answers
     views

    比较贝叶斯线性回归VS线性回归[关闭]

    最近我学习了贝叶斯线性回归模型,但我感到困惑的是,在哪种情况下我们应该使用线性回归,何时使用贝叶斯版本 . 这两个表现怎么样?并且贝叶斯逻辑回归和逻辑回归是一样的吗?我读了一篇关于使用贝叶斯概率回归来预测广告点击率的论文,我只是想知道为什么要使用贝叶斯版本?
  • 1 votes
     answers
     views

    PyMC的贝叶斯协方差预测

    我大致遵循本在线指南(link here)中提供的股票协方差示例,但我有一个更简单的示例模型 . 我以这样的方式构建它,我知道两个变量之间的协方差/相关性 . 我在下面发布了我的简短代码 . 基本上我正在做的是构建一个人工数据集,其中相关矩阵应该是[[1,-0.5],[ - 0.5,1]] . 在mcmc采样结束时,我得到了非对角线项的预测值,这个值非常不同 . 我看了收敛标准,看起来自相关性很...

热门问题