-
2 votesanswersviews
在机器学习中标记数据集
我对机器学习的一些基本概念有疑问 . 我观察到的例子给出了一个简要的概述 . 为了训练系统,给出了特征向量作为输入 . 在监督学习的情况下,标记数据集 . 我对标签感到困惑 . 例如,如果我必须区分两种类型的图片,我将提供一个特征向量,在输出端进行测试,我将为类型A提供1,为类型B提供2.但是如果我想提取一个感兴趣的区域来自图像数据集 . 如何使用SVM标记我的数据以提取ROI . 我希望我能够表... -
-2 votesanswersviews
从逻辑回归模型中去除无关紧要的变量以预测类
我最近通过一门课程收到了一份作业,我被要求构建一个预测 class 成员资格的逻辑回归模型 . 我已经交了一套训练集和测试集,其中包含响应变量和编码为虚拟变量的变量 . 当我运行GLM时,我的一些解释变量是微不足道的 . 我应该删除这些吗?如果我不删除无关紧要的变量并在测试数据上运行模型,我得到的准确度为0.96,logLik为-155,而删除了无关紧要变量的模型的准确度只有.072的准确度,但是... -
13 votesanswersviews
神经网络时间序列预测(N点前瞻预测)大规模迭代训练
(N = 90)使用神经网络进行预测: 我想提前3分钟预测,即提前180分 . 因为我将时间序列数据压缩为将每2个点的平均值作为一个,我必须预测(N = 90)步进预测 . 我的时间序列数据以秒为单位给出 . 值在30-90之间 . 它们通常从30移动到90和90到30,如下例所示 . 我的数据可以来自:https://www.dropbox.com/s/uq4uix8067ti4i3/17Ho... -
2 votesanswersviews
使用自定义分类器与GridSearchCV和OneVsRestClassifier进行多标签分类
我正在尝试使用OneVsRestClassifier对一组注释进行多标记分类 . 我的目标是将每个评论标记为可能的主题列表 . 我的自定义分类器在csv中使用手动策划的单词列表及其对应的标记来标记每个注释 . 我试图使用VotingClassifier将Bag of Words技术和我的自定义分类器获得的结果结合起来 . 这是我现有代码的一部分: import numpy as np from ... -
8 votesanswersviews
编码风格的监督学习 - 特征选择(Scikit Learn)
我正在研究是否可以根据编码风格自动计算学生代码的得分 . 这包括避免重复代码,注释掉代码,变量命名错误等等 . 我们正在尝试根据过去学期的作文分数(从1-3开始)学习,这很好地导致了有监督的学习 . 基本思想是我们从学生的提交中提取特征,并创建feature_vector,然后使用scikit-learn通过逻辑回归运行它 . 我们还尝试了各种各样的事情,包括在特征向量上运行PCA以减少维数 . ... -
0 votesanswersviews
随机森林中子空间采样的重要性是什么?
如果我们不在随机森林算法中使用子空间采样(随机特征选择)会发生什么?我们的模型是否会像单个决策树一样执行? 如何在森林的每棵树中完成子空间采样? 子空间采样如何帮助改进模型? -
0 votesanswersviews
在R中训练隐马尔可夫模型
是否有可能在R中训练隐马尔可夫模型?我有一组带有相应标签的观察结果 . 我需要训练HMM以获得马尔可夫参数(即转移概率矩阵,发射概率矩阵和初始分布) . 所以,我可以预测未来的观察结果 . 换句话说,我需要与Forward_Backward算法相反的... -
2 votesanswersviews
随机梯度下降未能在我的神经网络实现中收敛
我一直在尝试使用具有平方误差的随机梯度下降作为成本函数来使用能够表示该训练数据的前馈反向传播算法来构建神经网络: Input Output {{0,1} , {1,0,0,0,0,0,0,0}} {{0.1,1}, {0,1,0,0,0,0,0,0}} {{0.2,1}, {0,0,1,0,... -
1 votesanswersviews
使用Autoencoder中的权重来初始化张量流中的神经网络
我使用Python和Tensorflow构建了一个Autoencoder . 为了构建Autoencoder,我使用了Tensorflow教程,介绍如何构建一个Autoencoder来读取手写数字上的MNIST数据集 . 我用它来找到CGRA成分的特征 . 到目前为止,我重新构建了Autoencoder的代码,我可以在自己的数据上使用它 . 我找到了功能,并且已经设法重建输入,直到某个错误 . 现... -
1 votesanswersviews
Keras:为什么我的测试精度不稳定?
我设计并训练了一个用于图像识别的Inception-ResNet模型 . 网络从训练数据集中学到了很多东西 . 但是,测试精度非常不稳定 . 以下是我用于学习过程的一些参数和重要信息: 训练样本数量: 40,000 图像 . 测试样本数: 15,000 images . 第一个 50 纪元的学习率设定为 0.001 ,下一个 50 纪元设定为 0.0001 ,其余为 0.00001 ... -
30 votesanswersviews
用于音频的卷积神经网络(CNN)
我一直在关注DeepLearning.net上的教程,以学习如何实现从图像中提取特征的卷积神经网络 . 本教程有很好的解释,易于理解和遵循 . 我想扩展相同的CNN,同时从视频(图像音频)中提取多模态特征 . 我知道视频输入只不过是与音频相关的一段时间(例如30 FPS)中显示的一系列图像(像素强度) . 但是,我真的不明白音频是什么,它是如何工作的,或者它是如何被分解为馈入网络的 . 我已经阅读... -
4 votesanswersviews
神经网络学习快,误报
我_1127812_m使用反向传播作为学习方法 . 我一直在使用http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html作为指导 . 然而,在第一个纪元之后,我的错误是0.在使用网络实现我的真实目的之前,我尝试过简单的网络结构: 4个二进制输入,1,1,0,0 . 2个隐藏层,每个4个神经元 . 1输出神经元,1.0应=有效输... -
0 votesanswersviews
如何进行机器学习编程竞赛
许多机器学习比赛在Kaggle举行,其中给出训练集和一组特征和测试集,其输出标签将通过利用训练集来决定 . 很明显,这里有监督学习算法,如决策树,SVM等 . 我的问题是,我应该如何开始解决这些问题,我的意思是从决策树或SVM或其他算法开始,还是有其他方法,即我将如何决定? -
0 votesanswersviews
我们可以通过HMM进行有监督的学习吗?
我相信我理解HMM的核心 . 通过HMM,我们解决了评估(发射的seq的概率),解码(最可能隐藏的seq)和学习问题(从观察到的发射序列seq中学习转换和发射概率矩阵) . 我的问题与学习问题有关 . 我有发射序列但是我也有每个序列的相关特征(意味着隐藏状态值,但隐藏状态的数量是未知的) . 在HMM的学习问题中,我们估计隐藏序列(大小和概率矩阵),并且为此我们只需要发射序列(如果事先不知道则可以...