-
0 votesanswersviews
SciPy稀疏矩阵中的测试数据预测误差
我将LIBSVM格式的数据输入到SciPy稀疏矩阵中 . 训练集是多标签和多级的,如我问的这个问题所述:Understanding format of data in scikit-learn from sklearn.datasets import load_svmlight_file X,Y = load_svmlight_file("train-subset100.csv.csv&... -
0 votesanswersviews
Tensorflow加权与S形交叉熵损失
我正在尝试使用TensorFlow实现多标签分类(即,每个输出模式可以具有许多活动单元) . 该问题具有不 balancer 的类(即,比标签分布中的零更多的零,这使得标签模式非常稀疏) . 解决问题的最佳方法应该是使用 tf.nn.weighted_cross_entropy_with_logits 函数 . 但是,我收到此运行时错误: ValueError: Tensor conversion... -
2 votesanswersviews
使用自定义分类器与GridSearchCV和OneVsRestClassifier进行多标签分类
我正在尝试使用OneVsRestClassifier对一组注释进行多标记分类 . 我的目标是将每个评论标记为可能的主题列表 . 我的自定义分类器在csv中使用手动策划的单词列表及其对应的标记来标记每个注释 . 我试图使用VotingClassifier将Bag of Words技术和我的自定义分类器获得的结果结合起来 . 这是我现有代码的一部分: import numpy as np from ... -
1 votesanswersviews
向Caffe提供长1D矢量数据,1D矢量标签
新手来这里 .我想在我自己的数据集上复制LeNet . 我的训练数据是一维数据,可以表示为1x3000向量 . 对于每个1x3000向量,我有一个标签,它是1x64维二进制向量的另一个1D向量 . 我有100万个这样的(数据,标签)数据 . 我很困惑如何将它喂给Caffe . 所有的例子都是维度 N x N 的图像 . 知道如何对这些数据进行处理以供给Caffe吗? 我正在考虑对向量进行零填充... -
0 votesanswersviews
测试张量流网络:in_top_k()替换多标签分类
我在tensorflow中创建了一个神经网络 . 这个网络是多标签的 . Ergo:它尝试为一个输入集预测多个输出标签,在本例中为三个 . 目前,我使用此代码来测试我的网络在预测三个标签时的准确度: _, indices_1 = tf.nn.top_k(prediction, 3) _, indices_2 = tf.nn.top_k(item_data, 3) correct = tf.equ... -
1 votesanswersviews
输出层用于多标签,多类别分类?
我正在寻找一种方法来实现输入的多个分类 . 指定了输出的数量,并且类集可能与输出相同或不同 . 该示例属于每个类集的一个类 . 我的问题是,目标数据和输出层应该是什么样的?可以使用哪些激活,丢失和训练功能,以及如何将图层连接到隐藏层?我不一定在寻找最佳解决方案,只需要一个工作解决方案 . 我目前关于什么可行的猜测是使目标数据成为多个连接的单热矢量,输出层具有与矢量数一样多的softmax单位 . ... -
0 votesanswersviews
如何使用张量流进行多标签分类以达到自动标记的目的?
我是tensorflow的新手,想知道是否有任何教程或带有多个网络输出的多标签分类示例 . 我问这个是因为我有一些文章,其中每篇文章都有几个标签 . -
2 votesanswersviews
多标签分类丢失功能
我在许多地方已经看到,对于使用神经网络的多标签分类,使用的一个有用的损失函数是每个输出节点的二进制交叉熵 . 在Tensorflow中,它看起来像这样: cost = tf.nn.sigmoid_cross_entropy_with_logits() 这为数组提供了与我们拥有的输出节点一样多的值 . My question is ,这个成本函数应该在输出节点数上取平均值吗?在Tensorflow... -
2 votesanswersviews
用于聚类任务的带有“加权标签”的多标签分类
这个问题是关于聚类任务的Multilabel多类分类 . Here是两个很好的定义,以确保没有人混淆两者: 多类分类是指具有两个以上类的分类任务;例如,对可以是橙子,苹果或梨的水果图像进行分类 . 多类分类假设每个样本被分配给一个且仅一个标签:水果可以是苹果或梨,但不能同时 . 多标签分类为每个样本分配一组目标标签 . 这可以被认为是预测不相互排斥的数据点的属性,例如与文档相关的主题 . 文本... -
0 votesanswersviews
使用Keras复制DeepCoder结果的问题
我试图重现DeepCoder项目发布的结果(参见https://arxiv.org/abs/1611.01989),特别是它的神经网络组件 . Brief Overview: DeepCoder的前馈神经网络模型是多标签多类分类器 - 给出黑盒函数的输入和输出列表 - 将预测函数向量 . 例如 . 假设函数集[ - * /]和输入 - 输出集[0,1,2,3] - > [1,2,3,4]... -
4 votesanswersviews
Keras中具有类权重的多标签分类
我一直坚持使用多标签分类(我必须说我对神经网络很新) . 首先,我将解释我正在努力训练的网络 . 我在网络中有1000个类,它们有多标签输出 . 对于每个训练示例,正输出的数量是相同的(即10),但是它们可以分配给1000个类中的任何一个 . 所以10个类有输出1而其余990有输出0.对于多标签分类,我使用'binary-cross entropy'作为成本函数,'sigmoid'作为激活函数 .... -
2 votesanswersviews
大型数据集的多标签分类方法
我意识到还有一个类似 Headers 的问题,但我的数据集非常不同 . 我有近4000万行和大约3千个标签 . 运行一个简单的sklearn train_test_split需要将近20分钟 . 我最初使用的是多类分类模型,这是我所有的经验,并且意识到由于我需要提供所有可能的标签,特定的记录可以绑定,我应该使用多标签分类方法 . 我正在寻找有效如何做到这一点的建议 . 我尝试了二元相关性,花了近4... -
0 votesanswersviews
多标签分类,包括作为标签的数字范围
我有一个分类问题,我的标签是等级,0 - 100,增量为1(例如1,2,3,4) . 我有一个数据集,其中每一行都有一个名称,文本语料库和一个评级(0 - 100) . 从文本语料库我试图提取我可以提供给我的分类器的功能,这将输出每行相应的评级(0 - 100) . 对于功能选择,我想从基本的单词包开始 . 然而,我的问题在于分类算法 . sci-kit中是否有分类算法学习支持这类问... -
3 votesanswersviews
R中的多标签分类
我有一个包含28个变量(13个标签和15个特征)的训练数据集 . 具有15个功能的测试数据集,我必须根据这些功能预测此测试数据集的标签 . 我为所有13个标签单独制作了KNN分类器 . 是否有可能将所有这13个单独的标签KNN分类器组合成一个单一的多标签分类器? 我目前的单一标签代码: library(class) train_from_train <- train[1:600,2:16] ... -
0 votesanswersviews
具有零个或多个标签的多标签文本分类
我需要将网站文本分为零个或多个类别/标签(5个标签,如金融,科技等) . 我的问题是处理不是这些标签之一的文本 . 我尝试了ML库(maxent,naive bayes),但它们与其中一个标签错误地匹配“其他”文本 . 如何训练模型来处理“其他”文本? “其他”标签如此广泛,不可能选择具有代表性的样本 . 由于我没有ML背景并且没有太多时间来构建一个好的训练集,我更喜欢一个更简单的方法,如术语频率... -
0 votesanswersviews
使用SVM对文本数据进行多标签分类
我有一个excel文件中的数据,我需要使用它来使用SVM执行多标签分类 . 它有两列,如下所示 . 'tweet' - A,B,C,D,E,F,G和'category'= X,Y,Z 推特类别 一个X. B Y. C Z. D X,Y E Y,Z F X,Y,Z G X,Z 给定推文,我想训练我的模型来预测它所属的类别 . 推文和类别都是文本 . 我正在尝试使用Weka的LibSVM分类器来进... -
2 votesanswersviews
nolearn用于多标签分类
我尝试使用从nolearn包导入的DBN函数,这是我的代码: from nolearn.dbn import DBN import numpy as np from sklearn import cross_validation fileName = 'data.csv' fileName_1 = 'label.csv' data = np.genfromtxt(fileName, dtype... -
1 votesanswersviews
Scikit-学习多标签分类
我想了解如何使用Scikit学习文本的多标签分类,我试图适应附带scikit为使用维基百科的文章作为训练数据语言的分类最初的例子教程之一 . 我试图在下面实现这个,但代码仍然为每个我希望最后一次预测返回fr,en的地方返回一个标签 任何人都可以建议正确的方法来启用多标签分类 . import sys from sklearn.feature_extraction.text import Tfid... -
3 votesanswersviews
使用Keras / Theano和LSTM进行多标签文本分类
尝试使用Keras / Theano运行LSTM多标签文本分类 . 我有一个文本/标签csv . 文本是纯文本,标签是数字,总共9个,从1到9 . 我想我没有为这个问题正确配置模型 . 我的代码到目前为止: import keras.preprocessing.text import numpy as np Using Theano backend. from keras.prepro... -
9 votesanswersviews
Keras class_weight在多标签二进制分类中
无法使用class_weight来解决我的多标签问题 . 也就是说,每个标签都是0或1,但每个输入样本有许多标签 . 代码(用于MWE目的的随机数据): import tensorflow as tf from keras.models import Sequential, Model from keras.layers import Input, Concatenate, LSTM, Dense... -
1 votesanswersviews
Keras多标签分类'to_categorical'错误
接收 IndexError:索引3超出了轴1的大小为3的范围 尝试在输出向量上使用Keras to_categorical创建单热编码时 . Y.shape = (178,1) . 请帮忙 (: import keras from keras.models import Sequential from keras.layers import Dense import numpy as n... -
2 votesanswersviews
使用Keras进行多输出分类
我正在使用keras构建一个多输出分类模型 . 我的数据集是这样的 [x1,x2,x3,x4,y1,y2,y3] x1,x2,x3是特征,y1,y2,y3是标签,y1,y2,y3是多类 . 我已经 Build 了一个模型(我进入了一些隐藏的层): def baseline_model(input_dim=23,output_dim=3): model_in = Input(shape=... -
19 votesanswersviews
带有多标签图像的咖啡
我有一个有多个标签的图像数据集;数据集中有100个类,每个图像都有1到5个与之关联的标签 . 我正在按照以下URL中的说明操作: https://github.com/BVLC/caffe/issues/550 它说我需要生成一个文本文件,列出图像及其标签,如 /home/my_test_dir/picture-foo.jpg 0/home/my_test_dir/picture-foo1.jp... -
0 votesanswersviews
单标签数据集的多标签文本分类
我有一个数据集,每个文档都有一个标签,如下例所示 . label text pay "i will pay now" finance "are you the finance guy?" law "lawyers and law" court ... -
0 votesanswersviews
Keras GridSearchCV使用精度以外的指标
Q1:为什么keras gridsearchCV不允许使用"Accuracy"以外的指标 . 就像我想用: categorical_accuracy 代替 accuracy . Q2:这个准确度如何适用于我现在提供的单热编码数据? model.compile(loss =“categorical_crossentropy”,optimizer =“adam”,metrics ... -
0 votesanswersviews
H2O算法是否支持多标签分类?
深度学习模型是否支持H2O中的多标签分类问题或任何其他算法? Orginal Response Variable -Tags: apps, email, mail finance,freelancers,contractors,zen99 genomes gogovan brazil,china,cloudflare hauling,service,moving ferguson,crowdfu... -
4 votesanswersviews
二进制Crossentropy惩罚单热矢量的所有分量
我知道二元交叉熵与两类的分类交叉熵相同 . 此外,我很清楚softmax是什么 .因此,我看到分类交叉熵只会惩罚应该为1的一个分量(概率) . 但是为什么,不能或不应该在单热矢量上使用二进制交叉熵? Normal Case for 1-Label-Multiclass-Mutual-exclusivity-classification: ################ pred ... -
1 votesanswersviews
转换预测目标
我有一个数据集,其中每个观察可能属于不同的标签(多标签分类) . 我对它进行了SVM分类及其工作 . (这里我有兴趣看到每个 class 的准确性,所以我在每个 class 应用了 OneVsRestClassifier ,你会在代码中看到 . ) 我想查看测试数据中每个项目的预测值 . 换句话说,我想看看模型在测试样本中每次观察预测了哪个标签 . For example: this is th... -
-1 votesanswersviews
在神经网络的实现中权重变为“NaN”
我正在尝试实现具有5个隐藏层的分类的神经网络,以及输出层中的softmax交叉熵 . 实现在JAVA中 . 为了优化,我使用了MiniBatch梯度下降(批量大小= 100,学习率= 0.01) 但是,经过几次迭代后,权重变为“NaN”,并且预测值对于每个测试用例都是相同的 . 无法调试此错误的来源 . 这是代码的github链接(带有测试/培训文件 . )https://github.com/a... -
1 votesanswersviews
R中的随机森林(多标签分类)
我对R很新,试图实现随机森林算法 . 我的培训和测试集有60种格式的功能: Train: feature1,feature2 .. feature60,Label Test: FileName,feature1,feature2 ... feature60 火车样本 mov-mov,or-or,push-push,or-mov,sub-sub,mov-or,sub-mov,xor-or,cal...