首页 文章
  • 0 votes
     answers
     views

    使用拦截模型进行逻辑分类

    我的儿子和我正在试图弄清楚如何进行后勤分类,但只包括一个拦截 . 我想出了以下内容,它使用x1到x4执行分类,然后仅使用拦截模型 . 代码运行并且看起来像我想要的那样 . 但他们是否采用更简约的方法来执行仅限拦截分类? import numpy as np import pandas as pd from sklearn import preprocessing from sklearn.line...
  • 0 votes
     answers
     views

    Keras中的不 balancer 数据分类

    我有一个由 A , B 和 D 类组成的数据集 . 有100个样本 A ,26个样本 B 和1个样本 D 出127.如果我忽略样本D,则ANN的精确度约为%95 . 但是,我想 Build 一个模型,可以正确分类样本D,并成功预测未来 D 样本 . 有什么建议吗?
  • 0 votes
     answers
     views

    Multinomial Naive Bayes分类器如何处理类别特征?

    我学会了如何使用MLE来获得朴素贝叶斯中类别特征的似然发生概率 . watermelon quality prediction example: color texture quality 1 green clear good 2 black clear good 3 white blur good 4 green blur bad 5 black blur bad ...
  • 0 votes
     answers
     views

    使用Cross_Val_score的原因

    我对使用cross_val_score的原因感到困惑 . 根据我的理解,cross_val_score告诉我的模型是'overfitting'还是'underfitting' . 而且,它不训练我的模型 . 因为我只有1个特征,所以它是tfidf(稀疏矩阵) . 如果它不合适,我不知道该怎么办 . Q1: Did I use it in wrong order? I've seen both 'c...
  • 9 votes
     answers
     views

    loss,val_loss,acc和val_acc在所有时期都不会更新

    我创建了一个用于序列分类(二进制)的LSTM网络,其中每个样本具有25个时间步长和4个特征 . 以下是我的keras网络拓扑: 上图中,Dense层之后的激活层使用softmax函数 . 我使用binary_crossentropy作为损失函数,使用Adam作为编译keras模型的优化器 . 使用batch_size = 256,shuffle = True和validation_split = ...
  • 344 votes
     answers
     views

    人工神经网络相对于支持向量机有什么优势? [关闭]

    ANN(人工神经网络)和SVM(支持向量机)是监督机器学习和分类的两种流行策略 . 通常不清楚哪种方法对特定项目更好,而且我确定答案总是“它取决于” . 通常,使用两者的组合以及贝叶斯分类 . 有关ANN和SVM的问题已经在Stackoverflow上提出过: ANN and SVM classification what the difference among ANN, SVM and KNN...
  • 3 votes
     answers
     views

    Keras分类模型

    我需要帮助来构建用于分类的keras模型 . 我有 输入:167个光谱点 输出11类被调查物质 . 但是在一个数据集中可能是具有多种物质的物质的幽灵(例如包含2,3,4类) . 我尝试使用 categorical_crossentropy ,但它仅适用于非交叉类 . KerasDoc: 注意:当使用categorical_crossentropy损失时,您的目标应该是分类格式(例如,如果您有10...
  • 0 votes
     answers
     views

    用caffe分类图像

    我正在尝试使用Caffe构建二进制分类器 . 首先,我通过稍微修改样式识别模型的微调来训练我自己的图像数据集 . 但是当我尝试对单个图像进行分类时,它给出了两个类的概率为50% . 为了分类,我使用了相同的deploy.prototxt,只是将output_number更改为2.这很奇怪,因为在训练时我得到准确度~85% . 我尝试了python(classify.py)和cpp(classifi...
  • 1 votes
     answers
     views

    Scikit train_test_split by a indice

    我有一个按日期索引的 pandas 数据框 . 让's assume it from Jan-1 to Jan-30. I want to split this dataset into X_train, X_test, y_train, y_test but I don' t想要混合日期,所以我希望火车和测试样本除以某个日期(或索引) . 我尝试着 X_train, X_test, y_trai...
  • 0 votes
     answers
     views

    如何修改Scikit-Learn中决策树算法中的分裂标准(gini / entropy)?

    我在二元分类问题上使用决策树算法,目标是最小化分类的误报(最大化 positive predicted value )(诊断工具的成本非常高) . 有没有办法在gini /熵分裂标准中引入 weight 来惩罚误报错误分类? Here例如,修改后的Gini索引如下: 因此,我想知道是否有任何方法可以在Scikit-learn中实现它? EDIT 使用 class_weight 产生了以下结果: ...
  • 0 votes
     answers
     views

    根据输出Tensorflow Pandas对输入进行分类

    这是我的计划: tf.reset_default_graph() X = tf.placeholder(tf.float32, [None, n_steps, n_inputs]) y = tf.placeholder(tf.float32, [None,n_outputs]) layers = [tf.contrib.rnn.LSTMCell(num_units=n_neurons, ...
  • -1 votes
     answers
     views

    查找数据库

    我想找到一个真正的数据分类用于分类,而不是模拟,其中具有线性内核的SVM具有差的精度(接近50%)并且具有多项式或径向(RBF)内核的SVM更好 . 我一直在寻找,但3种类型的内核具有相似的准确性 .
  • -2 votes
     answers
     views

    如何为SVM,sklearn,python选择合适的C.

    众所周知,C参数告诉SVM优化你想要避免错误分类每个训练样例的程度 . 对于较大的C值,如果超平面能更好地将所有训练点分类正确,则优化将选择边距较小的超平面 . 相反,非常小的C值将导致优化器寻找更大边距的分离超平面,即使该超平面错误分类更多的点 . 对于非常小的C值,您应该得到错误分类的示例,即使您的训练数据是线性可分的 . 因此,仍有一个问题仍然没有答案,或者至少是一个我无法找到答...
  • 17 votes
     answers
     views

    Keras分类 - 物体检测

    我正在使用Keras和Python进行分类然后对象检测 . 我已经对猫/狗进行了80%的准确度分类,我现在的结果还不错 . 我的问题是如何从输入图像中检测到猫或狗?我完全糊涂了 . 我想使用自己的高度,而不是来自互联网的预训练 . 这是我目前的代码: from keras.preprocessing.image import ImageDataGenerator from keras.models...
  • 5 votes
     answers
     views

    获取keras中所有已知类别的vgg-16的列表

    我使用Keras预训练的VGG-16型号 . 到目前为止我的工作源代码是这样的: from keras.applications.vgg16 import VGG16 from keras.preprocessing.image import load_img from keras.preprocessing.image import img_to_array from keras.applica...
  • 1 votes
     answers
     views

    用于性别分类的SVM:使用线性内核100%正确结果,但使用RBF的结果更差

    我根据 image of a face 为 gender classification 制作了一个小程序 . 我使用Yale face databse(男性为175张图像,女性为相同数字),将它们转换为灰度和均衡直方图,因此在预处理后图像如下所示: 我运行以下代码来测试结果(它使用SVM和 linear 内核): def run_gender_classifier(): Xm, Ym =...
  • 0 votes
     answers
     views

    内核函数的级联/线性组合

    我有一个关于机器学习和特别是内核函数的问题 . 假设我们有一个Kernel函数,比如K(x),还有另一个不同的函数,比如K'(x) . 我想知道K(K'(x))是一个内核函数吗?也就是说,如果将内核函数的输出提供给另一个内核,它意味着什么?它有意义吗? 另一个问题是关于众所周知的核的线性组合的预期行为,例如RBF,多项式和MLP . 假设MLP内核在分类任务中产生60%的准确度,而RBF产生85%...
  • 0 votes
     answers
     views

    SVM参数调整

    我是使用svm进行分类的新手 . 我想在EmguCV中通过 .TrainAuto 函数调整svm参数 . 但我不知道我应该给这个函数搜索的以下参数的范围(最小 - 最大值)是多少: 1- C(用于poly和RBF内核) 2-Gamma(用于poly和RBF内核) 3- Coeficient(用于多核) 4-度(对于多核) 这些参数的范围是多少? 这些范围取决于样本数量吗? 当我收到内存分配错误时,...
  • 6 votes
     answers
     views

    如何在分类中包含单词作为数字特征

    什么是使用单词本身作为任何机器学习算法中的功能的最佳方法? 我必须从特定段落中提取单词相关功能的问题 . 我应该使用字典中的索引作为数字特征吗?如果是这样,我将如何规范这些? 一般来说,单词本身如何在NLP中用作特征?
  • 1 votes
     answers
     views

    Keras密集网过度拟合

    我试图使用keras从加速度计信号构建活动分类器 . 然而,即使使用最简单的模型,我也会遇到极度过度拟合的数据 . 输入数据具有形状(10,3)并且包含来自加速度计的大约0.1秒的3维数据 . 模型很简单 model = Sequential() model.add(Flatten(input_shape=(10,3))) model.add(Dense(2, activation='softma...
  • 3 votes
     answers
     views

    Scikit-从分段时间序列中学习标记的数据集创建

    INTRO 我有一个Pandas DataFrame,代表不同用户的时间序列 segmented (即user1和user2) . 我想用提到的DataFrames训练一个scikit-learn分类器,但是我可以跳过分段的描述,因为它是由an algorithm提供的 . 我们举一个例子,其中user1和user2都有2个段: print df username voltage ...
  • 0 votes
     answers
     views

    如何使用随机森林的学习曲线

    我一直在浏览Andrew Ng的机器学习课程,刚刚完成学习曲线讲座 . 我为我创建的逻辑回归模型创建了一个学习曲线,看起来训练和CV得分收敛,这意味着我的模型可以从更多的功能中受益 . 我怎么能对像随机森林这样的东西进行类似的分析呢?当我为sklearn中的相同数据创建随机森林分类器的学习曲线时,我的训练分数非常接近1.我是否需要使用不同的方法来获得训练错误?
  • 0 votes
     answers
     views

    knn分类10折实施和分类

    我有一个mat文件的8个功能,每个这个功能分为4个部分(X_train,Y_train,X_test,Y_test)10次随机获得这个参数现在我应该根据KNN我的代码在这里分类这个功能 kk=7; bb=1; mdl1= ClassificationKNN.fit([X1_train{bb};X2_train{bb};X3_train{bb};X4_tra...
  • 1 votes
     answers
     views

    Tensorflow DNN多重分类

    我正在尝试使用Tensorflow在Python 3.5中创建一个DNN,用于将元组分类为 3 类之一 . # define initial hyperparameters batch_size = 100 train_steps = 5000 hidden_units=[10,20,10] # build model dnn = tf.contrib.learn.DNNClassifier(h...
  • 2 votes
     answers
     views

    调整参数SVM

    我想对图像中显示的数据进行分类: 为此,我尝试使用SVM: X = df[['score','word_lenght']].values Y = df['is_correct'].values clf = svm.SVC(kernel='linear', C = 1.0) clf.fit(X,Y) clf.coef_ clf = svm.SVC(kernel='linear') clf.fit...
  • 2 votes
     answers
     views

    如何根据分类树概率绘制ROC曲线

    我试图用分类树概率绘制ROC曲线 . 但是,当我绘制曲线时,它不存在 . 我试图绘制ROC曲线,然后从曲线下面的区域找到AUC值 . 有谁知道如何解决这一问题?谢谢你,如果可以的话 . 二进制列表Risk代表风险错误分类,我认为这是我的标签 . 我应该在我的代码中的不同点应用ROC曲线方程吗? 这是数据框: library(ROCR) data(Risk.table) pred =...
  • -1 votes
     answers
     views

    为什么我的精确回忆和ROC曲线不平滑?

    我有一些标记为0或1的数据,我试图使用随机森林预测这些类 . 每个实例都标有20个用于训练随机森林的特征(约30.000个训练实例和~6000个测试实例) . 我正在使用以下代码绘制精确调用和ROC曲线: precision, recall, _ = precision_recall_curve(y_test, y_pred) plt.step(recall, precision, color='...
  • 2 votes
     answers
     views

    使用Keras进行二进制分类:性能不佳

    我正在尝试使用Keras来开发用于二进制分类目的的多层感知器,我对我获得的(差)性能(训练集的准确率为57%)感到惊讶 . 逻辑回归正确地对100%的样本进行分类 . 我创建了一个带有2个输入的数据集:输入A是一个正弦函数 . 输入B =输入A加滞后 . 当输入A> =输入B时,输出= 1.否则,输出= 0 . SIN SIN-1 Direction 0 0 1 0.062790...
  • 3 votes
     answers
     views

    ValueError:检查目标时出错:期望dense_3具有形状(1,)但是得到了具有形状的数组(6,)

    我正在尝试使用以下ANN模型运行多类分类: classifier = Sequential() classifier.add(Dense(units = 9, kernel_initializer = 'uniform', activation = 'relu', input_dim = 18)) classifier.add(Dense(units = 9, kernel_initializer...
  • 69 votes
     answers
     views

    使用scikit-learn分类为多个类别

    我正在尝试使用scikit-learn的监督学习方法之一将文本片段分类为一个或多个类别 . 我尝试的所有算法的预测函数只返回一个匹配 . 例如,我有一段文字: "Theaters in New York compared to those in London" 我已经训练了算法为我提供的每个文本片段选择一个地方 . 在上面的例子中,我希望它返回 New York 和 Lond...

热门问题