-
1 votesanswersviews
决策树的特征重要性提取(scikit-learn)
我建模了 . 我有兴趣发现在节点处选择的每个特征的权重以及术语本身 . 我的数据是一堆文件 . 这是我的决策树代码,我修改了scikit的代码片段 - 学习提取(http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html): from sklearn.feature_extraction.te... -
1 votesanswersviews
神经网络能否学习功能?以及如何为模式识别选择更好的特征描述符?
我正在开发webots,这是一个用于建模,编程和模拟移动机器人的环境 . 基本上我有一个带VGA摄像头的小型机器人,它在小乐高迷宫的白色墙壁上寻找简单的蓝色图案并相应地移动 我在这里使用的方法是 从网站获取图案的图像并将其保存在PC中的某个位置 . 检测蓝色图案,形成一个包围图案的正方形,图案的至少2个边缘是正方形边界的一部分 . 将其大小调整为7x7矩阵(使用最近邻插值算法) 网... -
0 votesanswersviews
使用张量流选择特征
我使用的是python 3.5,张量为0.11 . 我有一个具有大量特征(> 5000)和相对较少的样本(<200)的数据集 . 我正在使用包装器skflow函数DNNClassifier进行深度学习 . 它似乎适用于分类任务,但我想从大量功能中找到一些重要的功能 . 在内部,DNNClassifier似乎执行特征选择(或特征提取) . 有没有办法用张量流进行特征选择? 或者,是否有一... -
4 votesanswersviews
低分辨率图像的特征检测器和描述符
我正在使用低分辨率(VGA)和jpg压缩的图像序列,以便在移动机器人上进行可视化导航 . 目前我正在使用SURF来检测关键点并从图像中提取描述符,并使用FLANN来跟踪它们 . 我在每张图像上获得4000-5000个特征,并且在应用RANSAC(通常减少20%的匹配数量)之前,每对连续图像通常会产生350-450个匹配 我正在努力增加比赛的数量(和质量) . 我尝试过另外两个探测器:SIFT和OR... -
0 votesanswersviews
如何从小尺寸图像中提取更多关键点?
我试图从一些小尺寸图像(例如176 * 146像素)中获得尽可能多的关键点 . 但我必须说,我失败了 . 我的想法是计算每个关键点的描述符并将其存储到db / bag of word中,因此可以通过仅计算类似描述符的方式将类似的图像识别为已经存在于db中 . 我的问题是小分辨率图片 . 我已经尝试了openCV中几乎所有的功能提取器/描述符 . 筛选,冲浪,ORB,密集,AKAZE等 . 每种方法... -
0 votesanswersviews
问题:一系列功能训练SIFT或SURF用于使用OpenCV Python在Video中进行汽车检测
我试图通过SIFT或SURF转储汽车的关键点,并将这些关键点与视频相匹配,以便检测汽车 . 关键点使用起来比使用Haar Cascades更方便,因为我必须使用大量图像,例如5000来训练,这将需要大量的计算过程 . 来自SURF或SIFT的关键点是尺度不变的,这在每辆车中几乎是相同的 . 将关键点转储到txt文件的代码是: import cv2 import numpy as np import... -
0 votesanswersviews
在fastICA中提取特征(Matlab)
我是机器学习初学者,我非常感谢你的帮助 . 我正在尝试使用FastICA MATLAB工具箱,经过大量的谷歌搜索和阅读文档后,我变得越来越困惑 . 我正在使用Car Data Set并且我正在使用1000张100x40图像(500辆汽车,500辆非汽车) . 我正在使用fastica来寻找独立的组件(我将在稍后使用它们来构建汽车检测系统) . 我在我的火车数据集上运行以下代码: [icasig, ... -
1 votesanswersviews
计算此功能的优点以进行二进制分类
最终目标是创建一个 binary classifier ,它将为大约10%的实例输出"YES"(基于训练数据) . 分类器将使用 binary, continuous and maybe some categorical features . 目前我正在提取 a continuous feature 范围[0; 1]应该描述产品的真实名称与其在文本字段中的潜在提及之间的相似性... -
0 votesanswersviews
在Keras中使用数据增强进行特征提取
我有一个关于在Keras中使用数据增强进行特征提取的问题 . 我正在 Build 一个狗品种分类器 . 通过特征提取,我指的是通过在顶部添加密集层来扩展模型(conv_base,VGG16),并在输入数据上端到端地运行整个事物 . 这将允许我使用数据增强,因为每次输入图像都会在模型看到时通过卷积基础 . 训练集:6680张图片属于133个 class 验证集:属于133个类的835个图像 测试集:... -
2 votesanswersviews
如何根据开始和结束日期R将记录拆分为多个记录
我会尝试通过获取样本数据来解释我的问题 ID Region Start_Date End_Date 1 Reg1 27/1/2017 27/1/2017 2 Reg1 27/2/2017 05/3/2017 1 Reg1 24/3/2017 25/5/2017 ... -
1 votesanswersviews
AttributeError:类型对象'MinimalFeatureExtractionSettings'没有属性'n_processes'
我正在尝试使用tsfresh包和 extract_features() 函数提取功能 . tsfresh版本:0.4.0.post0.dev1 ng19fa136 但是,我收到以下错误: AttributeError:类型对象'MinimalFeatureExtractionSettings'没有属性'n_processes' 码: import numpy as np import pand... -
0 votesanswersviews
从Keras Autoencoder中的瓶颈层中提取特征
过去几周我一直在问你自动编码器的问题 . 今天的问题如下;如何从瓶颈层获取功能? 我推荐过这个网站 . https://github.com/keras-team/keras/issues/2495 我收到的错误信息在这里显示; UserWarning:更新您对Keras 2 API的 Model 调用: Model(inputs=[<tf.Tenso..., outputs=[<t... -
0 votesanswersviews
预先存在的图像特征提取器
我们想要构建一个图像分类器,它应该将图像分类为~15个类中的一个 . 我们确实有一个大型标记的训练语料库 . 因此,我们可以使用Caffe或其他深度学习库来训练深度神经网络 . 我们正在探索的另一个选择是查看是否有任何公开可用的预先存在的特征提取模型来从一般图像中提取特征(例如针对大型图像集训练的自动编码器) . 通过这样做,我们将能够减少维数,这将使我们能够使用更简单的分类模型和较少的训练数据进... -
1 votesanswersviews
在张量流中是否有使用LSTM RNN进行特征提取的参考文献?
目前我正在尝试使用预训练的LSTM RNN模型进行特征提取 . 我偶然发现了使用深度神经网络进行特征提取的以下参考 . 那是图像 . https://www.kernix.com/blog/image-classification-with-a-pre-trained-deep-neural-network_p11 以类似的方式我想使用LSTM RNN https://github.com/gu... -
1 votesanswersviews
如何使用Matlab中的颜色阈值应用程序屏蔽绿色像素?
我正在做植物病害检测和分类 . 首先,我做预处理步骤,然后进行图像分割 . 在分割中,我使用matlab中的颜色阈值应用程序在RGB图像中进行背景去除 . 然后,我将掩盖绿色像素, the pixels where the level of green is higher than red and blue are identified and removed by application of ... -
6 votesanswersviews
如何对URL进行分类?什么是网址功能?如何从URL中选择和提取功能
我刚刚开始研究分类问题 . 它是一个两类问题,My Trained模型(机器学习)必须决定/预测允许URL或阻止它 . 我的问题非常具体 . 如何对网址进行分类?我应该使用普通的文本分析方法吗? 什么是网址功能? 如何从URL中选择和提取功能? -
1 votesanswersviews
使用FeatureUnion()进行分类(不同类型的特征)的单词和长度
我正在尝试进行二进制分类任务,主要是将注释分为两类 . 我已经实现了一个单词分类appraoch . 我从带有'text'列的pandas DataFrame开始,列中列出了所有注释和带有0或1的'label'列 . 将数据拆分为train / test后,X_train数据只是一个pandas系列对象行中的文字 . 我构建了下面的管道,根据词袋方法对数据进行分类 . (当然需要运行代码所需的导... -
2 votesanswersviews
从Python featuretools中排除特征工程的当前行
我正在使用 featuretools 为当前行生成历史功能 . 例如,在会话期间的最后一小时内进行的事务数 . 包 featuretools 包含参数 cutoff_time 以排除 cutoff_time 之后的所有行 . 我将 cutoff_time 设置为 time_index value - 1 second ,因此我希望这些功能基于历史数据减去当前行 . 这允许包含历史行的响应变量 . ... -
0 votesanswersviews
Featuretools处理多个连接键
如何在featuretools中表示多个连接键的一对多关系?是否有一些集成方法 - 或者手动将连接键连接到一个列中? -
1 votesanswersviews
获取HOG特征向量的大小 - MATLAB
我是图像处理的初学者,我正在使用MATLAB从图像中提取HOG特征来训练SVM分类器 . 训练图像的大小为480 * 640像素,我使用内置MATLAB extractHOGFeatures功能的默认设置获得167796个功能 . 但是,当我测试模型时,它给我的功能较少(仅216个功能!),因为他们知道测试图像具有相同的训练图像大小 . 我在MATLAB中遇到这个错误“TEST和训练数据中的列数必... -
2 votesanswersviews
在运行时将连接功能连接到输入层的字嵌入
假设我在嵌入查找后得到一个输入矩阵,如下所示: [[[868555],[ 0.8. 0.12, 0.63, 0.97 ],[28868557]],...,[[...]]] i . ,e,每个嵌入都是dim = 4,句子长度是3,如上述情况所示 . 我们如何使用Tensorflow / TFLearn或Theano中的占位符动态地(即在运行时)对应于句子中的每个单词添加dim的特征向量?所以 fin... -
0 votesanswersviews
opencv:如何使用轮廓中的无序点检测矩形
在OpenCV中,我们可以使用approxPolyDP来查找对象的轮廓 . 然而,当线之间存在孔/模糊时,有时输出轮廓可能会完全不同 . 例如,以下两个图形的实际对象是矩形,但是approxPolyDP的输出生成不按顺序的轮廓 . 是否有任何众所周知的算法可以处理以下几点并检测矩形?如果没有,处理这种情况的最佳方法是什么? -
1 votesanswersviews
根据featuretools中的截止时间创建要素
我使用featuretools,我需要创建一个使用截止时间进行计算的功能 . 我的实体集包含一个客户端表和一个订阅表(它有更多但是对于问题只有这些是必要的): import featuretools as ft import pandas as pd client_table = pd.DataFrame({'client_id': (1,2,3), ... -
30 votesanswersviews
用于音频的卷积神经网络(CNN)
我一直在关注DeepLearning.net上的教程,以学习如何实现从图像中提取特征的卷积神经网络 . 本教程有很好的解释,易于理解和遵循 . 我想扩展相同的CNN,同时从视频(图像音频)中提取多模态特征 . 我知道视频输入只不过是与音频相关的一段时间(例如30 FPS)中显示的一系列图像(像素强度) . 但是,我真的不明白音频是什么,它是如何工作的,或者它是如何被分解为馈入网络的 . 我已经阅读... -
2 votesanswersviews
使用Featuretools中的多个训练窗口计算相同的特征
Featuretools支持已经处理多个截止时间https://docs.featuretools.com/automated_feature_engineering/handling_time.html In [20]: temporal_cutoffs = ft.make_temporal_cutoffs(cutoffs['customer_id'], ....: ... -
1 votesanswersviews
基于keras预训练模型的预测/恐惧提取是否依赖于pre_processing_input
Keras应用程序具有已保存权重的预训练模型 . 这些权重与训练的图像上的"preprocessing_input"的性质无关 . 现在,当我根据我的后端和模式提交用于特征提取的图像集时,imagenet_utils将preprocessing_input并且处理的iamge数组将是 pixels scaled between -1 and 1 或 each color cha... -
2 votesanswersviews
如何从PCA实际减少特征尺寸? [重复]
这个问题在这里已有答案: Matlab - PCA analysis and reconstruction of multi dimensional data 2个答案 我正在尝试使用Matlab中的pca执行降维 . 从下面的代码中,我得到系数,得分,潜在和t平方 . 但是,如何从pc分析中减少实际尺寸仍然是模糊的 . 我想要做的是将列数(在本例中为3)减少到1或2.你能告诉我怎么做吗? m... -
-1 votesanswersviews
自动编码器中具有少量功能的隐藏节点数
我有一个数据集,它有2个功能和10000个样本 . 我想将这两个功能转换(集成)为一个功能,以便进一步分析 . 所以我想使用特征提取方法 . 由于两个特征之间的关系不是线性的,我想使用传统PCA以外的方法 . 由于样本的数量远远大于特征的数量,我认为自动编码器是一种很好的特征提取方法 . 但输入功能只有2,那么自动编码器的形状将只有2-1-2,这是一个线性提取 . 是否可以设置隐藏节点多于输入数量... -
0 votesanswersviews
从文件加载数据时opencv的descriptor_extractor_matcher的匹配结果不同
我在descriptor_extractor_matcher.cpp示例中使用以下代码来计算img1(Mat descriptors01)的描述符,将其写入我的磁盘并加载回来(Mat descriptors1) . (关键点的步骤相同,但代码相当......) Ptr<DescriptorExtractor> descriptorExtractor = DescriptorExtra... -
2 votesanswersviews
计算非关键点的SURF / SIFT描述符
实际上,我正在尝试将从图像中提取的关键点列表与从另一个图像提取的另一个关键点列表进行匹配 . 我尝试使用SURF / SIFT来检测关键点,但结果并不像从每个图像检测到的关键点的准确性那样预期 . 我想不使用关键点检测器,只使用连接区域的点,然后使用SIFT / SUFT计算这些点的描述符,但大多数时候调用计算方法将清空关键点列表 . 代码示例如下: int minHessian = 100; ...