-
1 votesanswersviews
opencv人脸识别教程代码不能与opencv 3.0一起使用
我正在尝试使用教程中给出的代码,但它无法正常工作 . 我确信所有依赖项都在那里并且程序正在编译,但是它给了我一些与某些函数无法找到相关的错误 . 这是代码: #include "opencv2/core/core.hpp" #include "opencv2/highgui/highgui.hpp" #include "opencv2/face.h... -
3 votesanswersviews
用opencv过滤掉对象检测的误报
我使用opencv的HaarDetectObjects(...)来检测图像中的对象 . 该函数返回图像中可能包含对象的区域的坐标,问题是我只想检测图像中对象的单个实例,而我无法知道函数返回的结果是哪个“最好” . 有没有办法可以按实际包含对象的概率对结果进行排序?或者可能定义结果必须通过的某种阈值?基本上,我需要一种过滤误报的方法 . 我不限于使用opencv或HaarDetectObjects,... -
158 votesanswersviews
OpenCV C / Obj-C:检测一张纸/方形检测
我在我的测试应用程序中成功实现了OpenCV平方检测示例,但现在需要过滤输出,因为它非常混乱 - 或者我的代码是错误的? 我对本文的四个角点感兴趣(如that)和进一步处理...... Input & Output: Original image: click Code: double angle( cv::Point pt1, cv::Point pt2, cv::Point pt0 ... -
2 votesanswersviews
检测到大量的损坏金钱
我正在开发一个应用程序来检测"damage amount"的纸币 .该应用程序将评估用户的输入图像,并确认他们是否有权使用替换笔记 . 输出为: if 30% of lost of money object, can allow changing at the bank . 我有想法,我们用金钱相机捕捉和损坏背景是白色的,所以在AS3可以计算白色百分比的百分比 . 如果低于... -
3 votesanswersviews
Otsu方法(matlab中的graythresh函数)产生一个比例尺的结果? 0:255,0:max(px强度),min:max?
只是澄清一下关于Otsu阈值方法的观点,该方法缺乏文档和维基百科文章中的定义 . 如果应用Otsu方法(在matlab函数 graythresh 中),则返回0到1之间的阈值 . 给出2个假设的灰度图像: dark (像素强度范围为0到100)和 light (像素强度范围为155到255) 如果我分别为 dark 和 light 图像得到0.75的Otsu阈值,那么在每种情况下它会映... -
-2 votesanswersviews
训练准确性稳步提高,但训练损失减少然后增加
我训练了一个具有张量流(4301级)的人脸识别模型 . 培训过程如下(我已经 grab 了培训过程的图表):training accuracy training loss 训练精度稳步提高,然而,对于训练损失,它首先减少,然后经过一定次数的迭代后,它会奇怪地增加 . 我只是使用softmax loss和权重正则化器 . 我使用AdamOptimizer来减少损失 . 对于学习率设置,初始lr设置为... -
-2 votesanswersviews
为什么模型在第一个时期之后产生最佳性能,当我的训练损失减少并且验证集的准确性增加时?
我正在使用CNN(通过tensorflow)训练图像分类模型 . 我的数据集有600个样本,有90个类( balanced ),这是我的NN架构概述: conv(relu) --> conv(relu) --> dense(relu) --> dense(relu) --> dense(sigmoid) 培训: 我将数据集拆分为8:2的训练集和验证集,这是我的训练配置: ... -
0 votesanswersviews
在训练初始v2 w /亚当的同时突然和稳定地降低准确性
我正在tensorflow中的自定义二进制数据集上训练Inception V2 . 我使用的学习率为1e-4,辍学率为0.9,批量大小为32,亚当优化 . 虽然网络起初看起来做得很好,准确度提高,损失减少,但有时会达到精度突然下降且损失突然上升的程度 . 我应该注意到,数据集中的类是不 balancer 的,具有20%的正类和80%的负类拆分 . 您可以查看图表here . 为什么精确度突然下降然... -
0 votesanswersviews
如何使用SURF提取图像特定像素的特征?
SURF提取图像关键点的特征 . 我想提取图像特定像素的特征 . 我在MATLAB中编写了一个代码,但它显示了一些错误 . 代码如下: img = imread('cameraman.tif'); [row, col] = size(img); for i=1:row for j=1:col points = img(i,j); [features, po... -
0 votesanswersviews
tensorflow conv2d意外的卷积结果
我尝试将Caffe网络和模型(权重)迁移到tensorflow . 原始第一层定义如最后所示,这是在内容大小为5x5,输出通道96的 1x128x128 灰色图像上的步幅一卷积 . 我按照以下步骤将权重从 caffemodel 文件转换为 numpy array : net = caffe.Net(model, caffe.TEST); net.copy_from(weights); weight... -
2 votesanswersviews
以后CNN中的过滤器如何识别颜色?
假设输入是32x32 RGB图像(32x32x3) . 如果第一层conv网络上的5x5x3滤波器识别出绿色 - 红色渐变,则会在28x28特征图上记录它的激活值(给定1的步幅和0的填充) . 该特征图没有关于颜色的信息,因此当它被输入下一个转换层时, conv2 ,那么 conv2 将只学习灰度滤波器 . So, how can higher level filters, like these,... -
-1 votesanswersviews
从自然图像中检测文本
我在 tensorflow 中编写代码,使用 convolution neural network 来自图像中的文本 detect . 我使用TFRecords文件来读取街景文本数据集,然后,我将图像的大小调整为 128 的高度和宽度 . 我使用了9- conv layer 和 zero padding 以及三个 max_pool layer with window size of (2×2)... -
0 votesanswersviews
由于“亏损功能设计”或“训练循环中的错误”,我的模型难以学习吗?
我正在尝试 Build 一个基于哈希匹配的人体姿势估计的连体神经网络 . 我的previous post中描述了 basic concept and references 我修复了“没有为任何变量提供的渐变”错误,但发现无论训练时间多长,我模型的损失值都没有提高 . 我在第100次,第10000次和第500000次迭代中保存了检查点,并且恢复的模型具有相同的损失值 . 目前我认为这个问题可能有两个... -
126 votesanswersviews
如何训练人工神经网络使用视觉输入玩暗黑破坏神2?
我正在努力让人工神经网络玩电子游戏,我希望能从这里的精彩社区获得一些帮助 . 我已经确定了暗黑破坏神2 . 因此,游戏玩法是实时的,并且从等角度的角度来看,玩家控制着摄像机所在的单个化身 . 为了使事情具体化,任务是获得你的角色x经验值,而不将其生命值降为0,通过杀死怪物获得经验值 . 以下是游戏玩法的示例: 现在,由于我希望网络仅基于屏幕上的像素获取的信息进行操作,因此必须学习非常丰富的表示以... -
0 votesanswersviews
了解OpenCV Stereobm实现
我正在尝试理解CPU和GPU中的StereoBM实现 . 我从https://github.com/opencv/opencv/blob/master/modules/calib3d/src/stereobm.cpp开始使用CPU 我对立体声块匹配的工作原理有一些了解 . 我能够进入流程但是在遇到1204行时出现了一些打嗝,初始化了一个整数bufSize0,然后在即将到来的行中添加了更多的值 . ... -
1 votesanswersviews
Tensorflow:CNN训练收敛于零矢量
我试图在输入深度图像中构建一个检测手关节的深层网络,这似乎并不好用 . (我的数据集是ICVL手势数据集)The network structure is shown here. ①一批输入图像,240x320; ②具有5x5内核的8通道卷积层; ③最大汇集层,ksize = stride = 2; ④完全连接的图层,weight.shape = [38400,1024]; ⑤完全连接的图层,w... -
0 votesanswersviews
使用2D高斯蒙版屏蔽灰度图像失败
这似乎相当简单,但我没有得到理想的结果 . 有人可以向我解释原因吗?我有下面的代码生成一个2D高斯蒙版,其中心的均值和西格玛为32x32像素图像的图像高度的1/3,如下所示: def gauss2D(image): x,y = image.shape[:2] shape = (x,y) sigma = 1/3 * min(x,y) m,n = [(ss-1.)/2.... -
2 votesanswersviews
用于检测快速移动球的最佳OpenCV算法?
我是OpenCV的新手 . 我正在开展一个涉及跟踪和检测旋转轮盘球的项目 . 这是我想要使用的视频:https://www.youtube.com/watch?v=IzZNaVQ3FnA&list=LL_a67IPXKsmu48W4swCQpMQ&index=7&t=0s 我希望得到1次革命的球时间 . 但球速度很快,难以察觉 . 我不知道如何克服这一点 . 这样做的最佳算... -
2 votesanswersviews
为什么DQN会为所有观察结果给动作空间(2)中的所有动作赋予类似的值
我有一个学习的DQN算法(损失收敛到0)但不幸的是它学习了Q值函数,使得两个可能动作中的每一个的两个Q值非常相似 . 值得注意的是,Q值在每次观察时变化很小 . 细节: 该算法从OpenAI Gym中播放CartPole-v1,但使用屏幕像素作为观察而不是提供的4个值 我提供的奖励功能提供以下奖励:如果不是游戏结束则为0.1,如果游戏结束则为-1 衰减率(gamma)为0.95 e... -
2 votesanswersviews
保存图像期间,PIL中的“SystemError:tile无法扩展到图像外部”
我有这个Image => 这里是上面黄色框的所有坐标,用 3.txt 文件写成 . #Y X Height Width 46 135 158 118 46 281 163 104 67 494 188 83 70 372 194 101 94 591 207 98 252 132 238 123 267 278 189 105 320 741 69 141 ... -
2 votesanswersviews
OpenCV与Python错误 - 断言失败((mask.type()== CV_8UC1 || mask.type()== CV_8SC1))在binary_op中
我正在尝试在网络摄像头Feed上叠加图像 . 这是代码的主要部分 - # Load our overlay image: glasses.png imgGlasses = cv2.imread('1.png') # Create the mask for the glasses imgGlassesGray = cv2.cvtColor(imgGlasses, cv2.COLOR_BGR2GRA... -
2 votesanswersviews
Keras 2DConvolution产生非逻辑输出张量 - 32x32图像变为32xN特征映射,而不是32x32xN
根据我的理解,2D-Convolution将N个滤镜应用于输入图像,产生N个新的“图像”(=特征图) . 如果我们忽略步幅/子采样,在使用N个通道的2D卷积之后,32x32图像变为Nx32x32张量: 但是,在Keras中,32x32输入产生32xN输出 . 所以,我的问题是,如何应用降维?这一步是否涉及另一个隐藏层? 如果是这样,网络是否失去了查看图像的能力 - 即2D实体? 此代码可以重现我... -
0 votesanswersviews
使用vl_gmm时出错 - 尝试将脚本作为函数执行
您好我想使用Fisher Vector作为我的SIFT描述符 . 我试图使用VL_FEAT中的函数 . 我在MATLAB中添加了目录,并运行了vl_startup . 它运行成功但是当我尝试这个例子时 它给了我这个错误: Attempt to execute SCRIPT vl_gmm as a function: C:\vlfeat-0.9.19.tar\vlfeat-0.9.19\vlfeat... -
8 votesanswersviews
如何分割血管python opencv
我正在尝试使用Python和OpenCV对视网膜图像中的血管进行分割 . 这是原始图像: 理想情况下,我希望所有的血管都像这样(不同的图像)非常明显: 这是我到目前为止所尝试的 . 我拍了图像的绿色通道 . img = cv2.imread('images/HealthyEyeFundus.jpg') b,g,r = cv2.split(img) 然后我尝试按照this article创建一... -
7 votesanswersviews
色度键移除算法/库
我正在研究适用于Windows XP / 7的台式机录像机软件 . 我希望能够通过色度键控从录制的视频中删除背景 . Example http://www.kudlian.net/products/screen/images/0002-large.jpg 这些算法的任何信息,完整的库,开源项目?我需要它可以从c#访问,最好是在GPU上运行的东西(CUDA,像素着色器......) 我的视频可以RG... -
2 votesanswersviews
计算图像中圆棒的数量
我想用图像处理来计算图像中金属棒的数量 . 图像都与此类似: 我想过使用霍夫圆形变换,但是杆不是精确的圆形,并且面上也有缺陷 . 另一个想法是使用分水岭算法 . 我采取了以下步骤: 灰度转换 一个CLAHE增强 金字塔平均移位滤镜可去除纹理和不规则性 应用了高斯模糊 . 大津的阈值 结果: upper image is after 4, lower after 5 显然... -
9 votesanswersviews
连体网络输出
我正在尝试在caffe中实现一个暹罗网络,它由两个不共享权重的图像网组成 . 所以我基本上要做的是给每个网络一个图像,最后试着找出它们之间的相似距离,下面是我的原型 . 所以我的主要问题是我应该如何设置“num_output”呢?我的训练只有2个课程,0个不同,他们不相同,1个是相似的 . name: "Siamese_ImageNet" layers { name: &q... -
1 votesanswersviews
为什么这个用于图像匹配的Keras暹罗网络没有学到任何东西?
对于第一次完整性检查,我试图 Build 一个网络,学习为相同的图像对输出 1 ,为非同一对图像输出 0 ,希望它能快速过度拟合 . 损失减少,但无论我尝试什么,准确度只会在0.5左右反弹 . 使用ResNet50作为共享的暹罗分支对,我将它们与元素减法合并,并将得到的'difference layer'馈送到单个sigmoid单位 - 如Siamese Neural Networks for O... -
0 votesanswersviews
卷积神经网络(CNN)中的训练和验证精度突然下降
我正在训练卷积神经网络(CNN),我在MNIST的X迭代后经历了训练和验证准确性的显着下降: X似乎取决于学习率 . 修改丢失似乎对这种现象没有任何影响 . 我做了较低报告的测试(每100批报告)并注意到掉落发生得非常快 . 跌落后准确度无法恢复 . training_accuracy / validation_accuracy => 1.0000 / 1.0000 for step 100... -
2 votesanswersviews
写入鲁棒(大小不变)圆检测(分水岭)
编辑: Quick Summary 到目前为止:我使用分水岭算法,但我可能有阈值问题 . 它没有检测到更明亮的圆圈 . 新:快速径向对称变换方法并不完全适用(编辑6) . 我想检测不同大小的圆圈 . 用例是检测图像上的硬币并单独提取它们 . - >将单个硬币作为单个图像文件 . 为此,我使用了open-cv的Hough Circle变换:(https://docs.opencv.org/...