首页 文章
  • 2 votes
     answers
     views

    通过R中的模糊多对一字符串匹配来匹配两个数据集

    我有两个大数据集(每个500k obs),我想通过模糊字符串匹配个人姓名,但也利用其他变量的信息 . 问题类似于此处描述的问题:How can I match fuzzy match strings from two datasets? 但是,在那里发布的解决方案需要首先通过 expand.grid 产生所有成对的潜在匹配,但是我的数据无法完成 . 如果您有两个10,000个数据集,那么这将导致总...
  • 0 votes
     answers
     views

    找不到满足要求tensorflow == 1.0.0的版本

    我有以下版本的python:C:\ Users \ Dell \ AppData \ Local \ Programs \ Python \ Python35-32 \ python.exe 并执行命令:pip3 install --upgrade tensorflow 收到以下错误: 收集张量流== 1.0.0 找不到满足要求的版本tensorflow == 1.0.0(来自版本:)没有找到te...
  • 0 votes
     answers
     views

    Rust匹配和借用检查器

    我一直磕磕绊绊地看着我的Rust程序中的模式,这种模式总是让我与借用检查器发生冲突 . 考虑以下玩具示例: use std::sync::{Arc,RwLock}; pub struct Test { thing: i32, } pub struct Test2 { pub test: Arc<RwLock<Test>>, pub those: ...
  • 0 votes
     answers
     views

    正则表达式匹配模式,同时排除文本中的其他模式

    我有一个文件,包括像 lets say my input text is || text || || text || || text || || 1 || || 2 || 我想只匹配||从文本同时我想排除数字的出现与这种模式||的数字0-9 || 所以我做了一个正则表达式 (\ ||):这将匹配||在文中但我的问题是我也得到了|| 0-9 ||这是可以理解的,所以我在正则表达式中添加一个过滤器 ...
  • 2 votes
     answers
     views

    检查某些文本是否仅包含某些模式

    我有以下问题:我正在尝试检查某些文本是否只包含一些模式的重复 . 我有1000行文本,想检查它是否只包含 asd 123 我尝试不匹配模式,但 (pattern)+ 希望它匹配任何匹配,但它无济于事 . 我的另一个想法是将字符串与正则表达式上的文本分开,但如果重要的话,它没有使用python re模块写这个 . 谢谢!
  • 0 votes
     answers
     views

    如何比较opencv中的两个边缘图像(不匹配形状)

    关于我正在做什么的一点介绍...出于学术目的,我使用opencv在c中创建一个应用程序来检测场景中的静态对象 . 该应用程序基于背景减法和跟踪的组合方法,并且与放弃对象相关的事件的检测工作正常 . 但此刻我遇到了一个无法解决的问题;我必须实现一个有限状态机来检测对象移除事件,包括在后台输入对象之前和之后 . 为此,我的上级命令我使用物体的边缘 . 而现在的问题 . 在检测到非法停放在道路上的车辆之...
  • 4 votes
     answers
     views

    查找所有常见的非重叠子串

    给定两个字符串,我想识别从最长到最短的所有常见子字符串 . 我想删除任何“子”子字符串 . 例如,'1234'的任何子串都不会包含在'12345'和'51234'之间的匹配中 . string1 = '51234' string2 = '12345' result = ['1234', '5'] 我想找到longest common substring,然后递归地找到左/右最长的子串 . 但...
  • 0 votes
     answers
     views

    Grep用另一个文件过滤一个文本文件(非常大的文件)

    我会尽量保持这个尽可能简单,因为我不是那些经验丰富的grep / linux . 我有一个非常大的.txt文件(1.7GB),格式如下: username:email:IP 我有另一个较小的.txt文件(大约100k行文本),只包含: username 我想创建一个输出列表,其中包含在大型和小型.txt文件中找到的用户名(不区分大小写)但我希望它们也具有在较大的文本文件中找到的电子邮件和IP ...
  • 0 votes
     answers
     views

    OpenCV - 在同一程序中收集featureDetectors和descriptorDetector

    我想做一个允许使用SIFT,SURF,ORB(所有特征检测器),不同描述符和不同匹配器的程序 . 我想运行这样的东西:功能(“SIFT”,“SIFT”,“BruteForce”)各自的功能(“探测器”,“描述符”,“匹配器”) . 事实上我以前做过一个程序,但有很多“如果” . 例如“if(detection =”SIFT“)”“if(matcher ==”BruteForce“)”等等 . 因此...
  • 2 votes
     answers
     views

    MATLAB中每行出现的指标

    我有两个矩阵, A 和 B . ( B 像 1:n 一样连续) 我需要在 A 中找到 B 的每一行的所有出现,并相应地将这些行索引存储在单元格数组 C 中 . 请参阅下面的示例 . A = [3,4,5;1,3,5;1,4,3;4,2,1] B = [1;2;3;4;5] 从而, C = {[2,3,4];[4];[1,2,3];[1,3,4];[1,2]} 注意 C 不需要在我的应用程序...
  • 1 votes
     answers
     views

    如何在Crystal lang中将.match的结果作为字符串值访问

    在许多其他编程语言中,有一个函数将正则表达式作为参数,并返回字符串值数组 . 这适用于Javascript和Ruby . 然而,晶体中的 .match 确实1)似乎不接受全局标志和2)它不返回数组而是返回类型 Regex::MatchData 的结构 . (https://crystal-lang.org/api/0.25.1/Regex/MatchData.html) 以下代码为例: str ...
  • 1 votes
     answers
     views

    Applied NLP:如何根据多字词的词汇对文档进行评分?

    这可能是一个相当基本的NLP问题,但我手头有以下任务:我有一组文本文档,我需要根据一个(英语)词汇进行评分,这些词汇可以是1-,2-,3-等 N - 字长 . N 受到一些"reasonable"数字的限制,但字典中各种术语的分布对于 n = 1, ..., N 的各种值可能相当均匀 . 例如,该词典可以包含某种类型的设备列表,并且我想查看给定文档是否可能与这些设备中的任...
  • 3564 votes
     answers
     views

    如何有效地配对袜子?

    昨天我把干净的洗衣店的袜子配对,弄清楚我做的方式效率不高 . 我正在做一个天真的搜索 - 挑选一个袜子和"iterating"堆,以找到它的一对 . 这需要平均迭代n / 2 * n / 4 = n2 / 8袜子 . 作为一名计算机科学家,我在想我能做些什么?当然,为了实现O(NlogN)解决方案,我们会想到排序(根据大小/颜色/ ...) . 哈希或其他非就地解决方案不是一种...
  • 2 votes
     answers
     views

    具有String :: Approx的多个模糊匹配

    我想使用perl在序列文件中找到模糊匹配,并返回字符串中的字符编号,在该字符串中找到匹配的给定数量的替换(假设S = 2) . 例如,如果我的输入文件是: Name1 ACTGTGACCTTT Name2 ACCTTTACTGTG Name3 GACCTTTCTGTG Name4 GCACCTTTTGTG Name5 GCTACCTTTGTG Name6 ACTGACCTTTTG Name7 AC...
  • 1 votes
     answers
     views

    使用R匹配两个数据帧的公共列中的值,然后跨相应的数据写入

    我有两个数据帧 . 第一个(df1)有一列记录每行的旧ID号和一列具有相应的新ID号 . 这是一个更大的数据集 . 第二个(df2)有一列只有每行的旧ID号 . 我想在第二个数据框中创建一个新列,其中包含在df1中找到的相应新ID号 . 以下是数据集的虚拟示例: df1 OldID NewID Numofsh Loc ID10000 4853 158 Bath ID10001...
  • 8 votes
     answers
     views

    从功能关键点手动在OpenCV中进行成对匹配

    这是我的问题 . 我在多个图像上手动提取了SURF的关键点特征 . 但我也已经知道哪一对要匹配 . 问题是,我正在尝试创建我的匹配对,但我不明白如何 . 我试着通过查看代码,但这是一个烂摊子 . 现在,我知道features.descriptors(一个矩阵)的大小与关键点的数量相同(另一个维度为1) . 在代码中,为了检测匹配对,它只使用描述符,因此它比较行(或列,我不确定)或两个描述符矩阵,并...
  • 0 votes
     answers
     views

    从文件加载数据时opencv的descriptor_extractor_matcher的匹配结果不同

    我在descriptor_extractor_matcher.cpp示例中使用以下代码来计算img1(Mat descriptors01)的描述符,将其写入我的磁盘并加载回来(Mat descriptors1) . (关键点的步骤相同,但代码相当......) Ptr<DescriptorExtractor> descriptorExtractor = DescriptorExtra...
  • 2 votes
     answers
     views

    C / OpenCV - 为什么带有ORB和LSH的FLANN :: index工作得非常糟糕?

    我正在寻找数据库内的图片(1000张图片) . 为了做到这一点,我使用ORB功能袋 . 然后,我使用LSH . 有一些我根本不懂的东西 . 有了KD-TREE,我得到了我最近的3个邻居之一,那么其他结果非常糟糕 . 我认为这是因为KD-TREE在高维数据中的表现非常糟糕 . 指数:[47,194,1118]区:[0,0.01984383,0.021690277] 然后当我使用具有汉明距离的LSH时...
  • 3 votes
     answers
     views

    使用带有BREIF提取器c OpenCV的FAST检测器的结果很差

    首先,感谢您阅读我的问题 . 我写了一个程序 检测场景中的移动物体(来自固定摄像机) 跟踪他们 尝试将它们与静态数据库匹配并识别它们 在这张图片中你可以看到一个示例视频中的结果,该程序工作正常,它检测到红色汽车识别它并且它正在跟踪汽车:: 注意:橙色圆点表示为动态数据库获取额外样本以备将来使用的位置 . 问题:简而言之,我的方法是 extract region of inter...
  • 0 votes
     answers
     views

    SAS:合并或加入并保留所有记录,同时填补缺失的内容

    我基本上将数据集拆分为两个(具有ID和缺少ID的数据集),并通过一组匹配键将缺少的数据合并到非缺失中以帮助填充ID . 我总共有五个记录,最终数据集需要保留所有五个记录 . 以下是一个例子: DATA TEST; LENGTH ID MKEY $12.; INPUT ID $ MKEY $; DATALINES; . M123 . M456 ...

热门问题