首页 文章
  • 103 votes
     answers
     views

    如何在Linux上使用grep搜索包含dos行结尾(CRLF)的文件?

    我想在Linux上用grep搜索包含dos行结尾的文件 . 像这样的东西: grep -IUr --color '\r\n' . 以上似乎与文字 rn 匹配,这不是所期望的 . 这个输出将通过xargs传输到todos,将crlf转换为lf,就像这样 grep -IUrl --color '^M' . | xargs -ifile fromdos 'file'
  • 117 votes
     answers
     views

    如何从另一个文件A中删除文件B上出现的行?

    我有一个很大的 file A (由电子邮件组成),每封邮件一行 . 我还有另一个包含另一组邮件的 file B . 我将使用哪个命令从文件A中删除文件B中出现的所有地址 . 那么,如果文件A包含: A B C 和文件B包含: B D E 然后文件A应该留下: A C 现在我知道这是一个可能经常被问到的问题,但是我发现one command online给了我错误的分隔符 . 任何帮...
  • 1 votes
     answers
     views

    grep -Ev不适用于我的文件

    我有两个文件包含(唯一)字符串:第一个是1.txt,有~100万个唯一字符串,2.txt有~10,000个唯一字符串 . 我想删除1.txt中所有出现的2.txt字符串,因此,当我在1.txt中搜索2.txt的出现时(使用comm命令)我发现几乎所有2.txt都在1中 . txt我使用以下命令(grep -Ev -f 2.txt 1.txt)这个命令应该给我一个9,990,000字符串的输出,但...
  • 1 votes
     answers
     views

    使用逆grep比较两个.txt文件

    我有两个.txt文件“test1.txt”和“test2.txt”,我想使用反grep(UNIX)来查找test2.txt中不包含test1.txt中任何行的所有行 test1.txt仅包含用户名,而test2.txt包含更长的文本字符串 . 我只希望test2.txt中的行不包含在test1.txt中找到的用户名 它会是什么样的? grep -v test1.txt test2.txt >...
  • 458 votes
     answers
     views

    如何从grep -R中排除目录?

    我想遍历所有子目录,除了“node_modules”目录 .
  • 2 votes
     answers
     views

    当grep通过POSIX管道接收输入并输出到POSIX管道时,它的行为是什么?

    我有这个程序,为孩子的stdin,stdout和stderr分叉并创建三个POSIX管道 . 在分叉之后,子和父关闭它们各自管道的适当端,使得子只能从stdin管道读取并且只写入stdout和stderr管道(而父对面的情况则相反) . 接下来,子进程关闭并将子进程的stdin,stdout和stderr复制到其打开的管道端,然后使用execvp执行其名称作为父进程的参数传入的程序 . 程序在行为...
  • 13 votes
     answers
     views

    R从字符串中删除非字母数字符号

    我有一个字符串,我想删除所有非字母数字符号,然后放入一个矢量 . 所以这: "This is a string. In addition, this is a string!" 会成为: >stringVector1 "This","is","a","string","In&q...
  • 85 votes
     answers
     views

    使用grep仅报告行号

    我有一个可能包含错误格式的文件(在这种情况下,模式 \\backslash 的出现) . 我想使用 grep 只返回发生这种情况的行号(如同,匹配在这里,转到第x行并修复它) . 但是,似乎没有办法打印行号( grep -n )而不是匹配或行本身 . 我可以使用另一个正则表达式来提取行号,但我想确保grep不能单独执行 . 我认为 grep -no 最接近,但仍显示匹配 .
  • 67 votes
     answers
     views

    Grep列表文件名和行号

    嗨,我正在尝试使用grep搜索我的rails目录 . 我正在寻找一个特定的单词,我想grep打印出文件名和行号 . 有一个grep标志会为我做这个吗?我一直在尝试使用-n和-l的组合,但这些都是打印出没有数字的文件名,或者只是将大量文本转储到终端,这些文本无法轻易读取 . 例如: grep -ln "search" * 我需要将它管道输入awk吗?
  • 0 votes
     answers
     views

    在文本文件中查找常用短语

    我有一大堆文本(比如100或150个文件)和一个我想分析的新文本 . 我需要知道它是否在我的语料库中有任何文本的常用短语或部分短语(例如借用或依赖于共同来源) . 我不知道如何正确地完成这项任务,我开发了一个程序,我不能称之为非常聪明 . 我(使用sed脚本)从我的文件中成对,三,四,五个连续的单词 . 所以,例如"threes"将是以下行的文件 word1 word2 w...
  • 275 votes
     answers
     views

    如何让grep打印每条匹配线下方和上方的线? [重复]

    可能重复:grep一个文件,但显示几个周围的行? 我必须解析一个非常大的文件,我想使用命令grep(或任何其他工具) . 我想在每个日志行中搜索单词 FAILED ,然后打印每条匹配行上下的行以及匹配行 . 例如: id : 15 Satus : SUCCESS Message : no problem id : 15 Satus : FAILED Message : connection...
  • 298 votes
     answers
     views

    使用grep时获取行号

    我使用grep递归来搜索文件中的字符串,所有匹配的文件和包含该字符串的行都在终端上打印 . 但是有可能获得这些线的行号吗? 例如:我现在获得的是 /var/www/file.php: $options = "this.target" ,但我想要获得的是 /var/www/file.php: 1142 $options = "this.target"; ,其中...
  • 3 votes
     answers
     views

    用于配置grep输出的Perl脚本

    我有一个管道分隔的日志文件,其格式如下: <date> <time> | <fruit> | <color> | <num_1> | <num_2> | <num_3> 例如: 2013-03-27 23:01:52 | apple | green | 55 | 120 | 29 2013-03-27 23...
  • 1 votes
     answers
     views

    Perl中不区分大小写的GREP

    我有一个使用严格的Perl脚本 use strict 我想通过使用与我拥有的var的大小写敏感内容来从数组中grep一个元素 my ($sPermIdIndex) = grep $aHeaderLine[$_] eq $sPermIdField/i, 0 .. $#aHeaderLine; 这行给了我错误 Bareword "i" not allowed while &qu...
  • 3 votes
     answers
     views

    bash ps打印有关名称的进程的信息

    我需要使用带有类型名称的进程ps打印UID PID PPID PRI NI VSZ RSS STAT TTY TIME列 . GNU nano 2.0.6 File: file2 ...
  • 1 votes
     answers
     views

    根据列名称的多个条件提取数据框列

    我想基于多个列名标准对数据框进行子集化 . 我有一个数据框如下: id team_col_code1 team_col_code2 ... team_col_code78 Gender State team_cost_code1 team_cost_code2 ... team_cost_code43 我正在尝试对此数据框进行子集,以便新数据集仅包含包含包含单词 "col...
  • 1 votes
     answers
     views

    Grep word在一个文件中,并使用该单词在FASTA文件中匹配,将FASTA序列添加到第一个文件

    我想在file1中grep几个单词,并使用每个单词来grep在file2.fasta中匹配后的内容 . 然后我想将匹配后的内容添加到我用到file03中的单词,以便file03包含来自两个文件的信息 . 我的部分文件是: 文件1: Jan12345: ID1 ID2 ... IDN1 Jan67899: ID11 ID12 ... IDN2 和Fasta文件(file2)这样: >ID1 ...
  • 1 votes
     answers
     views

    使用Unix命令行工具修改FASTA标头

    我再次陷入修改文本的困境 . 我想改变大文本文件,如: >hg19_ct_UserTrack_3545_691 range=chr1:8121498-8121502 5'pad=0 3'pad=0 strand=+ repeatMasking=none GATGG >hg19_ct_UserTrack_3545_690 range=chr1:8121587-8121591 5'pad=...
  • 0 votes
     answers
     views

    从multi fasta文件中的fasta序列末尾删除空格(*)

    我有一个multifasta文件,包含来自2个abinitio工具的预测蛋白质 . 每个序列最后都包含一个空格(*) . 我想从文件中删除它 . 我的序列是这样的: >snapgene1 SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP* >snapgene2 SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP* ...
  • 212 votes
     answers
     views

    如何让`find`忽略.svn目录?

    我经常使用 find 命令搜索源代码,删除文件等等 . 令人讨厌的是,因为Subversion在其 .svn/text-base/ 目录中存储了每个文件的重复项,所以我的简单搜索最终会得到大量重复的结果 . 例如,我想在多个 messages.h 和 messages.cpp 文件中递归搜索 uint : # find -name 'messages.*' -exec grep -Iw uint ...
  • 153 votes
     answers
     views

    如何获取进程ID以杀死nohup进程?

    我正在服务器上运行nohup进程 . 当我试图杀死它时,我的腻子控制台会关闭 . 这是我尝试查找进程ID的方法: ps -ef |grep nohup 这是杀人的命令 kill -9 1787 787
  • 1 votes
     answers
     views

    Telegraf - inputs.procstat pgrep插件问题

    Telegraf v1.0.1 启用 [[inputs.procstat]] 插件后,我无法再看到 telegraf[._] (树)指标 . Telegraf已成功安装 . 进程正在运行 . 我几乎使用输入插件和输出插件的常规设置 . 这就是我得到的: ubuntu@jenkins:/tmp/giga_aks_testing/ansible$ grep -C 2 jenkins /etc/tele...
  • 11 votes
     answers
     views

    从文件中删除包含非英语(Ascii)字符的行

    我有一个文本文件,其中包含来自不同语言的字符,如(中文,拉丁语等) 我想删除包含这些非英文字符的所有行 . 我想要包括所有英文字符(a-b),数字(0-9)和所有标点符号 . 如何使用像awk或sed这样的unix工具来完成它 .
  • 103 votes
     answers
     views

    比赛前后的Grep角色?

    使用这个: grep -A1 -B1 "test_pattern" file 将在文件中匹配的模式之前和之后生成一行 . 有没有办法显示不是行而是指定数量的字符? 我文件中的行非常大,所以我对打印整行不感兴趣,而只是在上下文中观察匹配 . 有关如何做到这一点的任何建议?
  • 1 votes
     answers
     views

    grep表示字符串,如果匹配则查找匹配行上方具有特定单词的行

    我正在寻找一个文件中的模式,如下所示 . 在这个例子中,我需要grep一个字符串 mgrpRFC822MailMember: foo.foo2@example.com 如果上面的字符串匹配,则上升并找到第一个 dn: 行并打印 test-d@example.com 现在,问题是, dn: 行并不总是在相同的数字(在下面的示例中,行 dn: 是grep'ed行上方的3行 mgrpRFC822Mai...
  • 0 votes
     answers
     views

    Grep打印所有文件内容[重复]

    这个问题在这里已有答案: Colorized grep — viewing the entire file with highlighted matches 16个答案 我如何修改grep,以便在其条目与grep模式匹配时打印完整文件,而不是仅打印匹配的行?我尝试使用(比如说)grep -C2打印上面的两行和下面的两行,但这并不总是有效 . 行不固定..我不只是搜索单个文件,我正在搜索整个目录...
  • 315 votes
     answers
     views

    如何格式化我的grep输出以显示行尾的行号,以及命中计数?

    我正在使用grep来匹配文件中的字符串 . 这是一个示例文件: example one, example two null, example three, example four null, grep -i null myfile.txt 返回 example two null, example four null, 如何将匹配的行与其行号一起返回,如下所示: example two nul...
  • 192 votes
     answers
     views

    如何搜索多个pdf文件的内容?

    我怎样才能在目录/子目录中搜索PDF文件的内容?我正在寻找一些命令行工具 . 似乎 grep 无法搜索PDF文件 .
  • 2 votes
     answers
     views

    提取包含D的A和(B或C)之间的线

    我需要在A和(B或C)模式之间提取文本,其中包含D模式 . 例如,我有一个文件,需要在“proc sql”和(“quit”或“run”)之间提取所有内容,其中包含“index” . proc sql bla-bla-bla index=10; quit proc sql bla-bla-bla quit; proc sql index=10; run 需要的输出: proc sql bla-...
  • 1 votes
     answers
     views

    我如何在Perl中使用grep?

    我有一个日志文件,需要正确格式化为可读格式 . 但是,文本文件没有静态行数或固定主值,并且具有随机数量的空格,但只有一个日志文件头,可用于指定每次应用程序记录的开始和结束时间 . 日志文件的示例: Log File header <text> <text> Log File header <text> 脚本格式化后应该看起来像这样: Log File head...

热门问题