首页 文章
  • 1 votes
     answers
     views

    比较两个文件(fasta和txt),如果匹配,则使用来自txt文件的值为fasta标头添加前缀

    我想根据参考文本文件中的信息更改我的FASTA标头 . 所以说我有两个文件: file1.txt(引用,制表符分隔) chr1:100-1000(+) ORF1_ORF2_ chr2:30-400(-) ORF2_ chr3:50-4500(+) chr4:60-800(-) ORF1_ file2.fasta >chr1:100-1000(+) TTTTGAGAGGA...
  • 0 votes
     answers
     views

    从multi fasta文件中的fasta序列末尾删除空格(*)

    我有一个multifasta文件,包含来自2个abinitio工具的预测蛋白质 . 每个序列最后都包含一个空格(*) . 我想从文件中删除它 . 我的序列是这样的: >snapgene1 SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP* >snapgene2 SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP* ...
  • 0 votes
     answers
     views

    在fasta文件中重命名序列

    我是新手,对这个问题提前抱歉 . 我有一个FASTA文件,想重命名我的序列名称 . 初始记录如下: >TV-B-PCR1_S14_M02625_124_000000000-B85HY_1_1101_14139_4234 CCTA... 我想把它转换成这样的东西: >TV-B-PCR1_1101-14139-4234 CCTA... 非常感谢您的任何帮助表示感谢!
  • -2 votes
     answers
     views

    清理fasta文件头

    我有一个像这样的 Headers 的大型fasta文件 >sample_1 M04839:239:000000000-BVKC2:1:1105:7523:23617;size=450 我想要的输出是 >sample_1;size=450 我该如何改变呢?
  • 5 votes
     answers
     views

    如何在python中读取fasta文件?

    我正在尝试读取FASTA文件,然后查找特定的motif(string)并打印出它发生的顺序和次数 . FASTA file只是一系列以 Headers 行开头的序列(字符串), Headers 或新序列的开头是">" . 在 Headers 之后的一个新行中是字母序列 . 我没有完成代码但到目前为止我有这个并且它给了我这个错误: AttributeError:'str...
  • 1 votes
     answers
     views

    从两个FASTA文件循环id

    我有两个包含多个序列的fasta文件 cat file1.fasta >1 ACGTCGAT >2 ACTTTATT >3 ACGGGG cat file2.fasta >1 CCGGAGC >2 TGTCAGTC >3 CTACGTCTT 我还有一个每个fasta文件的ID列表,我想用它来按ID提取特定序列,制作一个2序列fasta,然后执行一些操作(对齐...
  • 3 votes
     answers
     views

    如何在Perl中合并两个FASTA文件(一个带换行符的文件)?

    我有两个关注Fasta文件: file1.fasta >0 GAATAGATGTTTCAAATGTACCAATTTCTTTCGATT >1 GTTAAGTTATATCAAACTAAATATACATACTATAAA >2 GGGGCTGTGGATAAAGATAATTCCGGGTTCGAATAC file2.qual >0 40 40 40 40 40 40 40 40 40...
  • 1 votes
     answers
     views

    如何使用带有awk语句的fasta头提取两种类型的序列

    我一直在运行一个名为genewise的程序,将核苷酸序列翻译成基因的蛋白质序列 . 输入包括来自许多样品的组装的核苷酸序列 . 为了解析genewise输出,我一直在使用以下命令选择fasta标头: for i in `ls`; do (cd "$i" && awk '/^>*/{flag=1;} /\/\// {flag=0}flag' out_gene...
  • 0 votes
     answers
     views

    使用Perl和REGEX连接FASTA文件中的样本的多个序列

    我有超过200个多序列fasta文件,并且在每个fasta文件中,有一些序列可供选择基因的数百个样本(即样本输入fasta文件中的PF3D7_1467550) . fasta文件中的大多数样本(即样本303.1-样本输入文件中的第一个序列)具有一个序列,但是其他样本(即IGS-MLW-089sA和IGS-MWI-254sA)具有需要连接的基因的多个序列一起 . 示例输入fasta文件 >3...
  • -2 votes
     answers
     views

    根据 Headers 拆分多个fasta文件

    我是生物信息学的初学者,我正在尝试从多个fast-fasta文件创建子多个fasta文件 . 所以我有数百个包含fasta线的hundreads的fasta文件(带有 Headers 的序列) . 我想根据物种名称( Headers 中的指示)将这个fasta分成不同的新fasta文件 . 我有这样的文件:CL0073reads.fas >>CL0073reads.fas_ang483...
  • 1 votes
     answers
     views

    如何根据序列id组合FASTA序列?

    我有9个FASTA文件,代表9个基因的DNA测序 . 每个FASTA文件包含121个序列,代表121个菌株 . 每个序列的名称是每个菌株的id . 但是,在每个文件中,id都没有排序,例如,在gene1.fasta中: >1 AAA >16 TTT >2 GGG ... 在gene2.fasta中: >2 CCC >34 AAA >1 GGG ... 我想将...
  • 1 votes
     answers
     views

    如何订购多个Fasta对齐文件

    我确信这是一件容易做的事,但我的生物信息学经验非常有限 . 我有许多-100,000-FASTA文件,其中包含相同12种不同基因的比对 . 每个文件看起来像这样: >dmel ACTTTTGATACAATTAAC >dsim AATCCCAGACAAATTAAG >dsec AGTTTTGCAATGGTAAAT >dere TGGAATATTAGACGAATT ... ...
  • 0 votes
     answers
     views

    MYSQL:基数违规:1242子查询返回超过1行?

    我正在使用此查询来搜索标签相似性 SELECT sites_id FROM tags_to_sites WHERE tags_id IN (SELECT tags_id FROM tags_to_sites WHERE sites_id= ?) AND sites_id!= ? GROUP BY sites_id HAVING COUNT(*) = ( S...
  • 1 votes
     answers
     views

    配置perl对文件IO错误更严格

    我有一个perl脚本,其行类似于以下内容 my $in = new IO::File ($fn) or warn "Sorry, there was a problem opening $fn: $!\n", and return; 在我的系统上,如果 $fn 指定的文件路径不存在,它将显示警告并从函数返回 . 然而,在一些系统中,它打印标准 could no...
  • 3 votes
     answers
     views

    perl:多线程写和尾文件

    我正在研究perl多线程的简单用例:一个线程写入文件,另一个线程写入文件 . 这是代码: use strict; use warnings; use threads; use File::Tail; my $file = 'data.txt'; sub tail_file{ my $file=File::Tail->new($file); while (defined(my...
  • -2 votes
     answers
     views

    Perl替换字符串(newstring oldstring)

    通过将旧字符串的每次出现更改为新字符串来实现处理输入文件的程序 . (用法是:chstr文件oldstring newstring,chstr是你的程序名,文件,oldstring和newstring是用户指定的参数 . ) if( @ARGV < 2) { print "usage: ReplaceString.pl filename OldString NewStri...
  • 0 votes
     answers
     views

    从脚本中获取错误“格式错误的 Headers ”移动了一些旧的遗留perl代码

    我正在将一些非常古老的遗留perl cgi代码移动到新服务器上 . 除了一个脚本和一行之外,所有旧的perl东西似乎都在工作 . 我不确定我是否忘记加载某些东西(通常它告诉我我错过了什么) 导致错误的代码行: print $query->redirect(-location=>"/servlet/guestbookServlet?method=displayGuestBook...
  • 0 votes
     answers
     views

    Perl不允许写文件

    我正在使用Ubuntu 12.04和Apache2 . 我的perl脚本在 /usr/lib/cgi-bin 上,我正在尝试写一个文件(打开">")到 /var/www/my_custom_dir ,但我得到: 许可被拒绝 如果我尝试写入脚本的目录或任何其他错误是相同的 . 权限似乎正确 . 一切都是755,root用户 . 我试图将“my_custom_dir”所有...
  • 1 votes
     answers
     views

    重新复制FASTA,保留seq id

    我需要格式化miRNA识别工具(miREAP)的文件 . 我有一个以下格式的fasta文件: >seqID_1 CCCGGCCGTCGAGGC >seqID_2 AGGGCACGCCTGCCTGGGCGTCACGC >seqID_3 CCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGA >seqID_4 CCGCATCAGGTCTCCAAGGTGAAC...
  • 0 votes
     answers
     views

    我有一个perl脚本,它从html文件传递参数,然后将该参数打印到该文件

    所以我编写了一个perl脚本来传递HTML文件中的参数,然后获取参数的vaule并将其写入文件,然后读取文件并编译数据 . 这是html文件的正文: <!DOCTYPE html> <!DOCTYPE html> <html lang = "en"> <head> <title> poll.html </titl...
  • 0 votes
     answers
     views

    获得以FASTA中特定氨基酸开始的蛋白质序列的 Headers 行

    嗨,大家好,所以我一直试图使用PERL只打印从FASTA文件以“MAD”或“MAN”(前3个aa)开头的蛋白质序列的 Headers (整个> gi系列) . 但我无法弄清楚哪个部分出了问题 . 提前致谢! #!usr/bin/perl use strict; my $in_file = $ARGV[0]; open( my $FH_IN, "<", $in_fi...
  • 1 votes
     answers
     views

    使用包含递增值的新名称编辑行名称

    这对我来说似乎是一项简单的任务,但让它轻松工作最终会比我想象的更难: 我有一个包含几百万行文本的fasta文件(只有几百个单独的序列条目),这些序列名称很长,我想用 > 替换 > 之后的所有字符,其中 $n 是一个从1开始的整数,是每次更换都会增加 . 示例输入序列名称: >NODE:345643RD:Cov_456:GC47:34thgd ATGTCGATGCGT >NO...
  • 0 votes
     answers
     views

    打印Perl中目录中的所有文件 - 将不起作用

    所以我是Perl的新手并尝试简单地打开一个目录,并列出其所有文件 . 当我在下面运行这个非常简单的代码尝试在/ usr / bin中打印所有内容时,它将无法正常工作,无论我尝试什么,我都会被告知'无法打开/ usr / bin:没有这样的文件或目录' . 任何帮助将非常感激! #!/usr/bin/perl $indir = "/usr/bin"; # read in al...
  • 73 votes
     answers
     views

    重命名文件名的一部分[重复]

    这个问题在这里已有答案: Rename multiple files in Unix 20个答案 我有大量的文件,如下所示: DET01-ABC-5_50-001.dat ... DET01-ABC-5_50-0025.dat 我希望它们看起来像这样: DET01-XYZ-5_50-001.dat ... DET01-XYZ-5_50-0025.dat 我怎样才能做到这一点?
  • 0 votes
     answers
     views

    如何使用awk和条件管道提交qsub作业?

    我有一个文件(fasta),我使用awk从(带有 Headers 的序列)中提取所需的字段 . 然后我将它传递给BLAST程序,最后我将它传递给qsub以便提交作业 . 文件: >sequence_1 ACTGACTGACTGACTG >sequence_2 ACTGGTCAGTCAGTAA >sequence_3 CCGTTGAGTAGAAGAA 和命令(有效): awk &...
  • 4 votes
     answers
     views

    找到DNA序列中所有重复的4聚体 - Perl

    你好, 我尝试编写一个程序,读取包含多个DNA序列的FASTA格式文件,识别序列中所有重复的4聚体(即,多次出现的所有4聚体),并打印出重复的4聚体以及查找它的序列的 Headers . k聚体仅仅是k个核苷酸的序列(例如,“aaca”,“gacg”和“tttt”是4聚体) . 这是我的代码: use strict; use warnings; my $count = -1; my $fil...
  • 2 votes
     answers
     views

    通过已知序列从fasta文件中提取序列和头

    我试图比较两个文件并提取具有其他子集的序列 . 而且,我也想提取标识符 . 但是,我能做的是能够提取包括子集的序列 . 示例文件是: text.fa >header1 ETTTHAASCISATTVQEQ*TLFRLLP >header2 SKSPCSDSDY**AAA >header3 SSGAVAAAPTTA 和, textref.fa >textref.fa CIS...
  • 8 votes
     answers
     views

    带有opencv的H264视频编解码器

    我正在尝试使用opencv创建一个电影,我需要输出文件是H264格式 . 我在opencv中使用了以下fourcc,但是我收到的错误是没有安装合适的编解码器 . fourcc=CV_FOURCC('H','2','6','4') ; 当我运行我的应用程序时,我收到以下错误消息: Could not find encoder for codec id 28: Encoder not found ...
  • 1 votes
     answers
     views

    OpenCV写帧到文件python

    嘿所以我开始玩OpenCV并且我无法将我的网络摄像头输出保存到文件中 . 这就是我所拥有的 . 运行正常,启动网络摄像头并创建“output.avi”问题是output.avi很小(414字节)和每次运行程序时相同的确切字节 . 我猜测问题是使用fourcc编码,但我还没能找到适用于我的情况 . 我在Mac OS X上运行 . 如果您需要更多信息,请告诉我 . import numpy as np...
  • 5 votes
     answers
     views

    无法在OpenCV python中打开视频文件

    我正在尝试使用OpenCv's Website中的基本示例代码打开视频文件 . 我已经尝试了我能在网上找到的所有内容,但无论我得到什么错误 VIDEOIO(cvCreateFileCapture_AVFoundation (filename)): raised unknown C++ exception! 我不知道发生了什么事 . 我的示例代码如下 import numpy as np ...

热门问题