首页 文章

根据fasta标头重命名文件

提问于
浏览
1

我从NCBI下载了240个基因组,下载时根据装配数量得到文件名 . 我想根据物种名称而不是它们的汇编号重命名文件,因为这样可以更容易地解释数据 .

我知道一些(很少)python,我真的没有能够自己解决这个问题 .

所以我想做的是写一个循环进入我的文件夹中的每个文件,并根据fasta Headers 重写文件名

文件名示例:GCF_000014225.1_ASM1422v1_genomic.fna

fasta Headers 的例子:> NC_008228.1 Pseudoalteromonas atlantica T6c,完整的基因组

显然,如果我能摆脱NC_008228.1和完整的基因组,我会很高兴,但只是fasta Headers 作为文件名将使我的生活更容易(替代方法是手动做...但我知道它可以完成一些编码)

非常感谢你提前!

1 回答

  • 0

    这可能是使用 sys 但我认为 bash 可以更好地解决您的问题 . 就像是:

    for file in /dir/*; do
    header=$(cat $file | egrep ">.*\w([a-zA-z]\w[a-zA-z])\w.*)")
    mv $file $header.fa
    done
    

相关问题