首页 文章

从multi fasta文件中的fasta序列末尾删除空格(*)

提问于
浏览
0

我有一个multifasta文件,包含来自2个abinitio工具的预测蛋白质 . 每个序列最后都包含一个空格(*) . 我想从文件中删除它 . 我的序列是这样的:

>snapgene1
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP*
>snapgene2
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP*

我想要这样的序列:

>snapgen1
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP
>snapgene2
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP

任何人都可以帮助我 . 谢谢

2 回答

  • 0

    如果文本存储在文件“temp.txt”中,则可以使用命令:

    sed -i "s/*$//" temp.txt
    
  • 1

    在awk中,如果你在 file 保持你的快速:

    $ awk '{sub(/\*$/,"")}1' file
    >snapgene1
    SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP
    >snapgene2
    SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP
    

    它什么都没有替换尾随 * .

相关问题