我有一个基因组DNA序列文件(记为文件A,大小375M, fasta格式),包含多条序列(每条序列都有几十万个碱基)。现在我要从该文件里面提取某一特定序列的特定位置的碱基序列,
例如:我以一条序列为例,我要提取序列>Brapa_Chiifu1_BGIScaffold中第18430-19650之间的序列(这条序列总长度大概几十万个碱基),既开始位置为该序列的第18430,结束位置为19650,其他的序列不需要。
我想把这个提取信息(序列名称:开始位置-结束位置)放在一个txt文件里面(记为文件B)。我希望最后形成的txt文件内容只包含该序列名称和18430-19650之间的序列。
请问如何用perl (或bioperl)代码来实现以上过程,非常感谢,问题解决之时,必有重金答谢!!!急急急
例如:我以一条序列为例,我要提取序列>Brapa_Chiifu1_BGIScaffold中第18430-19650之间的序列(这条序列总长度大概几十万个碱基),既开始位置为该序列的第18430,结束位置为19650,其他的序列不需要。
我想把这个提取信息(序列名称:开始位置-结束位置)放在一个txt文件里面(记为文件B)。我希望最后形成的txt文件内容只包含该序列名称和18430-19650之间的序列。
请问如何用perl (或bioperl)代码来实现以上过程,非常感谢,问题解决之时,必有重金答谢!!!急急急