当前位置: 移动技术网 > IT编程>脚本编程>Python > 根据bed文件重fasta文件中获取基因序列

根据bed文件重fasta文件中获取基因序列

2018年11月21日  | 移动技术网IT编程  | 我要评论

沽衣取酒对君酌txt,东城卫演唱会,dogs漫画

第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列

源码地址:https://github.com/liuyuan2018/fastatools/blob/master/pygetfasta.py

bed文件通常用来保存注释基因信息bed文件必须的3列:

  1. chrom - 染色体号
  2. chromstart - feature在染色体上起始位置(其实编号为0)
  3. chromend - feature在染色体上末尾位置(不包括此编号)

  第四列是基因的名称

  还有些列想了解参考:http://genome.ucsc.edu/faq/faqformat.html#format1

程序依赖 pyfasta模块(https://pypi.org/project/pyfasta/)

安装pyfasta的命令:pip install pyfasta

 

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网