格式转换:BAM 转 FASTQ

   日期:2024-12-29     作者:hg7em       评论:0    移动:http://mip.riyuangf.com/mobile/news/14095.html
核心提示:有时候,分析已发表数据的时候,避免不了会遇到作者上传的数据是BAM格式,但是作者用的基因组又不是我想要的&

有时候,分析已发表数据的时候,避免不了会遇到作者上传的数据是BAM格式,但是作者用的基因组又不是我想要的,所以我就需要将BAM转换为FASTQ,另外,有些特殊的测序,或者某些仪器的产出,或者某些测序公司的偏好,返还的数据是BAM格式(包含更全面的信息,加上许多分析工具都是需要以FASTQ文件为起始输入,所以需要将BAM转换为FASTQBAM转换为FASTQ是生信分析中的常见步骤,虽然现在还没遇到,提前整理,以备不时之需😑工具有很多,接下来就罗列几个工具

Samtools 应该是圈子内最出名的几个工具之一了,应用十分广泛,专精于SAM、BAM格式文件的操作,被整合到各种分析流程之中,比如ATAC-seq、ChIP-seq等等。应用SamtoolsBAM转换为Fastq要分为两步

  1. 根据Read Name排序
  2. 转换,两种方式
    • 直接转换
       
    • 先转换为fq,再拆分
      转换
      拆分:对于双端测序数据,序列名字尾端会被加上 /1 或者 /2
       

更多详见:http://www.htslib.org/doc/samtools.html

PS: 是新版的命令,而,是旧版的命令(1.13之前?忘记了

Bedtools,可用于各种分析流程,可以对例如BAM、BED、GFF/GTF、VCF等文件进行计数、合并、整合等各种操作。其提供了一个工具bamtofastq,用于转换,但是对单端或者双端测序操作略有不同

  • 单端
  • 双端
    1. 按序列名称排序
    2. 转换

更多详见:http://bedtools.readthedocs.org/en/latest/content/tools/bamtofastq.html

Picard是一个基于Java开发的工具,用于处理测序数据,我接触的用途更多是去除PCR重复。它提供了一个工具SamToFastq,可用于BAM到FASTQ的转换,双端就用参数,单端就是

更多详见:http://broadinstitute.github.io/picard/command-line-overview.html#SamToFastq

10X的测序很火,加上数据很多且大,有些人发文章上传原始数据的时候就会选择二进制的BAM文件,方便数据的有效利用,所以10X搞了一个工具,专门针对其产品的BAM向Fastq转换,包括

  • cellranger (see exceptions below)
  • cellranger-atac
  • cellranger-arc
  • cellranger-dna
  • spaceranger
  • longranger

以上分析流程产出的BAM文件,可以直接使用命令行,执行BAM向Fastq转换,该工具也被内置在上面提到的流程中,存在于安装位置的目录中,比如,使用方法,比如: 、

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号