跳转至

序列比对

以下是常用序列比对软件的简短介绍和特点。

1. BWA (Burrows-Wheeler Aligner)

  • 特点:适用于短序列(Illumina读段),内存占用低,比对速度快。
  • 适用场景:基因组重测序、SNP检测。
  • 版本区别:BWA分为bwa aln(适用于<100bp短读段)和bwa mem(适用于100bp以上读段)。

2. BWA-MEM2

  • 特点:BWA-MEM的优化版本,支持更长读段,内存使用效率更高,比对速度更快。
  • 适用场景:大规模基因组比对(长读段),多线程处理效率更高。
  • 优势:专为多核CPU优化,比BWA MEM更快。

3. HISAT2

  • 特点:专为RNA-Seq数据设计,支持较大的插入缺失变异,内存消耗低。
  • 适用场景:转录组数据比对、表达量分析。
  • 优势:采用Hierarchical Indexing策略,处理大基因组(如人类基因组)时性能优异。

4. STAR (Spliced Transcripts Alignment to a Reference)

  • 特点:高效的RNA-Seq比对工具,能处理大规模数据,识别复杂剪接事件。
  • 适用场景:转录组测序(RNA-Seq),特别适合识别可变剪接事件。
  • 优势:内存需求高,但比对速度非常快。

5. Bowtie

  • 特点:轻量级比对工具,适用于超短读段(如microRNA测序数据),比对速度非常快。
  • 适用场景:小RNA测序,短读段测序数据。
  • 限制:不支持插入缺失(Indels),不适合长读段比对。

6. Bowtie2

  • 特点:Bowtie的升级版本,支持较长读段、Indel检测及局部比对。
  • 适用场景:长读段的序列比对,结构变异分析。
  • 优势:兼顾内存占用和比对速度。

7. SOAPaligner/soap2

  • 特点:高效的短读段比对工具,支持比对到参考基因组的多个位置。
  • 适用场景:基因组和转录组重测序。
  • 限制:较旧的工具,可能对长读段比对效果不佳。

8. Minimap2

  • 特点:高效的长读段比对工具,特别适用于PacBio和Nanopore数据,支持二代和三代测序数据。
  • 适用场景:基因组组装,长读段比对,跨物种比对。
  • 优势:支持序列到序列比对和序列到参考基因组比对,处理长读段和高错配率数据表现优异。