申請表 上下載資料 提問
軟體名稱 主要功能 功能分析 參考文獻
BLAST Long reads alignment
  • BLAST是用來尋找不同序列中相似的區域。這個程式把胺基酸或蛋白質序列與資料庫的序列比對後,計算他們在統計上為一樣序列的顯著性。
  • BLAST可以用來指出一個序列可能有的功能以及與其他序列在演化上的關系,並且能夠協助找出gene family 中的成員。
優點
  • 在比對較為divergent的序列時,結果較BLAT好。
缺點
  • 速度慢
原始文獻 原始使用說明
BLAT Long reads alignment BLAT與BLAST功能類似但較快速。BLAT可快速地找出相似度95%以上,長度在40 bases以上的DNA序列。在比較蛋白質序列上,BLAT可找出相似度80%以上,長度在20 bases以上的序列。 優點
  • DNA Blat 在比對人類以及靈長類的序列上表現不錯;而protein Blat 在比較 陸生脊椎動物之間也有不錯的結果。當比對相似(物種)的序列時,速度比BLAST快很多,也比較準確。mRNA/DNA alignment 快 500 倍, protein alignments 快50 倍。
缺點
  • 對於比對較divergent 或較短的序列(<40 nucleotides或 <20 amino acids)時,會比BLAST漏掉較多可能的配對。
原始文獻:
  • Kent WJ. BLAT - the BLAST-like alignment tool. Genome Res. 2002 Apr;12(4):656-64.
原始使用說明
MUMMER Genome-wise alignment SNP discovery Repeat discovery 優點
  • 有不同的 pipeline處理不同的情況:
    • run-mummer1:align相似度高但沒有rearrangement的序列
    • run-mummer3: align相似度高有rearrangement的序列
    • Nucmer: align相似度普通的序列
    • Promer: align相似度低的序列. Promer 會根據DNA 轉譯出來的蛋白質序列來作alignment。
  • 速度快-當使用對的 pipeline ,mummer 可在30秒內 align兩條 3M~4M 的sequence。.
  • Mummer 包含可視化的modules
缺點
  • 最大的reference長度為 537MB,最大的 query 長度為 430MB
原始文獻:
  • Versatile and open software for comparing large genomes. S. Kurtz, A. Phillippy, A.L. Delcher, M. Smoot, M. Shumway, C. Antonescu, and S.L. Salzberg, Genome Biology (2004), 5:R12.
  • Fast Algorithms for Large-scale Genome Alignment and Comparision. A.L. Delcher, A. Phillippy, J. Carlton, and S.L. Salzberg, Nucleic Acids Research (2002), Vol. 30, No. 11 2478-2483.
  • Alignment of Whole Genomes.  A.L. Delcher, S. Kasif, R.D. Fleischmann, J. Peterson, O. White, and S.L. Salzberg,Nucleic Acids Research, 27:11 (1999), 2369-2376.
  • Reducing the Space Requirement of Suffix Trees. S. Kurtz, Software-Practice and Experience, 29(13): 1149-1171, 1999.
原始使用說明
Soap2 Aligner Short reads alignment
  • 速度快
  • 可使用illumina 和 SOLiD 的數據.
  • 可多執行緒(mutithreading)
  • 支援最長 60bp的gapped 和ungapped read。
原始文獻:
  • SOAP2: an improved ultrafast tool for short read alignment. Li, Ruiqiang, et al. Bioinformatics 25.15 (2009): 1966-1967.
原始使用說明
Bowtie Short reads alignment/mapping
  • 速度快
  • 可使用illumina 和 SOLiD 的數據.
  • 可多執行緒(mutithreading)
原始文獻:
  • Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology10:R25. 

  • Langmead B, Schatz M, Lin J, Pop M, Salzberg SL.Searching for SNPs with cloud computing. Genome Biology 10:R134. 

  • Trapnell C, Pachter L, Salzberg SL, TopHat: discovering splice junctions with RNA-Seq.Bioinformatics 2009 25(9):1105-1111.
原始使用說明
BWA 測試資料 Short/Long reads alignment/mapping
  • 可使用 illumina, SOLiD 和 454 的數據
  • 輸出結果分為mapped和unmapped的reads, 較方便分別處理
  • BWA比bowtie and soap2 速度慢但是比較sensitive.
原始文獻:
  • Short reads alignment:
    Li H. and Durbin R. (2009) Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 25:1754-60.
  • Long reads alignment:
    Li H. and Durbin R. (2010) Fast and accurate long-read alignment with Burrows-Wheeler Transform. Bioinformatics, Epub.
原始使用說明
MAQ Short reads Alignment/mapping Assembly SNP discovery 優點
  • 主要為Illumina-Solexa 1G Genetic Analyzer 所設計。但也可handle ABI SOLiD之功能
缺點
  • 只可map小於63bp的reads
  • 所有read必需等長
  • 不能用454的data
  • 由single end reads得到的 snp 不太準確
  • 整個reference genome(例如,所有染色體)必需放到單一個 fasta file.
原始文獻:
  • Li, H., Ruan, J. & Durbin, R. Mapping short DNA sequencing reads and calling variants using mapping quality scores. Genome research 18, 1851-8 (2008).
原始使用說明
Mosaik Aligner Short/Long reads alignment/mapping Assembly(only version 1.X have assembly module) 優點
  • 可選執行緒數量
  • 速度快,在8個processor cores align 2百萬條Illumina 36 bp reads只要8分鐘
  • 可align 的read長度很廣-從short Illumina reads 到 medium 454 reads至 long legacy Sanger reads 均可
  • Co-assembly – 可組合reads來自多個不同的 sequencing technologies (Illumina, Roche 454, AB SOLiD, Helicos, and Sanger)
  • Reference-guided aligner –使用整個 genome 作為 reference 當 aligning reads時
  • Gapped alignment – 特別是在偵測insertion跟deletion時
  • 可多執行緒(mutithreading)
原始文獻:
  • Hillier, L., Marth, G., Quinlan, A. & Dooling, D. Whole-genome sequencing and variant discovery in C. elegans. Nature methods 5, 183-8 (2008).
  • Sackton, T.B. et al. Population genomic inferences from sparse high-throughput sequencing of two populations of Drosophila melanogaster. Genome biology and evolution 1, 449-65 (2009).
原始使用說明
SSAHA2 Long reads alignment/mapping 優點
  • 支持很多樣的sequencing platforms(ABI-Sanger, Roche 454, Illumina-Solexa)
  • 很多樣化的output 格式- SAM,CIGAR,PSL
原始文獻:
  • SSAHA: a fast search method for large DNA databases.Ning Z, Cox AJ and Mullikin JC, Genome research 2001
原始使用說明
SAMtools Tools for manipulating file SAM formate
  • SAMtools 提供很多種用來操作BAM格式 的工具,包含了sorting, merging, indexing 和頡取特定區域的alignments。並且可由SAM格式輸入或輸出資料。
  • Samtools也可以從遠端的FTP or HTTP server 直接讀取BAM (not SAM) file, 只要檔案的開頭為‘ftp://’ 或 ‘http://’
原始文獻:
  • Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9.
原始使用說明
Cufflinks Transcript abundances estimation
  • Cufflinks 使用RNA-Seq reads 去align及assemble出不同的transcripts版本,然後計算不同版本的transcripts在表現上的相對比例。
  • 另外有模組可以比較多個sample的結果,用以找出表現及調控上有差異的基因。
  • 可多執行緒(mutithreading)
原始文獻:
  • Trapnell C, Williams BA, Pertea G, Mortazavi AM, Kwan G, van Baren MJ, Salzberg SL, Wold B, Pachter L.Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation 
    Nature Biotechnology doi:10.1038/nbt.1621
  • Roberts A, Trapnell C, Donaghey J, Rinn JL, Pachter L.Improving RNA-Seq expression estimates by correcting for fragment bias 
    Genome Biology doi:10.1186/gb-2011-12-3-r22
  • Roberts A, Pimentel H, Trapnell C, Pachter L.Identification of novel transcripts in annotated genomes using RNA-Seq 
    Bioinformatics doi:10.1093/bioinformatics/btr355
原始使用說明
GSNAP Genomic Short-read Nucleotide Alignment
  • GSNAP 可以 align 小至14 nt 的single-end 及 paired-end reads。
  • GSNAP可以利用機率模型或已知的splicing site偵測長距離及短距離的splicing, 包括interchromosomal splicing。
  • 可多執行緒(mutithreading)
 
原始文獻:
  • GMAP: a genomic mapping and alignment program for mRNA and EST sequences. Thomas D. Wu and Colin K. Watanabe. Bioinformatics 2005 21:1859-1875 
  • Fast and SNP-tolerant detection of complex variants and splicing in short reads. Thomas D. Wu and Serban Nacu. Bioinformatics 2010 26:873-881 
原始使用說明
AMOS Assembler development tool AMOScmp is a reference assembler AMOS是用於開發assembler的工具,其中AMOScmp是用AMOS寫成的reference assembler 原始文獻: Treangen, Todd J., et al. "Next generation sequence assembly with AMOS."Current Protocols in Bioinformatics (2011): 11-8. 原始使用說明

 

生物小組

服務申請表

NGS網站