FASTA

FASTA は、DNA塩基配列タンパク質アミノ酸配列のシーケンスアラインメントを行うための、バイオインフォマティクスソフトウェアパッケージである。

FASTA と同様にシーケンスアライメントを行うためのソフトウェアとして、BLAST なども知られる。

最初のバージョンは FASTP という名前であり、デヴィッド・J・リップマンとウィリアム・R・ピアスンが、1985年に開発して論文を発表した[1]

当初はタンパク質のアミノ酸配列のシーケンスデータベースに対して、アミノ酸配列の類似性 (similarity) の検索を行うように設計された。FASTA の1988年のバージョンでは、DNAの塩基配列の類似性を検索する機能が加えられた[2]。FASTA は FASTP よりも精巧なアルゴリズムで処理を行い、統計上の有意性を評価する。FASTA ソフトウェアパッケージには、タンパク質のアミノ酸配列やDNAの塩基配列のアライメントを行うための、いくつかのプログラムが含まれている。

FASTA は、"FAST-Aye"(ファストエー)と発音する。FASTA は、"FAST-P"(Protein; タンパク質)アライメント と "FAST-N"(Nucleotide; ヌクレオチド)アライメント の総称である、"FAST-All" を意味している。

FASTA ソフトウェアパッケージの現在のバージョンでは、次のようなことができる。なお、シーケンスデータベースに与える検索のシーケンスをクエリーという。

  • 塩基配列クエリーで塩基配列データベースを検索
  • 塩基配列クエリーをアミノ酸配列に翻訳してアミノ酸配列データベースを検索
  • アミノ酸配列クエリーでアミノ酸配列データベースを検索
  • アミノ酸配列クエリーで塩基配列データベース(アミノ酸配列に翻訳)を検索
  • 複数のペプチド(短いペプチド鎖)をクエリーとしてアミノ酸配列データベースを検索

フレームシフト突然変異を考慮した検索も可能である。Smith-Watermanアルゴリズムを実装した SSEARCH でのシーケンスデータベースの検索・比較をすることもできる(処理速度は遅くなる)。

FASTA ソフトウェアパッケージの主な用途は、類似性の精密な統計値を計算することである。類似性の統計値を計算することにより、生物学者は、どのアライメントが妥当性が高いかを判断することや、相同性 (homology) を推測することができる。

FASTA ソフトウェアパッケージは、ヴァージニア大学のFTPサーバから提供されている。

  1. ^ Lipman, D. J.; Pearson, W.R. (1985). "Rapid and sensitive protein similarity searches." Science 227 (4693): 1435–1441. PMID 2983426.
  2. ^ Pearson, W.R.; Lipman, D. J. (1988). "Improved tools for biological sequence comparison." Proc. Natl. Acad. Sci. USA 85 (8): 2444–2448. PMID 3162770

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search