シーケンスをFASTAに変換する方法

医学研究における一般的な目標の1つは、遺伝的疾患を引き起こす可能性のあるDNA配列の誤差または突然変異の特定です。テクノロジーとコンピューターサイエンスは、数千のシーケンスデータを同時に分析できるレベルまで、遺伝的研究を進めています。新しいソフトウェアの1つの規定は、シーケンスデータをFASTA形式に事前に変換することです。 FASTAは、単純なテキスト形式に似ています。複数のデータを単一のファイルにコンパイルし、分析を加速させることができます。ただし、ほとんどの機器はテキスト形式でシーケンスファイルを生成します。テキストをFASTA形式に変換することは、テキストエディターソフトウェアを使用した単純なプロセスです。

<ヘッダー>

必要なもの

  • コンピュータ
  • テキストエディタープログラム
もっと見せてください

手順

    • 1

      テキスト編集プログラムを使用して、指定されたDNAシーケンステキストファイルを開きます。これは、Macintoshのテキストエディターと、Windows互換システム用のメモパッドです。元のシーケンステキストファイルには、Applied Biosystems Automated Genetic Analyzerで生成されたデータのSEQなどの代替拡張機能があります。

    • 2

      > [シーケンス識別子]を入力して、最初の行を開始します。シンボルより大きいものは、FASTAデータを分析するプログラムのFASTA形式を指定します。スペースがない限り、識別子に関する特定のルールはありません。最初の行の許容可能なエントリの例は、> cat_isomerase_exon3。

      です。
    • 3

      「戻り」キーを押して、ラインブレークを作成し、2行目を開始します。

    • 4

      2行目のシーケンスデータを開始します。 FASTA形式のガイドラインでは、純粋な化学と応用化学の国際連合、IUPAC、コードに続くDNAテキストデータが必要です。各ラインは、80のDNAベースを表す80文字に制限されており、高度または小文字にすることができます。混合ベースを含む許容可能なエントリは、agcttcgtgg ... cvtgcgttgt。

      です
    • 5

      「戻り」キーを押して、次のシーケンスデータを開始します。各行は、IUPACコードで表される80のベースで構成する必要があります。

    • 6

      TXTファイル拡張子または適切なFASTAファイル拡張子を使用してファイルを保存します。 FASTAフォーマットされたデータを処理するプログラムは、多くの場合、FSA、FNA、FFN、FRNなどのFASTA固有の拡張機能を必要とします。



ヘルスケア業界(一般) - 関連記事