序列提取

开发者:沈毅田  |  更新于2 周,6 日前  |  浏览量 28

提取fasta序列文件中特定基因的序列。 (仅支持200Mb以下文件)

参数信息
  1. 输入基因名,可通过回车或者逗号分隔
  2. 输入一个.fa或.fasta序列文件,用于查找。如gene.fa, Unigene.fa

查看更多非必选参数

  1. 设置每行长度,默认为70
相关数据
  • 使用说明
  • 结果说明
  • 重要提示
  • 版本信息
  • 1. 输入序列文件(fa 或者 fasta)

    1. (1)第一行是由“>”开始的任意文字说明,用于序列标记,为了确保后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性;

    2. (2)第二行是碱基ATCG/ATCU序列,核苷酸符号大小写均可。

    3. QQ图片20210525165943.png

    4. demo数据:gene.fa

    2. 文本框输入

        请用换行分隔基因名,否则可能会造成匹配失败。

        输入框输入:

        TRINITY_DN0_c0_g1_i1_2

        LOC112268260

        MEI4

        IRAK1BP1

        ROR2

        Isoform_85535

        !!!

        12345

        欧易生物

           

  • 1. 结果示例1

            首先会返回一个含匹配到的基因名及序列的output.fa文件,结果如下:
                    Q4.png

    2. 结果示例2

              若存在未匹配成功的基因,则会生成一个unfound_genes.txt文件。

              其中包含了所有未匹配到的基因名。结果如下(顺序不定,""""""可忽视):

                    image.png


  • 1. 基因名间用换行符相隔,否则可能会造成匹配不准确

  • 版本
    更新日期版本信息
    v0.1
    2021.05.26
    更新说明文档