序列信息统计

开发者:huanan  |  更新于54 分钟前  |  浏览量 26

本工具为序列文件信息统计,包括序列文件中序列个数,序列总长度,序列总GC含量,N50,N90,contig的数目,scaffold数目,总gap的数目,以及每条序列的长度,GC含量和gap数量。

输出文件名由输入文件名决定,并以.xls为后缀。

参数信息
  1. 输入文件为fasta格式
相关数据
  • 使用说明
  • 结果说明
  • 重要提示
  • 版本信息
    1. 1. 输入fasta序列文件

    1. (1)fasta序列第一行是由">"开始的任意文字说明,用于序列标记,为了确保后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性;

    2. (2)fasta序列第二行是碱基ATCG/ATCU序列,核苷酸符号大小写均可。

    stat_fa.png


        demo数据下载:demo.fa




    1. 1. 输出结果

    1. (1)第一行为表头,分别为文件名,文件中所包含的序列数目,总序列长度,总GC含量,N50,N90,contig数目,scaffold数目,和文件中gap的数目;

    2. (2)第二行为表头对应的值;

    3. (3)每条序列的信息和总的统计结果用“#”隔开;

    4. (4)第四行为文件中每条序列的名字,每条序列长度,每条序列的GC含量,以及每条序列中的gap数目。


        示例数据:demo_count.xls


    1. (1) 输入文件必须为fasta格式文件;

  • 版本
    更新日期更新内容
    v1.1
    2020.10.25
    更新说明文档