序列信息统计

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.cn. -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 本工具为序列文件信息统计,包括序列文件中序列个数,序列总长度,序列总GC含量,N50,N90,contig的数目,scaffold数目,总gap的数目,以及每条序列的长度,GC含量和gap数量。 输出文件名由输入文件名决定,并以.xls为后缀。

参数调整

输入文件为fasta格式,文件大小不能超过200M
提交 重置

结果与说明

工具预估运行时间为 {{ run_time }}

程序运行出错,报错信息如下:

请检查数据文件格式后重新提交运行

结果下载

本次分析未能正常生成结果文件,请核对输入信息或者参考使用说明进行使用!

  1. 1. 输入fasta序列文件

  1. (1)fasta序列第一行是由">"开始的任意文字说明,用于序列标记,为了确保后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性;

  2. (2)fasta序列第二行是碱基ATCG/ATCU序列,核苷酸符号大小写均可。


stat_fa.png


    demo数据下载:demo.fa




  1. 1. 输出结果

  1. (1)第一行为表头,分别为文件名,文件中所包含的序列数目,总序列长度,总GC含量,N50,N90,contig数目,scaffold数目,和文件中gap的数目;

  2. (2)第二行为表头对应的值;

  3. (3)每条序列的信息和总的统计结果用“#”隔开;

  4. (4)第四行为文件中每条序列的名字,每条序列长度,每条序列的GC含量,以及每条序列中的gap数目。


    demo结果下载:demo_count.xls


  1. (1) 输入序列文件必须为fasta格式文件;

版本
更新日期更新内容
v1.1
2020.10.25
更新说明文档


问题反馈