本工具根据提供的位点和序列,提取位点前后固定长度的序列。 输出文件名以输入文件名决定,并以.xls为后缀。
本工具根据提供的位点和序列,提取位点前后固定长度的序列。
输出文件名以输入文件名决定,并以.xls为后缀。
1. 输入位点文件
(1)第一列为位点所在的染色体;
(2)第二列为位点所在染色体中的位置。
demo数据下载:site_pos.xls
2. 输入fasta序列文件
(1)第一行是由“>”开始的任意文字说明,用于序列标记,为了确保后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性;
(2)第二行是碱基ATCG/ATCU序列,核苷酸符号大小写均可。
demo数据下载:site_pos.fa
1. 输出结果示例(位点前后长度为400)
(2)第二列为位点所在染色体中的位置;
(3)第三列为位点提取的上游序列区域,若超出序列的长度,位点区域最小值为1;
(4)第四列为位点提取的上游序列;
(5)第五列为位点提取的下游序列区域,若超出序列的长度,位点区域最大值为该条序列的最大值;
(6)第六列为位点提取的下游序列。
示例结果:site_pos_seq.xls
(1) 输入序列文件必须为fasta格式文件;