差异分析

开发者:yyq  |  更新于2 小时,1 分钟前  |  浏览量 538

本工具为差异分析,旨在找出不同样本间的差异表达情况。
利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理(采用BaseMean值来估算表达量),计算差异倍数,并采用NB(负二项分布检验的方式)对reads数进行差异显著性检验。
筛选标准:其一,FoldChange,即两样本中同一个基因表达水平的变化倍数;其二,pValue或qValue(adjusted pValue),qValue值的计算方法先要对每个基因进行 pValue 的计算,再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。

参数信息
  1. 通常使用2,必须大于0
  2. 测序数据类型,下拉选择

查看更多非必选参数

    字体类型,默认"Arial"
    字体样式,默认"无"
相关数据
  • 使用说明
  • 结果说明
  • 重要提示
  • 版本信息
    1. 1. 输入counts文件

        counts文件为必填参数,第一列为基因名称,其余各列为各样品中相应counts数目。

    counts_table.png


        demo数据下载1:counts_anno.xls  (附件中注释信息可以保留,不影响差异分析)

        demo数据下载2:counts.xls


    1. 2. 输入表达值矩阵

        表达值矩阵文件为必填参数,第一列为基因名称,其余各列为各样品中相应表达量。

    fpkm_table.png


        demo数据下载1:fpkm_anno.xls (附件中注释信息可以保留,不影响差异分析)

        demo数据下载2:fpkm.xls


    1. 3.差异分组文件

        必须按照示例样式填写,支持多个差异分组同时分析。

        case列:实验组样本,多个样本时请以英文逗号分隔

        case_name:实验组组名

        control列:对照组样本,多个样本时请以英文逗号分隔

        control_name:对照组组名

        replicate列:如有生物学重复,填写yes,无则no

        paired列:如为配对样本,则填yes,非配对为no;注意如果为配对分析,实验组对照组样本顺序必须一一对应且数目相等,最后一列差异分析方法必须用DESeq2

        method列:差异分析方法,可以为DESeq或DESeq2

    deg_group.png


        demo数据下载:diff_DEG_group.xlsx




    1. 1.差异热图

        每个差异分组均分别生成一张热图(注:绘制差异热图必须提供表达量文件,结果仅保存为pdf格式,故未显示在网页页面上,可从结果文件中下载获取)。


    1. 2.差异统计条形图

        多个分组时会同时展示在一张图中。


    1. 3.差异火山图

        每个差异分组均分别生成一张火山图。


    1. 4.差异未筛选文件

        如:A-vs-B-all.gene.xls。


    1. 5.差异筛选文件

        如:A-vs-B-diff-pval-0.05-FC-2.gene.xls。


    1.  (1) 请按照使用说明样式整理差异分组文件,多个样品名称以英文逗号分隔


    2.  (2) 输入数据矩阵中不允许存在重复基因,分析过程中程序将删除对应基因数据;


  • 版本更新日期更新内容
    v2.0.12020.12.25支持无表达量文件进行差异分析;图片字体修改;捕获文件格式错误信息并输出中文报错
    v1.3.52020.09.15兼容txt,xls,xlsx,csv等多种文件格式输入
    v1.3.42020.08.15添加差异热图,火山图,条形图,删除样本数量参数