欧易集团云平台

聚类热图

539221

查看

聚类热图（Cluster heatmap）常用于大数据表数据关系的可视化展示，以便快速阅读和发现规律。

火山图

186845

查看

火山图（Volcano Plot）是一类用来展示组间差异数据的图像，可以方便直观的展示两组样本间差异表达基因/蛋白/代谢物的分布情况。

GO-KEGG气泡图

177324

查看

本工具为绘制气泡图，用于展示富集分析结果中P值最小的前N个功能或者通路。通过气泡图，可以生动地展示富集分析结果中的各个关键统计量，从而在一张图上呈现更多的信息。其中Y轴对应功能或者通路，X轴表示特定通路中的差异基因和通路中所有基因的比值，气泡的大小表示该通路中差异基因的多少，气泡颜色由紫-蓝-绿-红变化，其富集 pValue 值越小，显著程度越大。

Venn图

122771

查看

Venn图，又称韦恩图或文氏图，是一种用于直观表示元素集合重叠的一种图形。 Venn图在生物信息学领域常用于展示样品不同分组间共有和特有的基因、OTU和分类单元等。

富集分析

121713

查看

该工具功能包括GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)的富集分析。 GO：其中Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类：生物学过程（Biological Process，BP）表示一个分子活动事件的过程,包括细胞、组织、器官和物种的功能集合，往往也是和实验研究问题关联程度最高的一类；细胞组分（Cellular Component，CC）表示细胞或其所处的外界环境；分子功能（Molecular Function，MF）是描述在分子水平上基因产物的活性元件。 KEGG: Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能，联系基因组信息和功能信息的数据库。该小工具除了支持人、大鼠和小鼠物种外还支持对含有背景文件的物种进行富集分析。

PCA分析

104867

查看

主成分分析（Principal Component Analysis，PCA），是对原有的复杂数据进行降维，保持数据集中对方差贡献最大的特征，去除噪音和冗余，从而有效地找出数据中最“主要”的元素和结构，主要影响因素区分各个样本，根据样本远近展示样本/分组间的相似性和差异性。

物种累计柱状图

90768

查看

本工具为绘制累计柱状图，柱状图是一种以矩形的长度（高度）为变量的统计图表，只包含一个变量，从形式上又可以划分为累计柱状图和躲避式柱状图等不同类型。我们以物种在样本中所占的比例作为变量，横坐标为样本，以累计柱状图的方式展现每个样本中各物种的比例。如果提供了样本分组信息，还可以通过组内求平均的方式展现每个分组的物种比例。

GSEA分析

81334

查看

基因集富集分析 (Gene Set Enrichment Analysis, GSEA)是一种用于确定一组预先定义的基因是否在两种生物状态（例如表型）之间显示出统计上显著的或一致的差异的计算方法。其分为三个步骤,分别为计算富集分数、估计富集分数显著性水平和矫正多重假设验证。 GESA常使用两大基因集合数据库：（1）GO：Gene Ontology(GO)数据库提供了专业的术语来定义基因产物的属性。它包含三大类：生物学过程（Biological Process，BP）；细胞组分（Cellular Component，CC）；分子功能（Molecular Function，MF）（2）KEGG：Kyoto Encyclopedia of Genes and Genomes (KEGG)是系统分析基因功能，联系基因组信息和功能信息的数据库。 GSEA也支持自定义基因集合，例如miRNA靶标关系对集合

LEfSe分析

63780

查看

LEfSe分析即 Linear discriminant analysis Effect Size 分析，是一种用于发现和解释高维度数据生物标志物的分析工具，可以进行两个或多个分组的比较，它强调统计意义和生物相关性，能够在组与组之间寻找具有统计学差异的生物标志物（Biomarker）。 A.首先在多组样本中采用的非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种； B.再利用上一步中获得的显著差异物种，用成组的Wilcoxon秩和检验来进行组间差异分析； C.最后用线性判别分析（LDA）对数据进行降维和评估差异显著的物种的影响力（即 LDA score）。

PCoA主坐标分析

58576

查看

PCoA（principal co-ordinates analysis）是一种研究数据相似性或差异性的可视化方法，通过一系列的特征值和特征向量进行排序后，选择主要排在前几位的特征值，PCoA 可以找到距离矩阵中最主要的坐标，结果是数据矩阵的一个旋转，它没有改变样品点之间的相互位置关系，只是改变了坐标系统。通过PCoA 可以观察个体或群体间的差异。

差异分析

55518

查看

本工具为差异分析，旨在找出不同样本间的差异表达情况。利用R中的DESeq或DESeq2包对各个样本的counts 数目进行标准化处理（采用BaseMean值来估算表达量），计算差异倍数，并采用NB（负二项分布检验的方式）对reads数进行差异显著性检验。筛选标准：其一，FoldChange，即两样本中同一个基因表达水平的变化倍数；其二，pValue或qValue（adjusted pValue），qValue值的计算方法先要对每个基因进行 pValue 的计算，再用 FDR 错误控制法对 pValue 作多重假设检验校正。默认筛选差异的条件为 p<0.05 且差异倍数≥2。

GO富集条形图

53885

查看

本工具为绘制（GO或KEGG）富集基因上下调关系条形图。 Gene Ontology(GO) 数据库提供了专业的术语来定义基因产物的属性。它包含三大类：生物学过程（Biological Process, BP）表示一个分子活动事件的过程，包括细胞、组织、器官和物种的功能集合，往往也是和实验研究问题关联程度最高的一类；细胞组分（Cellular Component, CC）表示细胞或其所处的外界环境；分子功能（Molecular Function, MF）是描述在分子水平上基因产物的活性元件。