文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
本工具用于box-plot及小提琴图 (Violin Plot),适用于组别为2组及以上,组内有生物学重复的数据集。
箱线图(Box-plot)又称为箱形图,是一种用作显示一组及多组数据分布情况的统计图形。其名称来源于其形状类似于箱子。箱线图除了可以反映出一组原始数据的分布特征,还可以通过联合作图进行多组数据分布特征的比较。
箱线图的绘制方法是:先找出及计算出每组数据的最大值、最小值、上四分位数、下四分位数和中位数这五个描述分布的参数(除去离群点);然后从上四分位数和下四分位数出发延伸出两条横向线段作为上底边和下底边绘制一个矩形(形状像箱子),再从中位数出发延伸出一条横向线段将矩形分割成上下两部分;最后从上四分位数和下四分位数出发延伸出两条纵向线段至最大值和最小值。
小提琴图 (Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。与箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。
任务正在排队中,目前后台任务排队数量:
当前任务开始运行后预计需要耗时
请勿重复提交任务!程序正在运行中,预计需要耗时
程序运行出错,报错信息如下:
1. 特征丰度文件
例如alpha指数矩阵文件,第一列为样本名,其余列为alpha多样性指数,至少一列指数(特征)数据(注意列名Sample的首字母大写)。
demo数据下载:alpha_estimator_summary.xls
2. 样品分组信息文件
样本分组信息文件,第一列为样本分析名需要与alpha指数文件中的样本分析名一致,第二列为分组名,且表头名称必须为Sample及Group(注意列名的首字母大写)。
demo数据下载:mapping.xls
1. boxplot图解
结果图将展示多样性指数在各个组的分布情况(以箱线图的形式),以及多样性指数在组间差异是否显著(如果组内无重复样则不能分析)。其中横坐标为分组,不同组用不同颜色区分,纵坐标为指数值。在上图中,每一个矩形的上底边和下底边代表该组多样性指数的上四分位数和下四分位数;矩形中间的横线段代表该组多样性指数的中位数;从下底边和上底边延伸出去的两条线段的端点代表最小值和最大值;细黑线表示须。
重要提示:
(1) 输入文件格式为(支持txt、xls、xlsx格式);
(2) 五组以下标记ns为无差异;
(3) 适用于组别为2组及以上,组内有生物学重复的数据集;
(4) ANOVA检验:适用场景为 >=3 组的比较,每组>=3个样本;数据符合正态分布的情况下可用;
(5) Kruskal Wallis检验:适用场景为 >=3 组的比较,每组>=3个样本;数据不符合正态分布的情况下可用;
(6) T test检验:适用场景为 2 组的比较;数据符合正态分布的情况下可用;
(7) Wilcoxon检验:适用场景为 2 组的比较;数据符合不正态分布的情况下适用;
版本 | 更新日期 | 更新内容 |
v1.1 | 2020.10.25 | 更新说明文档 |
v2.7 | 2021.04.23 | 删除Rplots.pdf |
v3.6 | 2021.06.29 | debug 下标出界问题,check mapping.txt 与输入文件样本分析名的一致性 |
v3.9 | 2022.02.28 | 开放字体大小调整参数,开放是否显示非显著的标记参数 |
v3.9.1 | 2022.03.14 | 问题修复 |
v5.2 | 2022.06.01 | 增加T检验 |
v4.4.7 | 2023.01.04 | 接受空值样本,剔除对应物种 |
v4.5.2 | 2023.02.21 | 增加ANOVA检验,增加ANOVA检验和kruskal wallis检验添加显著性标识功能 |
v4.5.7 | 2023.05.16 | 建议优化,报错优化 |