文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------
聚类热图(Cluster heatmap)常用于大数据表数据关系的可视化展示,以便快速阅读和发现规律。
任务正在排队中,目前后台任务排队数量:
当前任务开始运行后预计需要耗时
请勿重复提交任务!程序正在运行中,预计需要耗时
程序运行出错,报错信息如下:
玩转攻略可点击公众号推文:5分钟教你使用欧易云快速进行聚类热图绘制
1. 表达量矩阵文件
第一列为基因/蛋白/代谢物名称,其余各列为各样品中相应表达量。如果表达量矩阵文件中存在空值的情况,请补充完整后再分析。
demo数据下载:fpkm.3rep.xlsx
2. 样本分组信息文件(非必选)
第一列为样本分析名称"Sample", 与表达量矩阵列名保持一致,第二列为分组名称"Group"(注意列名首字母的大小写)。
demo数据下载:group.xlsx
3. 注释信息文件(非必选)
第一列为特征名称, 与表达量矩阵行名保持一致,其余各列为特征的注释信息(注意列名首字母的大小写)。
demo数据下载:phenotype.xlsx
4. 分组配色方案
1. 图形输出
示例图片为默认参数下的聚类热图。示例图片中,一个小方格代表一个基因,其颜色代表该基因表达量大小,红色表示高表达基因,蓝色表示低表达基因。图片上方树形图表示来自不同实验分组的不同样品的聚类分析结果,左侧树状图表示对来自不同样本的不同基因的聚类分析结果。
示例图片为添加分组信息和注释信息且不对行进行聚类。
2. 表格输出
若选择行/列聚类,将输出聚类后顺序文件,“heatmap.reorder_cluster_result.xls”。示例图片中,基因名顺序已为聚类分析后排序,并补充各样本原表达量信息。
(1) 尽量新建全新的excel文件进行数据筛选,不在源文件操作。
(2) 少于2个样本时,不绘制热图;仅2个样本时,不对数据进行行标准化;
(3) 默认条件下,行列聚类,输出聚类后排序列表;当行不聚类时,限制绘图特征数目(数据量)不能多于 65536 个;当行聚类时,特征数目(数据量)不能多于14000个;
(4) 若显示特征名称时,字符串太长,可选择对字符串(70个字符)进行截取;
(5) 某特征在所有样本中数值相等(方差等于0)时将自动删除,并提供oeweb_task.log日志文件;
(6) 存在相同特征时,将自动计算表达量之和且保留高表达特征,并提供oeweb_task.log日志文件;
(7) 分析前请检查数据是否完整,不允许有空值。
(8) 数据预处理(log化)公式:pre_data = log(data + 1) ,当数据中存在负数时,请选择"默认无需处理";
(9) 行标准化方式默认为 zscore 标准化。
(10) 一款简单易操作的编辑器:Notepad++,下载地址:https://notepad-plus-plus.org/
(11) 修改文件可进行以下操作:
在原始转录组报告结果(未进行修改)中,单击右键,以notepad++方式打开文件;
新建excel文件,选中第一列,在"单元格格式"中选择"文本";
复制文本打开的源文件内容,粘贴到excel文件中,保存后进行修改。
(12) 修改文件切记:删除-整行/整列,而非按退格键或"清除内容"。
版本 | 更新日期 | 更新内容 |
---|---|---|
v1.8 | 2020.09.18 | 整合多平台聚类热图工具 |
v1.9 | 2020.09.27 | 修复数据框报错问题 |
v1.9.1 | 2020.10.23 | 添加图片高宽参数 |
v2.1.1 | 2020.10.28 | 添加格子高宽,行列字符大小,归一化参数 |
v2.1.2 | 2020.11.04 | 添加长字符截取参数,重复id保留表达量高者并输出warning文件 |
v2.1.3 | 2020.11.13 | 针对目前所遇到的文件格式错误制定报错机制 |
v2.1.4 | 2020.12.11 | 添加字体参数, 判断编码方式 |
v2.1.5 | 2020.12.26 | 判断编码方式优化, 空数据矩阵检查, 非负数进行log化抛出报错 |
v2.1.6 | 2020.01.07 | 数据检查顺序调整,cutree判断修改 |
v2.2.0 | 2020.01.11 | 行名替换代码修改 |
v2.3.0 | 2021.01.22 | 报错日志oeweb_task.log;检查方差值是否异常 |
v2.4.0 | 2021.02.01 | 画布长宽限制为正数 |
V1.01 | 2021.03.07 | 修改log化计算方式 |
V1.05 | 2021.11.15 | 添加图形标题参数, 修改日期型基因的匹配形式, 增加聚类树指定排序功能; 添加色系蓝白红-2 |
V1.06 | 2021.11.16 | 修复列聚类bug |
V1.08 | 2021.11.24 | 修复列聚类与重排参数逻辑出现的bug |
v1.09 | 2022.1.19 | 增加分组颜色方案,修改pdf不能出图,自适应图片大小调整部分参数默认值 |
v1.10 | 2022.1.26 | 页面显示报错,增加图例最大值和最小值 |
v1.26 | 2022.8.9 | 增加筛选基因等功能 |