PCA分析

搜索
开发者:zzk  |  更新于1 月,3 周前  |  浏览量 7699

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.cn.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
主成分分析(Principal Component Analysis,PCA),是对原有的复杂数据进行降维,保持数据集中对方差贡献最大的特征,去除噪音和冗余,从而有效地找出数据中最“主要”的元素和结构,主要影响因素区分各个样本,根据样本远近展示样本/分组间的相似性和差异性。

参数信息
  1. 输入文件,根据不同平台可为:探针表达量文件,counts,OTU 等。
  2. 数据过滤方式,默认方式为不对数据作处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU。

查看更多非必选参数

  1. 样品分组信息文件通常包含两列,第一列为样品名,第二列为各样品相应的分组名,表头须命名为“Group”。
  2. 设置绘制椭圆的置信水平,范围可选:0.5-0.95
  3. 设置绘制椭圆的背景透明度,范围可选:0-1
    字体类型,默认"Arial"
    字体样式,默认"无"
相关数据
  • 使用说明
  • 结果说明
  • 重要提示
  • 版本信息
  • 操作视频
    1. 1. 矩阵文件

        第一列为探针/基因/OTU名称,其余各列为各样品中相应检测值。(下图以基因reads数矩阵为例展示)


    counts.png


        demo数据下载:counts.oecloud.xls


    1. 2.样本分组信息文件(非必选)

        示例文件为样本分组信息,需包含列名 "Group"。


    groupPCA.png


        demo数据下载sample_group.oecloud.xls


    1. 1. 图形输出

        PCA 2D图,使用主成分1(PC1:Principal component 1)和主成分2(PC2:Principal component 2)作为X轴和Y轴绘制散点图,分别提供无标签及添加标签形式。

    PCA_2D1.png

    PCA_2D.png

        PCA 3D图,使用主成分1、主成分2和主成分3分别作为X轴、Y轴和Z轴绘制散点图。

    PCA_3D.png


        PCA 2D图,添加置信椭圆绘图示例如下:

    PCA_2D_2.png


    1. (1) 少于3个样本时,进行主成分分析;

    2. (2) 默认条件下,不对数据做任何处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU;

    3. (3) 绘制置信椭圆,需添加样本分组信息文件,且各组内生物学重复需为4个样本及以上

    4. (4) 导出PCA分析中间结果,即各主成分数据矩阵;

    5. (5) 请使用本工具前,按照输入示例文件格式对数据进行修改;


  • 版本更新日期更新内容
    v1.92020.09.27整合多平台主成分分析工具
    v1.9.12020.10.25添加置信区间椭圆相关参数
    v2.1.22020.11.04修改默认输出图片格式
    v2.1.32020.11.13针对目前所遇到的文件格式错误制定报错机制
    v2.1.42020.12.11

    添加字体参数-PCA-3D除外, 判断编码方式

    v2.1.5
    2020.12.26
    判断编码方式优化, 空数据矩阵检查, 导出pca中间结果
    v2.1.5.12020.12.28修复小bug
    v2.4.02021.01.22报错日志oeweb_task.log


  • 问题反馈