PCA分析

开发者:oebiotech  |  更新于1 周前  |  浏览量 3357

主成分分析(Principal Component Analysis,PCA),是对原有的复杂数据进行降维,保持数据集中对方差贡献最大的特征,去除噪音和冗余,从而有效地找出数据中最“主要”的元素和结构,主要影响因素区分各个样本,根据样本远近展示样本/分组间的相似性和差异性。

默认情况:
1. 少于3个样本时,不进行主成分分析;
2. 默认条件下,不对数据做任何处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU;
3. 绘制置信椭圆,需添加样本分组信息文件,且组内生物学重复需为4个样本及以上;
4. 导出PCA分析中间结果,即各主成分数据矩阵;
5. 分析前请检查表头是否完整。

参数信息
  1. 输入文件,根据不同平台可为:探针表达量文件,counts,OTU 等。
  2. 数据过滤方式,默认方式为不对数据作处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU。

查看更多非必选参数

  1. 样品分组信息文件通常包含两列,第一列为样品名,第二列为各样品相应的分组名,表头须命名为“Group”。
  2. 设置绘制椭圆的置信水平,范围可选:0.5-0.95
  3. 设置绘制椭圆的背景透明度,范围可选:0-1
    字体类型,默认"Arial"
    字体样式,默认"无"
相关数据
  • 使用说明
  • 结果说明
  • 版本信息
  • 1. 矩阵文件(必选)

        矩阵文件为必填参数,第一列为探针/基因/OTU名称,其余各列为各样品中相应检测值。

    counts.png

        示例矩阵文件下载:counts.oecloud.xls


    2.样本分组信息文件(可选)

        示例文件为样本分组信息,需包含列名 "Group"。

    groupPCA.png

        示例样本分组信息文件下载:sample_group.oecloud.xls


  • 1. 图形输出

        结果生成pdf、png格式,PCA 2D图,使用主成分1(PC1:Principal component 1)和主成分2(PC2:Principal component 2)作为X轴和Y轴绘制散点图,分别提供无标签及添加标签形式。

    PCA_2D1.png

    PCA_2D.png

        PCA 3D图使用主成分1、主成分2和主成分3分别作为X轴、Y轴和Z轴绘制散点图。

    PCA_3D.png


        PCA 2D图,添加置信椭圆。

    PCA_2D_2.png


  • 版本
    更新日期更新内容
    v1.92020.09.27整合多平台主成分分析工具
    v1.9.12020.10.25添加置信区间椭圆相关参数
    v2.1.22020.11.04修改默认输出图片格式
    v2.1.32020.11.13针对目前所遇到的文件格式错误制定报错机制
    v2.1.42020.12.11

    添加字体参数-PCA-3D除外, 判断编码方式

    v2.1.5
    2020.12.26
    判断编码方式优化, 空数据矩阵检查, 导出pca中间结果
    v2.1.5.12020.12.28修复小bug