PICRUSt2

搜索
开发者:ly  |  更新于3 周前  |  浏览量 106

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.cn.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PICRUSt2 基于标记基因序列预测功能丰度,“功能”通常是指基因家族,如 KEGG 同源,COG,酶分类号和代谢通路等,预测通常基于16S rRNA 基因测序数据,但也可以使用其他标记基因。分析步骤如下:

[1]. OTU/ASV 序列与数据库参考序列比对,获得比对结果。
[2]. 利用序列插入算法,从数据库序列系统进化树,获得 OTU/ASV 系统进化树。
[3]. 根据数据库参考序列功能基因 copy 数,计算 OTU/ASV 功能基因 copy 数。
[4]. 根据样本的 OTU/ASV 丰度计算每个样本功能基因的丰度。
[5]. 预测 pathway 丰度。

参数信息
  1. OTU 或 ASV 的丰度文件,例如微生物多样性报告 result\2.OTUs\OTUs.xls 或 result\2.OTUs\otu_table.biom
  2. OTU 或 ASV 代表序列文件,例如代表序列 fa 文件或代表序列 xls 文件如微生物多样性报告 result\2.OTUs\rep_seqs_tax.xls
  3. 样本分组信息文件,第一列为样本名,与丰度文件中样本名一致,第二列为分组名。

查看更多非必选参数

    基因聚类可展示出变量间的表达模式相似度
    样本聚类可展示出不同样本/分组间的相似度,用于考察数据质量、重复性等
    字体类型,默认"Arial"
    字体样式,默认"无"
  1. 图片格式,默认"pdf"
相关数据
  • 示例文件
  • 结果说明
  • 重要提示
  • 版本说明
    1. 1. OTU/ASV 丰度文件

        第一列为 OTU/ASV ID,随后为样本分析名(支持biom、txt、xls格式),各列对应值为物种在样本中的相对丰度。


    OTU tabel.png

    1. demo数据下载:OTUs.xls



    2. 2. OTU/ASV 代表序列文件

    3. 代表序列 fa 文件:第奇数行 OTU/ASV ID,偶数行为代表序列信息

    4. rep_set.fa.png

    代表序列 xls 文件:第一列为 OTU/ASV ID,第二列为物种注释信息,第三列为可信度打分,第四列为代表序列ID,第五列为序列信息。

    代表序列.png

    1. demo数据下载:rep_seqs_tax.xls

    2. 3. 样本分组信息文件

              第一列为样本分析名,第二列为样本的分组名称(支持txt、xls、xlsx格式)

    mapping.png


       demo数据下载:mapping.xls


  • 功能注释结果有5类:

    KEGG 同源,提供 KO 统计表及 KEGG_L1,KEGG_L2 和 KEGG_L3 统计结果,KO heatmap 图。

    COG,提供 COG 统计表,COG heatmap 图。

    酶分类号,提供 EC 统计表,EC heatmap 图。

    代谢通路,提供通路统计表,代谢通路 heatmap 图。

    同时提供各功能组别间差异统计结果:

    两组比较提供 T-test 及 Wilcoxon 算法,两组以上比较提供 ANOVA 及 kruskal_walli 算法。

    KEGG,提供 KO,KEGG_L1,KEGG_L2 和 KEGG_L3 差异统计结果,差异结果 heatmap 图和 Top10 boxplot 图。

    COG,提供 COG 差异统计结果,差异结果 heatmap 图和 Top10 boxplot 图。

    酶分类号,提供 EC 差异统计结果,差异结果 heatmap 图和 Top10 boxplot 图。

    代谢通路,提供通路差异统计结果,差异结果 heatmap 图和 Top10 boxplot 图。

    各功能差异统计结果文件 diff_stat.xls。

    备注:heatmap 画图条件,至少2个功能条目。


    结果文件夹图1.png



    结果文件夹2.png


    1.功能丰度表

       第一列为功能 ID 例如 KO,COG,pathway 或者 EC;第二列为功能注释信息,其他列为样本名,各列对应值为丰度。


           

    功能丰度.png


     2. KEGG Level 丰度表

         第一列为 KEGG Level1/Level2/Level3 注释信息,其他列为样本名,各列对应值为丰度。


    KEGG注释.png


    3. 功能差异统计表

         第一列为功能 ID 例如 KO,COG,pathway 或者 EC;第二列为 Test 统计值,第三列为 P 值,第四列和第五列为矫正 P 值,其他列为各组均值。

    差异统计3.png


    5. KEGG Level 差异统计表

         第一列为 KEGG Level1/Level2/Level3 注释信息 ;第二列为 Test 统计值,第三列为 P 值,第四列和第五列为矫正 P 值,其他列为各组均值。


    差异统计2.png


    6. 功能差异统计汇总表

         第一列为差异算法,两组比较提供 T-test 及 Wilcoxon 算法,两组以上比较提供 ANOVA 及 kruskal_wallis 算法,其他列为样本名,各列对应值为差异个数。

    差异统计汇总表.png


    7. heatmap 图

        功能/差异功能条目热图, 横向为样品信息;纵向为功能条目注释信息;图中左侧为聚类树;上面聚类分支 Group 代表样本来自于不同的分组。红色表示功能条目相对丰度较高, 蓝色表示功能条目相对丰度较低。

       KEGG_L3.ANOVA.diff.heatmap.png


    8.Top10 boxplot 图

       差异功能丰度 Top10 的做相对丰度 boxplot 分析,获得优势差异物种在组内丰度及组间比较。不同颜色分别代表样本不同组别,纵坐标表示功能的相对丰度值,分面上标签为功能,分面下标签为 p 值。

    diff_KO_abundance_top10_boxplot.png











    1. (1) heatmap需要至少2个功能条目;


  • 版本更新日期更新内容
    v2.920210519上线
    v3.020210519修改参数
    v3.120210519修改脚本文件权限
    v3.220210521账户修改
    v3.620210629去除OTU/ASV分类结果,P值以p-value表示


  • 问题反馈