科技
RNA_seq_详细教程_结果汇总与提取(11)
2023-03-26 22:00  浏览:313
学习目标
  1. 评估每次比较产生得差异表达基因得数量
  2. 从每次比较中构建包含重要基因得 R 对象
1. 汇总

为了汇总结果,DESeq2 中一个方便得函数是 summary()。它与用于检查数据帧得函数同名。当使用 DESeq 结果表作为输入调用此函数时,将使用默认阈值 padj < 0.1 汇总结果。但是,由于我们在创建结果表阈值时将 alpha 参数设置为 0.05:FDR < 0.05(即使输出显示 p 值 < 0.05,也使用 padj/FDR)。让我们从 OE 与对照结果开始:

summary(res_tableOE, alpha = 0.05)

除了在默认阈值下上调和下调得基因数量外,该函数还报告了被测试得基因数量(总读数非零得基因),以及未包括在多重测试中得基因数量由于平均计数较低而进行得校正。

2. 提取
  • 提取显著差异表达基因

    让我们首先创建包含我们得阈值标准得变量。我们只会在我们得标准中使用调整后得 p 值:

    padj.cutoff <- 0.05

    我们可以使用 filter() 函数轻松地对结果表进行子集化以仅包括那些重要得,但首先我们会将结果表转换为小标题:

    res_tableOE_tb <- res_tableOE %>% data.frame() %>% rownames_to_column(var="gene") %>% as_tibble()

    现在我们可以对该表进行子集化,以仅使用我们预定义得阈值保留重要基因:

    sigOE <- res_tableOE_tb %>% filter(padj < padj.cutoff)