解读文献里的那些图——GSEA(2)
图解
纵坐标:ES富集分数,代表基因集下基因在排序列表的顶部或底部被过表达的程度。
横坐标:rank,自己的表达数据集进行排序的表达量。一般从fold change表达最大的往下排(0是最大)。在前的fold change大,上调,在后的fold change小,下调(见火山图)。
最大富集分数:ES曲线的峰值。
正值:峰值为正,基因富集在顶部
负值:峰值为负,基因富集在底部
FDR q-val:多重假设检验矫正后的p值,判断假阳性率的大小,值越小越好。一般情况下FDR q-val < 0.25。
黑色的一堆竖线:预定义 基因集A中的基因,在排序后的表达数据中的位置。
#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
图解
纵坐标:ES富集分数,代表基因集下基因在排序列表的顶部或底部被过表达的程度。
横坐标:rank,自己的表达数据集进行排序的表达量。一般从fold change表达最大的往下排(0是最大)。在前的fold change大,上调,在后的fold change小,下调(见火山图)。
最大富集分数:ES曲线的峰值。
正值:峰值为正,基因富集在顶部
负值:峰值为负,基因富集在底部
FDR q-val:多重假设检验矫正后的p值,判断假阳性率的大小,值越小越好。一般情况下FDR q-val < 0.25。
黑色的一堆竖线:预定义 基因集A中的基因,在排序后的表达数据中的位置。
#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
解读文献里的那些图——火山图2
图解
1
上调up:表达前后上升/下降两倍,p<0.05。
下调down:表达前后下降两倍,p<0.05。
无差异none:见图中灰色点。
2
横坐标:fold change,≥2作为表达阈值,X=对倍数取log2对数。偏离中心越远的点,表示差异倍数越大。
纵坐标:FDR adjusted p-value,p<0.05有意义,取负对数让纵坐标明显。越靠近顶部的点表示在两个样本中的表达差异越显著。
3
三条虚线
右竖:上调2倍。X≥=1
左竖:下调2倍以上。X≤= -1
横线:Y=1.30= -lg(0.05)
特点
1、只能看总体的情况,总体的两组对比。无法单独看某一个基因。
2、每个点代表一个检测到的差异表达基因。
3、点的大小和颜色也可以表示更多的属性,如可以用点的颜色标记其对应的基因是上调,下调还是无差异。#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
图解
1
上调up:表达前后上升/下降两倍,p<0.05。
下调down:表达前后下降两倍,p<0.05。
无差异none:见图中灰色点。
2
横坐标:fold change,≥2作为表达阈值,X=对倍数取log2对数。偏离中心越远的点,表示差异倍数越大。
纵坐标:FDR adjusted p-value,p<0.05有意义,取负对数让纵坐标明显。越靠近顶部的点表示在两个样本中的表达差异越显著。
3
三条虚线
右竖:上调2倍。X≥=1
左竖:下调2倍以上。X≤= -1
横线:Y=1.30= -lg(0.05)
特点
1、只能看总体的情况,总体的两组对比。无法单独看某一个基因。
2、每个点代表一个检测到的差异表达基因。
3、点的大小和颜色也可以表示更多的属性,如可以用点的颜色标记其对应的基因是上调,下调还是无差异。#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
解读文献里的那些图——火山图
介绍(图1)
火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。火山图可以方便直观地展示两个样本间基因差异表达的分布情况。通常横坐标用log2(fold Change) 表示,差异大的基因分布在两端,纵坐标用-log10 (pvalue) 表示,T检验显著性P值的负对数。通常差异倍数越大的基因T检验越显著,所以左上角和右上角的数据点往往更具有生物学研究意义。这类图像往往呈现类似火山爆发的样子,于是就被叫做“火山图” (volcano plot) 。
应用
在生物信息分析中,火山图是非常常见的一种数据展示形式。由于火山图可以非常清晰的展示出哪些基因在不同样本中是具有差异表达显著性的基因,因此在生物医学中,常应用于病例和对照组的转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
介绍(图1)
火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。火山图可以方便直观地展示两个样本间基因差异表达的分布情况。通常横坐标用log2(fold Change) 表示,差异大的基因分布在两端,纵坐标用-log10 (pvalue) 表示,T检验显著性P值的负对数。通常差异倍数越大的基因T检验越显著,所以左上角和右上角的数据点往往更具有生物学研究意义。这类图像往往呈现类似火山爆发的样子,于是就被叫做“火山图” (volcano plot) 。
应用
在生物信息分析中,火山图是非常常见的一种数据展示形式。由于火山图可以非常清晰的展示出哪些基因在不同样本中是具有差异表达显著性的基因,因此在生物医学中,常应用于病例和对照组的转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
#生信分析##生物信息学##医学生Medic[超话]##生物信息学[超话]#
✋热门推荐