微生物群落研究常用组学比较及多样性指数的概念
常用的高通量测序方法有扩增子测序(16S rDNA)、宏基因组测序、宏转录组测序
1.16S rDNA:是一种扩增子测序的代表,研究对象是基于PCR扩增的细菌16S rDNA片段——用于分析微生物群落的组成和多样性,挖掘微生物与生境的关系信息。相较于传统微生物研究,16S可以省去培养细菌的工作,更快速获得微生物群落的多样性信息,在多组学研究中起到基础的群落筛选作用。
关注的问题:有什么物种
分析手段:物种组成研究、α和β多样性分析
成本:较低
缺点:PCR有偏好
优点:适用于大样本研究(建库成本低)
2.宏基因组:能够获得微生物群落的所有基因序列(全部DNA),通过序列拼接组装,获得基因组的结构、功能信息——对微生物群落的组成和功能进行研究。
关注的问题:有什么功能
分析手段:基因功能注释、代谢通路研究
成本:较高
缺点:无法得到基因表达信息
优点:DNA信息完整,对基因结构的把握比宏转录组可靠
3.宏转录组:以特定群落的全部mRNA为研究对象,通过数据组装和比对来获得基因的结构、表达信息——在转录组水平对群落进行组成和基因功能的研究。和宏基因组有一定包含关系,它也可以挖掘物种信息、基因功能信息、发现新基因。此外,它还可以深入了解基因如何被调控,基因表达如何应答环境变化等细节问题。
关注的问题:怎样行使功能
分析手段:差异表达基因、代谢通路研究
成本:较高
缺点:RNA不稳定,建库难度大,基因信息不完整
优点:研究内容全面,对基因功能的挖掘比宏基因组更为深入
16s和宏基因组的联用:利用16S成本低的优势,在前期检测大量样本组成和多样性后,筛选目标群落,进行宏基因组研究,挖掘功能信息。
宏基因组、宏转录组的联用:对物种组成等信息进行同步验证,不同层面挖掘群落功能信息。
物种的丰富度(Richness)——可以理解为物种的数量。
物种的均匀度(Evenness)——可以理解为物种之间的数目差异,差异越小,均匀度越高。
微生物群落的α、β多样性指数
α多样性指数主要反映了样本内多样性
β多样性指数主要反映了样本间多样性,本质上是一个量化的数值,其值大小反映每个组内各个样本间群落物种组成差异。
常用的α多样性指数——Chao1,ACE,Shannon,npShannon,Simpson,Good’s Coverage
其中Chao1 / ACE指数关心样本的物种丰富度信息,样本是否有这个物种。
Good’s Coverage关心反应样本的低丰度OTU覆盖情况
Shannon,npShannon,Simpson提现物种的丰富度和均匀度
Chao1指数:主要利用Singleton Doubleton来判断群落的物种丰富度,它对单个物种的变化更为敏感,数值越大,表示物种种类越多
ACE指数:主要利用singleton和稀有物种来估算还有多少没被发现的物种。Cace取用出现次数不超过10的物种(OTU)进行计算。
Shannon指数:香浓指数,多样性分析常见概念
Simpson指数:当物种种类无限多(丰富度最高),并且每个物种数目都一致(均匀度最高时)Simpson的值为1,是最大值。
Good’s Coverage指数:C的数值越大,在测序数据量一样时,样本物种丰富度越小。
常用的β多样性指数Bray-curtis,unifrac,weighted unifrac
可以用PCoA、进化树聚类等分析此数值关系
计算微生物群体样本间距离的方法有Jaccard,Bray-curtis,unifrac等,分为OTU之间是否关联,OTU是否加权。
基于独立OTU | 基于系统发生树 | |
加权 | Bray-curtis | weighted unifrac |
非加权 | Jaccard | Unweighted unifrac |
非加权:主要考虑物种有无,加权同时考虑物种有无和物种丰度
最常用的距离计算方法:Bray-curtis、weighted unifrac、Unweighted unifrac
在实际微生物研究中,如果样本间物种的近缘程度较高(温和处理样本和对照样本,生境相似的不同样本)利用Bray-curtis把OTU结构都同等对待的方法更有利于发现样本间的差异。Unifrac更适合用于展示此类样本的重复性。
Unweighted unifrac只考虑物种有无的变化,群落间物种组成差异更剧烈时,影响因素复杂时 采用非加权方法进行分析。
weighted unifrac同时考虑物种有无和物种丰度的变化,有的时候群落的组成并没有明显变化,但是菌群的丰度可能会发生大变化,因此采用加权方法进行计算。
One comment
快递单号、空包代发网站www.dh5u.com