微生物是指一类肉眼看不见或难以看见的细小生物体的总称,包括细菌、真菌、放线菌、原生动物、藻类等有细胞结构的微生物。一般的细菌基因组大小通常不超过10M,真菌则一般不超过200M。相比超过几个G的动物基因组,对于微生物基因组的测序和分析要求都更加简单。

微生物的基因组研究包括了:de novo从头组装研究(★)、有参考基因组的重测序研究。可以解决三个关键问题:①有什么?——组分分析

de novo从头组装研究中,二代测序主要偏向于框架图的构建,三代测序由于其读长优势更多用于基因组精细图和完成图的构建。测序获得序列后,过滤组装就可以获得微生物基因组。

微生物的基因组虽然小,但利用率却十分高。在基因组中,不单只含有编码基因等重要遗传片段,还有大量非编码的RNA序列,即tRNA(关系到蛋白合成)、rRNA(物种分类的重要信息)、sRNA(能够起到很多基因调控作用)。此外,基因组中还有很多的重复序列,种类繁多,能够对遗传变异、基因表达、生理代谢的功能产生影响。对于某些特殊片段,还可以进行前噬菌体(整合到细菌基因组的温和噬菌体,可影响微生物的抗性)、基因岛(GIs,与水平基因组转移HGT有关)、CRISPR(微生物的重要防御系统,基因编剧的工具)等预测。

②可以做什么?——功能注释

编码基因能够编码蛋白,承担生物学功能。所以了解了基因组结构之后,可以对编码基因进行分析对其功能进行预测。预测分为:普通预测、个性化预测

普通预测:基于NrSwissProtKEGGGOCOGPfam等常见通用数据库

特点:涉及生物学功能范围比较广泛,可以知道这个物种在蛋白功能、代谢、细胞行为等方面的信息。

个性化预测:基于基因在某特定领域的功能体现,常用数据库:分泌蛋白(Secretion protein)、病原与宿主互作(PHI)、细菌致病菌毒力因子(VFDB)、耐药基因(ARDB)、碳水化合物相关酶(CAZy)等

通常要作出功能注释结果图来解释。

 

③有什么特别?——比较基因组及进化研究

当比较对象只有两个时,可以找出基因组差异情况、从而确定他们的基因结构不同点。涉及的分析包括了:共线性分析(有利于发现基因组的重排情况,是较大的结构差异分析)、变异检测(涉及少量碱基位点的差异,如SNP

当样本数据较多时候,我们可以通过构建进化树的方式,确定这个物种的进化位置。从而研究更多群体问题。当然也可以比较这个小群体的pan genecore  gene情况,大致了解这个物种的功能信息

进化层面的分析,需要涉及到两个以上的样本数据,结果展示方式较为多样化。

 

当获得基因组数据以后,下一步就是通过分析手段了解其分类地位、基因组成分、流程化的做注释,看看能发挥什么作用。单一基因组往往缺乏研究深度,所以可以进行组学的两两结合或者三种组学的结合,最常用的结合方式包括:

1)基因组+转录组

常规研究思路,可以通过在基因组层面与其他物种进行对比,发现关键基因和通路,再利用转录组研究特定环境下的基因表达情况。

2)基因组+代谢组

常用于新物种或人工诱变物种的应用价值或者致病机制的研究,用于发现新物种的次级代谢物的种类和作用,研究目标物质的合成途径。

3)宏基因组+基因组

可研究大量不可培养物种。可首先利用宏基因组组装单菌草图,再利用草图作为参考基因组或者与已有参考基因组进行比较,研究物种的进化问题。


Last modification:June 20, 2021
如果觉得我的文章对你有用,请随意赞赏