导航
登录 English
陈林兴
点赞:
已开展研究项目

      

      微生物是地球元素循环的核心驱动力,对生命和环境健康至关重要。了解微生物的生态和进化对揭示其在地球元素循环中的角色是不可或缺的。病毒作为地球上丰度最高的生物实体,对微生物群落具有深远影响,不仅能通过感染和裂解来控制宿主物种的数量,通过携带的辅助代谢因子增强宿主的代谢潜能,还可以促进新物种形成和增加遗传多样性,是微生物适应环境和生物进化的关键因素之一。  因此,在研究微生物驱动元素循环时,环境中的病毒也是不可忽视的。我们以宏基因组学、宏转录组学和生物信息学为主要研究手段,聚焦微生物和病毒在驱动地球元素循环中的作用,开展了关于其物种多样性、分布、功能、基因活性和进化历史等的研究工作,主要成果包括:1)以矿业废弃物相关生境为研究对象,揭示了其中微生物的物种多样性、功能和活性等特征,为环境污染的监控和治理提供了科学依据2)对多个特殊的噬菌体(即细菌病毒)类群的多样性、分布、功能、活性和进化历史进行了报道,拓展了学界对噬菌体的认识;其中,首次报道了噬菌体直接参与甲烷氧化过程,为控制甲烷排放提供了新的研究思路;(3)针对宏基因组学的自身缺陷,开发了获取高质量基因组的方法和工具


1. 微生物的物种多样性、功能和活性研究:以矿业废弃物相关生境为例


矿产资源是社会生产发展的重要物质基础,但伴随采矿活动而产生的各种废弃物,给生态环境造成了显著压力。在自然条件下,尾矿等矿业废弃物通过微生物介导的金属硫化物的氧化可产生低 pH 和高浓度重金属的水体,即酸性矿山废水(acid mine drainage, AMD)。

针对矿业废弃物的自然酸化过程,对我国南方有色金属矿业废弃物生境中的微生物介导 AMD 产生的过程进行了系统性的研究。首先,揭示了尾矿从酸化起始到 AMD 产生这一过程中的微生物群落结构和功能的变化特征,明确了特定微生物类群在尾矿酸化早期驱动碳氮固定和硫氧化的关键作用(Environ. Microbiol. 2013, 15, 2431-2444),为针对矿业废弃物的前期治理提供了科学依据。同时,通过比较不同矿区的微生物群落(ISME J. 2015, 9, 1579-1592),以及对单个群落进行深度分析(ISME J. 2015, 9, 1280-1294),揭示了AMD环境中优势物种和稀有物种在转录水平上对环境变化的响应机制。基于上述研究,总结了 AMD 微生物驱动元素循环的模式,提出了利用 AMD 土著微生物来进行污水处理的理论模型Curr. Opin. Biotechnol. 2016, 38, 150-158)。此外,揭示了AMD中的重要古菌类群 Micrarchaeota  Parvarchaeota在多种生境中的广泛分布,代谢多样性及其进化历史,并在对其基因组特征进行充分了解的前提下,设定特定条件在实验室内首次成功地对它们进行了富集培养ISME J. 2018, 12, 756-775,)。

为了抑制或减缓 AMD 的产生,通常利用人工湖将矿业废弃物进行覆水封存。为了了解其中的微生物学过程,对加拿大某矿区的人工湖的相关数据进行了分析。此项目进行了多年连续的水体采样(2015-2018年),并对其中的多种硫化物进行了测定,结合宏基因组和宏转录组分析,以了解其中的微生物在碳、氮、硫等元素循环过程的角色和活性。分析结果显示,在有氧条件下,一个新型的 Halothiobacillus 类群通过完整的 Sox 通路来进行硫化物的氧化,从而产生低 pH 的水体;而在低氧或无氧的条件下,这一过程则是由 Thiobacillus 类群通过非完整的 Sox 通路和 rDSR 途径通过耦合硝酸盐还原来驱动的。这一结果揭示了在近中性条件下,硫化物氧化和酸度生成的模式,在防止可能影响下游环境的硫化物排放方面具有重要的应用意义。


图2.采矿废弃_v4.png


2. 噬菌体的物种多样性、分布、功能、活性和进化历史研究

噬菌体(即细菌病毒)不仅在宿主微生物的进化等方面发挥着重要作用,同时其携带的辅助代谢因子往往可以行使某些重要的代谢功能,如光合作用、氨氧化等等。然而,由于噬菌体具有极大的多样性,目前对它们这方面的了解还只是“冰山一角”。

甲烷氧化细菌通过甲烷单加氧酶来进行甲烷的氧化,从而减少排入大气中的甲烷数量,因此对它们的探索有助于了解大气变暖等问题。甲烷单加氧酶包括 PmoAPmoB  PmoC 三个亚基,有证据表明 PmoC 是其中最重要的亚基,然而该基因此前从未在噬菌体中被发现。发现来自油砂尾矿处理人工湖的宏基因组数据中,有一些基因组片段编码了 PmoC 亚基。然而这些基因片段长度通常都比较短,而且其分类信息是未知的,因此利用其开发的提高基因组质量的方法,通过得到完整的基因组来获得更多的信息。对数十个宏基因组进行分析,恢复了22个编码 PmoC 亚基的基因组,其中15个是完整的基因组(大小为159-527 kbp),标记分子分析表明它们都是噬菌体基因组(命名为PmoC-phages)。基于 CRISPR-Cas 和噬菌体-宿主共存模式分析,明确了 PmoC-phages 的宿主是好氧甲烷氧化菌。噬菌体编码的 pmoC 基因与其宿主的该基因具有很高的相似度,表明该基因很可能是从其宿主获得的。宏转录组数据分析发现,噬菌体 pmoC 基因往往具有很高的转录活性,同时可以加快宿主的生长速度,从而促进甲烷的氧化过程。这是首次发现噬菌体可以直接参与甲烷氧化过程,这一工作以第一作者身份发表于 Nature Microbiology (2020)

此外,报道了 Fonsibacter(陆地环境中丰度最高的微生物属)的首个噬菌体基因组,并揭示了它们从海洋到陆地环境的进化历史 (mSystems, 2019) 。还发现某些小型细菌(即CPR)利用多种类型的 CRISPR-Cas 系统来抵抗病毒(Front. microbiol. 2019, 10, 928);探索了大噬菌体编码的核糖体蛋白 S21 在噬菌体复制后期的作用(ISME Commun. 2022, 2, 31);揭示了 LAK 大噬菌体在动物肠道中的分布,多样性和进化特征等(iScience 2021, 24, 102875)。另外,以第三作者身份参与揭示了大噬菌体的广泛分布和特殊的生命机制Nature. 2020, 578, 425-431)。  综上,通过对多个特殊的噬菌体类群进行了生态学研究,揭示了它们的基因组大小、多样性、分布、功能和进化历史等,拓展了学界对噬菌体的认识,为甲烷排放控制提供了新的研究思路。


图3.噬菌体_v5.png


3. 优化宏基因组学数据的方法和工具开发

      高质量的基因组是微生物和病毒生态学研究的基础,对确定它们在生态系统中的功能和生态位角色是不可或缺的。由于大部分的微生物和病毒不能被分离培养和测序,这限制了学界对它们的了解。近20年来,不依赖于培养的宏基因组学成为了重要的研究手段之一。宏基因组学通过从样品中提取总DNA、测序和拼接等来获得基因组(即metagenome-assembled genomes, MAGs),并利用生物信息学分析来揭示微生物和病毒的多样性、功能和生态学角色等特征。然而,宏基因组获得的 MAGs 具有一些缺陷,这限制了宏基因组学的进一步发展和应用。


1)鉴定基因组的质量,确保分析的准确性

针对宏基因组获得的 MAGs 通常是片段化、不完整和被污染的,提出了利用宏基因组片段的四核苷酸频率、测序深度和 GC 含量等特征来进行基因组分箱和评估 MAGs 质量的重要性。基于该方法,推翻了美国工程院院士 Stephen R. Quake 关于“人体血液中包含诸多未知细菌和病毒 ”的研究发现(PNAS 2017, 114, 9623–9628),因其未能正确地进行基因组分箱而高估了微生物的多样性。同时,建立了从宏基因组学数据中获得高质量基因组的方法流程,可将一般质量的基因组优化成高质量基因组;或将高质量但不是完整的基因组进行优化,以获得环状的没有任何拼接错误的基因组,因此可以完全确定微生物和病毒的基因组大小和基因顺序等特征。此外,基于基因组的 GC skew 图谱,发现如 NCBI RefSeq 等公共数据库中的完整微生物基因组(约5%)存在拼接错误,并建立了检测和纠正这些错误的详细方法流程。考虑到 RefSeq 中的基因组通常被作为金标准用于日常的分析和研究,该方法的建立为同行科学研究和分析的可靠性做出了重要贡献。这一工作以第一作者身份发表于Genome Research2020)。


图4.基因组_v1.png


2 开发病毒基因组优化工具

病毒基因组的研究通常都基于单个的宏基因组拼接片段,而它们往往只能代表部分的基因组,因此对病毒的多样性、代谢潜能、进化历史、基因组结构和大小等的评估都存在偏差。近几年来,学界开发了一些针对病毒的基因组分箱工具,如 vRhyme  CoCoNet等,然而获得的病毒 MAGs 的质量却很难被准确评估(如 CheckV 等)。因此,根据常用的第二代测序数据拼接软件大都基于 de Bruijn graph 这一特点,开发了 COBRA COBRA 通过分析基因组片段的测序深度和双端 reads 的映射关系,来评估它们之间的位置关系,并对来自同一种群的片段进行连接,以获得高质量或完整的基因组(图5)。

Benchmarking 分析显示 COBRA 可将多达数十条基因组片段进行连接,得到一个完整的环状基因组。与常用的基因组分箱工具进行比较分析,结果显示 COBRA 能够以更高的准确度获得更多的高质量基因组;而分箱工具得到的40-80%病毒 MAGs 都有不同程度的污染,因此会直接影响下游分析的准确性。然后,利用 COBRA 231个淡水宏基因组进行了分析,获得了7334个种水平的噬菌体基因组,其中超过6000个是从未被报道的。此分析同时报道了267个大噬菌体基因组,包括目前已知的第二大噬菌体基因组(717kbp)。对大噬菌体进行比较基因组分析表明,结构蛋白和 DNA 代谢相关的基因保持了高度的核苷酸相似性,而其他基因的获得或丢失是推动它们分化的主要因素。这些结果扩展了学界对淡水环境噬菌体和大噬菌体的多样性和进化历史的认识。通过对这些噬菌体的辅助代谢基因分析,发现约3.1%的基因组编码了与同化硫酸盐还原过程相关的基因(cysH  cysC),这表明淡水环境中的噬菌体可能在硫循环的过程具有重要作用。宏转录组数据的分析支持了这一推论,在某些富氧环境样品中,噬菌体编码的 cysC 基因的总转录活性高于微生物编码的该基因的活性。上述分析表明 COBRA 具有强大的基因组优化能力,能通过提供更多高质量的病毒基因组,从而确保分析的准确性,促进关于病毒的科学研究。上述工具以第一作者和共同通讯作者发表于Nature Microbiology2024)。


图5.基因组_v1.png