基于元基因組測(cè)序的微生物組功能分析和比較在疾病診斷、生態(tài)監(jiān)控、生物安全等領(lǐng)域具有廣闊應(yīng)用價(jià)值,但是高昂的成本限制了其更廣泛應(yīng)用。日前,青島能源所單細(xì)胞中心開發(fā)了微生物組功能校正算法Meta-Apo(Metagenomic Apochromat),為大規(guī)模的菌群功能比較提供了一種保證分析精度的同時(shí)可大幅降低實(shí)驗(yàn)和計(jì)算成本的解決方案。
目前,微生物組功能的分析和比較,主要基于基因組序列進(jìn)行代謝重建。路線之一是鳥槍法元基因組測(cè)序(Whole Metagenome Sequencing;WMS),然而其高昂的測(cè)序成本(~1000~2000元/樣本)和冗雜的分析過程阻礙了該方法的大規(guī)模應(yīng)用。另一方面,通過擴(kuò)增子測(cè)序(~200元/樣本),利用16S rRNA等進(jìn)化標(biāo)記基因和其參照基因組之間的關(guān)聯(lián),亦能推斷微生物組的功能。該方法雖然大幅降低了成本,但16S rRNA基因片段經(jīng)常帶有擴(kuò)增偏好性,而且與全基因組序列的關(guān)聯(lián)并非完全可靠,因此,該方法的功能重建結(jié)果經(jīng)常會(huì)出現(xiàn)較大的偏差。
為了解決以上問題,單細(xì)胞中心生物信息研究組提出了Meta-Apo算法,通過挖掘WMS數(shù)據(jù)和16S rRNA擴(kuò)增子數(shù)據(jù)之間的同構(gòu)關(guān)系,利用少量WMS和16S rRNA數(shù)據(jù)對(duì)(即同一個(gè)菌群樣本分別進(jìn)行WMS測(cè)序和16S rRNA擴(kuò)增子測(cè)序)進(jìn)行訓(xùn)練,來實(shí)現(xiàn)對(duì)大規(guī)模16S rRNA擴(kuò)增子測(cè)序樣本的菌群功能校正(圖1)。研究結(jié)果顯示,Meta-Apo利用僅僅15例樣本的數(shù)據(jù)對(duì)進(jìn)行訓(xùn)練,進(jìn)而基于16S rRNA擴(kuò)增子對(duì)5,000例人體腸道菌群樣本進(jìn)行功能預(yù)測(cè)和校正,其結(jié)果與同批樣本基于WMS推斷的菌群功能基本一致,而總測(cè)序成本僅為后者的20%左右。因此,針對(duì)大規(guī)模菌群樣本的功能重建這一目的,將全部樣本用16S rRNA擴(kuò)增子策略,同時(shí)用WMS策略測(cè)定其中的一小部分樣本,將能在保證分析精度的前提下、大幅降低實(shí)驗(yàn)和計(jì)算成本。因此,Meta-Apo算法和相應(yīng)的測(cè)序策略為大規(guī)模菌群功能分析項(xiàng)目的設(shè)計(jì)提供了一個(gè)重要的工具。
該項(xiàng)工作由單細(xì)胞中心與青島大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院合作完成,該論文第一作者是生物信息研究組荊功超助理研究員,通訊作者是蘇曉泉教授,并獲得了國家自然科學(xué)基金、山東省自然科學(xué)基金、中國博士后科學(xué)基金的支持。
圖1 Meta-Apo算法能校正基于16S基因擴(kuò)增子推斷的菌群功能
原文鏈接:
Gongchao Jing, Yufeng Zhang, Wenzhi Cui, Lu Liu, Jian Xu, Xiaoquan Su*. Meta-Apo improves accuracy of 16S-amplicon-based prediction of microbiome function. BMC Genomics 22, 9 (2021). https://doi.org/10.1186/s12864-020-07307-1