自然界中,微生物組(亦稱“菌群”)無所不在,其結(jié)構(gòu)深刻體現(xiàn)著生態(tài)系統(tǒng)的健康狀態(tài),因此微生物組結(jié)構(gòu)比對(duì)是菌群檢測(cè)服務(wù)于精準(zhǔn)健康、精準(zhǔn)護(hù)理與精準(zhǔn)營(yíng)養(yǎng)的核心環(huán)節(jié)之一。青島能源所單細(xì)胞中心提出了Dynamic Meta-Storms(DMS)算法,能夠更精確地計(jì)算菌群相似度。該研究在線發(fā)表于Bioinformatics。
鳥槍法元基因組(shotgun metagenomics)通過直接測(cè)定菌群總體DNA序列,來刻畫一個(gè)菌群的結(jié)構(gòu)和功能。然而如何精確地計(jì)算鳥槍法元基因組數(shù)據(jù)點(diǎn)之間的量化差異,一直是業(yè)界的熱點(diǎn)問題。蘇曉泉副研究員帶領(lǐng)的單細(xì)胞中心生物信息研究組,針對(duì)上述關(guān)鍵技術(shù)瓶頸開發(fā)了Dynamic Meta-Storms(DMS)算法。DMS充分利用菌群中已知物種的生物分類和進(jìn)化關(guān)系,對(duì)未知物種的進(jìn)化位置進(jìn)行理性推測(cè)(圖1),從而能夠全面、精確地計(jì)算元基因組之間物種水平的相似度(圖2a)。
與此同時(shí),得益于高性能并行計(jì)算優(yōu)化技術(shù),在計(jì)算百萬數(shù)量級(jí)之元基因組樣本的相似度時(shí)(5 1011次相似度計(jì)算),DMS在單個(gè)計(jì)算節(jié)點(diǎn)上僅用6.4小時(shí)即可完成,與目前最快算法相比,速度提高了20%,同時(shí)還節(jié)省了40%的內(nèi)存使用率(圖2b)。
作為元基因組學(xué)領(lǐng)域的共性基礎(chǔ)算法之一,DMS將基于單細(xì)胞中心開發(fā)的微生物組搜索引擎(http://mse.ac.cn),直接服務(wù)于地球微生物組計(jì)劃(EMP)、人體微生物組計(jì)劃(HMP)、中科院微生物組計(jì)劃等大科學(xué)計(jì)劃,從而支撐基于菌群測(cè)序的精準(zhǔn)健康、精準(zhǔn)護(hù)理與精準(zhǔn)營(yíng)養(yǎng)。
該論文的并列第一作者是生物信息研究組荊功超和張玉鳳,由蘇曉泉副研究員主持完成,并獲得了國(guó)家自然科學(xué)基金、山東省自然科學(xué)重大基礎(chǔ)研究項(xiàng)目、中科院微生物組計(jì)劃等的支持。
原文鏈接:
Jing G.1, Zhang Y.1, Liu L., Yang M., Xu J. and Su X.* Dynamic Meta-Storms enables comprehensive taxonomic and phylogenetic comparison of shotgun metagenomes at the species level. Bioinformatics (2019) DOI: 10.1093/bioinformatics/btz910.
(文/圖 荊功超)