10月26日,《核酸研究》(Nucleic Acids Research)在線(xiàn)發(fā)表中國科學(xué)院微生物研究所微生物資源與大數據中心、世界微生物數據中心馬俊才團隊題為gcMeta: a Global Catalogueof Metagenomics platform to support the archiving, standardization and analysisof microbiome data的研究論文。gcMeta平臺是一個(gè)微生物基因組及微生物組數據的管理、分析和發(fā)布平臺,為國內外用戶(hù)提供一站式的從數據存儲、數據分析到數據發(fā)布的服務(wù),目前已經(jīng)整合了來(lái)自中科院微生物組計劃及國內外多個(gè)重要項目的數據。該平臺的發(fā)布將有效支撐我國微生物組研究并為未來(lái)我國國家微生物組計劃的實(shí)施提供重要的支持。
近年來(lái),美國、歐盟都陸續啟動(dòng)了微生物組相關(guān)的研究項目。但微生物組大數據的收集、存儲、功能挖掘和開(kāi)發(fā)利用一直是制約微生物組發(fā)展的核心問(wèn)題。我國目前在微生物組數據管理中存在著(zhù)標準不統一、缺乏跨領(lǐng)域的數據整合、高質(zhì)量的參考數據庫和數據的深度挖掘技術(shù)等問(wèn)題。2017年,中科院?jiǎn)?dòng)了“中國微生物組計劃”項目,項目旨在進(jìn)一步強化中科院在微生物組研究和開(kāi)發(fā)利用等方面的共性技術(shù)和平臺優(yōu)勢,聚焦“人體健康和環(huán)境”微生物組,開(kāi)發(fā)相應的微生物組學(xué)新方法、新技術(shù);通過(guò)研究其結構與功能、群體間的競爭與合作,微生物組與人體等宿主和環(huán)境相互作用及與宿主的寄生共生健康發(fā)育等關(guān)系,發(fā)現微生物與人類(lèi)和環(huán)境共同演化的科學(xué)規律。同時(shí),也將在微生物組數據標準化的基礎上,建立微生物組大數據計算、存儲和共享平臺,開(kāi)發(fā)微生物組大數據挖掘的新方法,實(shí)現我國微生物組數據資源的系統管理和高效利用。
gcMeta建立了一個(gè)微生物基因組、元基因組和轉錄組管理、數據在線(xiàn)分析、可視化及數據發(fā)布的一站式系統。目前已經(jīng)整合來(lái)自國際相關(guān)平臺(NCBI、EBI、MG-RAST等)及重要項目(HMP、Tara等)超過(guò)12萬(wàn)樣本數據,來(lái)自我國科學(xué)家的超過(guò)2000余個(gè)樣本數據,總數據量超過(guò)120TB。平臺為用戶(hù)提供了多級的數據管理和權限控制體系,可用于各研究組管理未發(fā)表數據,并在研究組內共享,也可以將內部管理數據進(jìn)行在線(xiàn)發(fā)布與公開(kāi)。平臺為所有公開(kāi)數據提供基于Persistent Identifier (PID) (http://www.pidconsortium.eu/)系統的唯一PID號,用于在學(xué)術(shù)期刊的公開(kāi)發(fā)表及后續數據引用及分析。此外,平臺還整合了超過(guò)90個(gè)在線(xiàn)數據分析工具,提供針對擴增子序列、全基因組序列等4套分析工作流,所有的分析工具和工作流都是以web方式使用,方便微生物領(lǐng)域用戶(hù)快速掌握及使用。用戶(hù)可以通過(guò)該平臺方便地實(shí)現數據管理、數據分析、結果展示和數據發(fā)布等一系列服務(wù),平臺也將為用戶(hù)提供全過(guò)程的使用支持,歡迎國內外用戶(hù)使用該平臺。
微生物資源與大數據中心史文聿、亓合媛為論文共同第一作者,微生物資源與大數據中心及世界微生物數據中心馬俊才及吳林寰為論文共同通訊作者。該研究得到中科院重點(diǎn)部署項目“人體與環(huán)境健康的微生物組共性技術(shù)研究”、國家重點(diǎn)研發(fā)計劃“益生菌健康功能。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com