空間轉錄組學(xué)技術(shù),尤其是華大時(shí)空組學(xué)技術(shù)Stereo-seq的出現,能夠準確反映細胞的空間排布和RNA的原位表達,幫助科研人員從時(shí)間和空間維度上認知每個(gè)基因、每個(gè)細胞,有望帶來(lái)生命科學(xué)領(lǐng)域的第三次科技革命,成為重新認知器官結構、生命發(fā)育、物種演化和定義疾病的底層工具。
對于時(shí)空組學(xué)技術(shù)生產(chǎn)的原始數據,需結合算法工具進(jìn)行處理、分析,進(jìn)而找到在空間分布上具有意義的細胞和基因表達。然而,由于該技術(shù)的創(chuàng )新性,現有工具包大多僅側重于空間原位信號的可視化,而缺乏系統性分析數據的方法。
2024年11月11日,華大生命科學(xué)研究院聯(lián)合斯坦福大學(xué)醫學(xué)院、武漢大學(xué)電子信息學(xué)院等機構在國際頂尖學(xué)術(shù)期刊 Cell 上發(fā)表了題為:Spatiotemporal modeling of molecular holograms 的研究論文,推出了最新時(shí)空算法工具包。
研究團隊團隊借鑒了物理學(xué)、地理學(xué)、經(jīng)濟學(xué)等多個(gè)跨學(xué)科領(lǐng)域的數學(xué)模型,開(kāi)創(chuàng )性開(kāi)發(fā)了三維時(shí)空建模工具包——Spateo,使空間轉錄組學(xué)技術(shù)能夠精細地重構器官三維結構、系統地量化時(shí)空動(dòng)態(tài)過(guò)程。該工具包的發(fā)布標志著(zhù)時(shí)空組學(xué)研究迎來(lái)革新性突破,可全面支撐胚胎發(fā)育、腦科學(xué)、疾病等領(lǐng)域研究,為實(shí)現高精度時(shí)空生命全景觀(guān)研究邁出了極為關(guān)鍵的一步。
Spateo工具包提供多種算法選擇,具備三維重建、區域數字化、細胞間相互作用推斷、“形態(tài)計量向量場(chǎng)”以及用于交互式操作的可視化界面等獨特優(yōu)勢。為驗證其性能,研究團隊以小鼠胚胎和果蠅發(fā)育的研究為例,探索了三維空間中隨時(shí)間變化的器官生態(tài)形成機制,并構建了小鼠胚胎發(fā)育的“3D分子全息圖”,證實(shí)了Spateo將顯著(zhù)提高我們對發(fā)育過(guò)程中器官形成的理解。
Spateo整體功能示意圖
如果說(shuō)以往的時(shí)空算法工具包更多的是輔助研究者觀(guān)察數據,Spateo則具備系統性的統計能力與強大的分析能力??梢哉f(shuō),Spateo工具包是當前時(shí)空算法工具領(lǐng)域“天花板”級別的存在,將為生命科學(xué)的未來(lái)研究奠定重要基礎。下文選取Spateo工具包中的四種核心創(chuàng )新性算法為大家介紹。
三維重建算法:普適性強,更高精度、更低成本實(shí)現三維重建
Spateo工具包提供的三維重建算法,能夠幫助科研人員以更低成本、更低難度(更少、更遠距離的組織切片)獲取更高精度的三維重建結果,可廣泛適用于胚胎發(fā)育、腦科學(xué)、疾病、植物等多領(lǐng)域研究。
首先,對于空間組學(xué)中經(jīng)典的三維重建問(wèn)題,Spateo巧妙地將切片間的配準任務(wù)轉化為“生成”問(wèn)題。切片間的配準,是將二維圖像進(jìn)行精確對齊,以便于后續的三維重建和分析。作為空間組研究中的基礎問(wèn)題,配準的準確度將直接影響研究結果的判斷??深?lèi)比理解為,醫院檢查拍攝的CT影像越精準, 醫生也就能更好地理解和診斷患者的病情。
具體而言,研究人員獲取了兩張組織切片A和B之后,Spateo可根據切片A生成一個(gè)虛擬的A'切片,使其與B切片足夠相似。A'切片的生成過(guò)程由高斯過(guò)程建模,并通過(guò)變分推斷求解,實(shí)現高效且穩定的計算,并且能夠處理切片形變和部分缺失等難題。同時(shí),Spateo還設計了多切片聯(lián)合優(yōu)化算法以及表面糾正算法,進(jìn)一步提升了三維重建的精度。鑒于此,即便切片A和B距離較遠、或時(shí)間跨度較長(cháng),甚至是跨物種的切片,也能借助Spateo推斷出兩者間的映射關(guān)系。
生成算法示意圖和小鼠腦胚胎重建效果(c-d:之前發(fā)表的方法偏向于重建成“一團”組織,而Spateo準確還原了三維精細結構和基因空間分布)
此外,研究團隊采用多個(gè)空間組學(xué)數據集對Spateo進(jìn)行驗證,包括小鼠腦、人類(lèi)淋巴瘤、猴腦和小鼠胚胎。結果顯示,Spateo成功重建了各種組織類(lèi)型的三維結構,展示了其處理復雜數據集的強大能力,在準確性、計算速度、內存消耗、可重建的切片間距和可處理的細胞數量等方面均優(yōu)于當前國際上主流的重建算法。
更具創(chuàng )意的是,Spateo的三維重建算法在拓展到兩個(gè)甚至多個(gè)完成重建的三維胚胎的配準工作時(shí),能夠自然地捕捉跨時(shí)間點(diǎn)的細胞遷移、凋亡和分裂分化事件。該方法在細胞層面完美解決了胚胎形態(tài)發(fā)生學(xué)的關(guān)鍵問(wèn)題,為后續的形態(tài)計量算法奠定了堅實(shí)基礎。
區域數字化和細胞互作算法:識別細胞上下游調控網(wǎng)絡(luò ),有望助力臨床應用
生物發(fā)育的過(guò)程中,有一個(gè)確保發(fā)育精確性和對稱(chēng)性的關(guān)鍵步驟,叫“軸線(xiàn)發(fā)育”,即組織和器官沿特定軸進(jìn)行有序分化與發(fā)育,如頭-尾軸、背-腹軸或左右軸。軸向發(fā)育為組織和器官的位置、形態(tài)及功能提供空間上的指引,因此該過(guò)程也被稱(chēng)為“區域化”。
Spateo的區域數字化算法借鑒了物理學(xué)中的勢能場(chǎng)概念,可對任意形態(tài)的組織、沿任意軸向生成等高線(xiàn)進(jìn)行數字化分割,進(jìn)而識別出具有顯著(zhù)軸向表達特征的關(guān)鍵基因。此方法尤其適用于研究具有分層結構的發(fā)育問(wèn)題,例如大腦皮層(人類(lèi)大腦皮層分為6個(gè)層次)、皮膚、血管壁等。
第11.5天小鼠腦中丘腦限制帶研究(a: 小鼠腦不同腦區是如何發(fā)育而成的 g:影響不同腦區功能的細胞互作網(wǎng)絡(luò ))
通過(guò)區域數字化算法挖掘出一系列具有空間特征的基因之后,Spateo的細胞互作算法能夠構建目標基因的上下游調控關(guān)系網(wǎng)絡(luò ),進(jìn)一步探討目標基因的表達如何受到自身及周?chē)毎恼{控。此兩種算法結合使用,在三維發(fā)育研究中具有重要應用價(jià)值,有助于理解控制細胞行為的動(dòng)態(tài)過(guò)程,此外,在疾病研究中能幫助找到關(guān)鍵基因及其互作網(wǎng)絡(luò ),有望為腫瘤等疾病的治療提供新思路。
形態(tài)計量向量場(chǎng)算法:關(guān)聯(lián)宏觀(guān)組織與微觀(guān)基因,為發(fā)育、疾病研究提供新見(jiàn)解
Spateo中最令人振奮、最 具創(chuàng )意的算法是利用形態(tài)計量向量場(chǎng)算法,開(kāi)創(chuàng )性地將宏觀(guān)組織的形態(tài)變化與微觀(guān)的基因表達變化關(guān)聯(lián)起來(lái),這是以往工具未能實(shí)現的。該算法實(shí)現了對影響器官發(fā)生的關(guān)鍵基因進(jìn)行分子層面的推斷,為研究發(fā)育過(guò)程、疾病發(fā)生發(fā)展等問(wèn)題提供了極具優(yōu)勢的新途徑。
具體而言,組織形態(tài)學(xué)變化通過(guò)物理空間中跨時(shí)間點(diǎn)的細胞遷移向量場(chǎng)進(jìn)行微分幾何計算,包含三維旋度、加速度、曲率、撓率(物體扭曲程度)和散度等物理量,這些量與生物發(fā)育過(guò)程密切相關(guān)。同時(shí),通過(guò)向量場(chǎng)中表達量的變化,可以挖掘出與這些物理度量高度相關(guān)的“形態(tài)計量”基因。
以小鼠心臟的非對稱(chēng)發(fā)育研究為例,我們可以觀(guān)察到小鼠左心室的各種形態(tài)計量都比較保守,而主要發(fā)育自第二心場(chǎng)的右心房、右心室、還有左心房則有各自顯著(zhù)的宏觀(guān)上的形態(tài)變化,Spateo能夠以物理度量的方式,找出與不同形態(tài)變化高度關(guān)聯(lián)的關(guān)鍵基因。此外,研究團隊還開(kāi)展了果蠅發(fā)育的研究,結果表明Spateo對幫助我們更好地理解先天性心臟缺陷等疾病具有重要意義。
小鼠心臟的非對稱(chēng)發(fā)育研究(g:左心室在各種物理度量下都最保守,而其它的腔室有各自特異的顯著(zhù)變化 h:算法鑒定出宏觀(guān)形態(tài)學(xué)變化所對應的關(guān)鍵基因表達)
隨著(zhù)空間技術(shù)的不斷成熟并廣泛應用,研究團隊預見(jiàn)到單細胞基因組學(xué)的許多方法可以轉化為空間基因組學(xué),能夠在原位和三維空間中實(shí)現多視角、時(shí)空分辨的譜系解析和擾動(dòng)解析的細胞狀態(tài)動(dòng)態(tài)。此外,Spateo的應用將助力理解多種生物系統問(wèn)題,舉例而言,通過(guò)生成空間分辨的跨物種細胞圖譜,比較不同物種間器官的三維模型,進(jìn)而揭示組織結構的進(jìn)化過(guò)程,如脊椎動(dòng)物的四腔心臟是如何從無(wú)脊椎動(dòng)物的單腔心臟演變而來(lái)的。
論文通訊作者、華大生命科學(xué)研究院白寅琪博士表示,Spateo采用數學(xué)建模的方式,可廣泛適用于空間組學(xué)領(lǐng)域各種科學(xué)問(wèn)題的研究,為生命科學(xué)領(lǐng)域提供了革新性、系統性的整體研究方案。此外,Spateo工具包已開(kāi)源,兼容目前包括華大時(shí)空組學(xué)技術(shù)Stereo-seq在內所有的空間組學(xué)技術(shù),我們歡迎各領(lǐng)域科研工作者使用,共同推動(dòng)時(shí)空組學(xué)生命研究進(jìn)展。
論文第一作者、斯坦福醫學(xué)院邱肖杰教授認為,Spateo代表了我們在創(chuàng )建預測性虛擬胚胎模型的道路上的重要里程碑。與其它方法不同,Spateo能夠將生物系統視為一個(gè)相互連接的整體,而不僅僅是單個(gè)細胞,這在揭示先天性疾病背后的分子機制方面具有巨大的潛力,對促進(jìn)人類(lèi)健康具有深遠的影響。
文章通訊作者、華大研究院院長(cháng)徐訊研究員表示,時(shí)空組學(xué)技術(shù)給生物學(xué)研究帶來(lái)了巨大的機遇,而對時(shí)空組學(xué)大數據分析是當前的巨大挑戰。Spateo是一個(gè)重大飛躍,我們借鑒了多個(gè)學(xué)科的理論知識,通過(guò)算法彌補了實(shí)驗技術(shù)無(wú)法解決的問(wèn)題,譬如切片的細微形變、需要克服不連續間斷取樣造成的數據丟失問(wèn)題,還解決了跨時(shí)間點(diǎn)重構發(fā)育過(guò)程中的細胞分化、遷移等難題。隨著(zhù)時(shí)空技術(shù)的進(jìn)步和普及,相信Spateo這樣的前瞻性算法研究,能為我們真正從時(shí)空維度系統研究生命的過(guò)程奠定基礎。
華大生命科學(xué)研究院白寅琪博士、劉石平研究員、徐訊研究員,武漢大學(xué)馬佳義教授及斯坦福醫學(xué)院邱肖杰教授為該論文共同通訊作者。斯坦福醫學(xué)院邱肖杰教授、麻省理工學(xué)院博士生Daniel Y. Zhu、武漢大學(xué)博士生盧意帆、華大生命科學(xué)研究院與西北大學(xué)聯(lián)合培養本科生姚佳俊、華大生命科學(xué)研究院-中國科學(xué)院大學(xué)博士生荊澤華、Ginkgo Bioworks研究人員Kyung Hoi Min、華大生命科學(xué)研究院博士后成夢(mèng)南為論文共同第一作者。
該項目通過(guò)倫理審查等相關(guān)審批,嚴格遵循相關(guān)法規和倫理準則執行。國際合作僅限于計算建模與數據分析,不涉及任何物質(zhì)或財務(wù)資源。項目中的所有軟件開(kāi)發(fā)均以透明方式進(jìn)行,并可在GitHub上公開(kāi)訪(fǎng)問(wèn),該研究中使用的數據現已公開(kāi)訪(fǎng)問(wèn)。
Spateo使用教程:https://spateo-release.readthedocs.io/en/latest/
論文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(24)01159-0
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com