發(fā)布時間:2025-02-14
2025年2月5日,中國科學(xué)院廣州生物醫(yī)藥與健康研究院與北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)/昌平實驗室合作在Small Methods期刊上發(fā)表題為Learning Phenotype Associated Signature in Spatial Transcriptomics with PASSAGE的研究論文。該研究創(chuàng)新性地將整張切片作為計算建模的對象,提出了切片級別嵌入(slice-levelembedding)的深度學(xué)習(xí)算法,有效地增強了算法的計算效率和可擴展性,可應(yīng)用到大規(guī)模異質(zhì)性空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)的表型關(guān)聯(lián)空間特征識別。
生命是細(xì)胞有序排列構(gòu)成的整體。單個細(xì)胞在脫離生物體后難以獨立發(fā)揮功能。因此需要聯(lián)合細(xì)胞所處的微環(huán)境和空間位置來全面理解細(xì)胞功能。隨著近年來空間組學(xué)技術(shù)的迅猛發(fā)展,已經(jīng)基于多種技術(shù)平臺產(chǎn)生了大量來自不同組織、器官的空間組數(shù)據(jù),如何精準(zhǔn)表征這些快速增長的海量大規(guī)模異質(zhì)性數(shù)據(jù),不僅是相應(yīng)人工智能方法開發(fā)的重大挑戰(zhàn),也是有效解析其中蘊含豐富生物醫(yī)學(xué)信息的前提。
當(dāng)前的一些計算方法主要關(guān)注于單個或數(shù)個切片中細(xì)胞級別特征,對大量空間轉(zhuǎn)錄組學(xué)切片數(shù)據(jù)處理的效能不足。有別于此,PASSAGE提出基于多層次注意力的大規(guī)模異構(gòu)空間組學(xué)表征方法,從空間組切片(slice)、細(xì)胞與分子多個層次進行不同粒度的表征學(xué)習(xí)與解析,有效增強了計算效率和可擴展性。具體來說,PASSAGE在基于圖注意力自編碼器的細(xì)胞級表征基礎(chǔ)上設(shè)計了注意池化層(attention pooling layer),將同一切片的所有細(xì)胞加權(quán)融合成切片級表征,而后通過由表型信息指導(dǎo)的對比學(xué)習(xí)策略對切片級表征進行優(yōu)化,并進而采用非負(fù)矩陣分解方法獲得基因級別的注意力分?jǐn)?shù),從而實現(xiàn)對特定表型關(guān)聯(lián)空間組學(xué)特征的有效解析(圖1)。
例如,針對來自兩個不同空轉(zhuǎn)平臺(ST,Visium)、42個不同病人的103張乳腺組織與乳腺癌切片,PASSAGE不僅有效處理了不同樣本之間存在的批次效應(yīng),從而準(zhǔn)確識別出不同病人切片中與腫瘤相關(guān)的結(jié)構(gòu)區(qū)域(圖2A)。與此同時,PASSAGE引入的分子水平注意力表征可從注意池化層權(quán)重中獲得與表型高度相關(guān)的基因集,如乳腺癌案例中PASSAGE識別的基因在之前的乳腺癌研究中已被發(fā)現(xiàn)與疾病進程高度相關(guān),從而體現(xiàn)了模型較高的生物學(xué)可解釋性(圖2B)。此外,PASSAGE在鱗狀細(xì)胞癌數(shù)據(jù)集與三級淋巴結(jié)陽性的腎細(xì)胞癌數(shù)據(jù)集的表現(xiàn)均體現(xiàn)了方法的優(yōu)良可拓展性,有望為癌癥等復(fù)雜疾病的空間特征和分子機制解析提供全新思路。
值得指出的是,上述多尺度表征學(xué)習(xí)架構(gòu)使得PASSAGE可以有效實現(xiàn)針對大規(guī)模異質(zhì)性空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)的相關(guān)組學(xué)特征系統(tǒng)性解析,一張常規(guī)4090消費級別GPU卡的算力即可達到平均每分鐘600個空間點/細(xì)胞的處理速度。隨著融入更多的訓(xùn)練數(shù)據(jù)以及對架構(gòu)進一步優(yōu)化,PASSAGE有潛力構(gòu)建空間轉(zhuǎn)錄組學(xué)的基礎(chǔ)性人工智能算法模型。
中國科學(xué)院廣州生物醫(yī)藥與健康研究院彭廣敦研究員、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)/昌平實驗室高歌教授和曹智杰博士為該論文共同通訊作者,實驗室二年級碩士研究生郭臣凱與北京大學(xué)生命科學(xué)學(xué)院博士生夏辰睿為論文的共同第一作者。研究工作得到了國家自然科學(xué)基金、國家重點研發(fā)計劃、中國博士后基金、基因功能研究與操控全國重點實驗室、北京未來基因診斷高精尖創(chuàng)新中心和昌平實驗室的支持。
圖 1 PASSAGE模型的結(jié)構(gòu)示意圖
圖2 ?A) PASSAGE在乳腺癌案例中成功學(xué)習(xí)到良好的切片級表征與所識別的表型關(guān)聯(lián)空間特征?B) PASSAGE在乳腺癌案例中成功學(xué)習(xí)到與表型關(guān)聯(lián)空間特征高度關(guān)聯(lián)的基因集
附件下載: