解開生物細胞演化和疾病演變之謎
港大生物醫(yī)學(xué)工程團隊開發(fā)嶄新生物信息分析技術(shù)
何永基博士和謝堅文教授
何永基博士和謝堅文教授
港大團隊開發(fā)的VIA生物信息分析技術(shù),有助了解人類及其他動物的細胞,如何正常健康地運作、成長,以及在疾病和老化過程中出現(xiàn)變化等。VIA利用一種新穎的“無監(jiān)督式”機器學(xué)習方法,可以處理複雜的單細胞組學(xué)數(shù)據(jù)(單細胞基因組,蛋白組和物理特徵等)
(上)VIA有效率及高度地將小鼠胚胎不同器官形成的先后過程展示出來。(下)VIA可以處理單細胞圖像數(shù)據(jù),揭示細胞週期進程,以及當中細胞質(zhì)量的細微變化及質(zhì)量含量的分佈。細胞週期演化是維持生命的基本細胞代謝過程。如果此過程出錯,可能會導(dǎo)致不同疾病,包括癌癥。
細胞是生命的基本單位,人體內(nèi)的細胞經(jīng)過長期不斷演化形成不同形態(tài),建構(gòu)各種器官,免疫系統(tǒng)等,細胞老化或在演變過程中出現(xiàn)問題會衍生各種疾病。
過去一個多世紀,科學(xué)家一直努力鑽研不同的方法,試圖拆解細胞中蘊含的大量生物訊息,期望更透徹了解細胞運作及細胞在正常健康或老化過程中出現(xiàn)的變化,更重要的是預(yù)知如癌癥等疾病的形成、發(fā)展和預(yù)后情況等。而細胞的基因序列和相互關(guān)係、蛋白質(zhì)成分和代謝物等的組學(xué)研究,涉及大量的數(shù)據(jù)分析,拆解需要能處理龐大數(shù)據(jù)的運算方法,這一直是個巨大的挑戰(zhàn)。
香港大學(xué)(港大)工程學(xué)院電機電子工程系謝堅文教授領(lǐng)導(dǎo)的跨學(xué)科研究團隊,開發(fā)了一種能處理龐大數(shù)據(jù)并作出推算的新穎計算工具,一些內(nèi)地和海外的科研團隊,已應(yīng)用于新冠病毒研究,追蹤人體接種疫苗后,對不同病毒的免疫反應(yīng)。研究成果已于學(xué)術(shù)期刊《自然通訊》(Nature Communications)內(nèi)發(fā)表。
“目前有各種具高度的“組學(xué)技術(shù)”,收集有關(guān)單細胞的多方面信息,例如細胞中“打開/關(guān)閉”的基因目錄或細胞中存在的蛋白質(zhì)類型等,但這些計算方法都無法處理龐大(超過數(shù)百萬個細胞)的複雜單細胞組學(xué)數(shù)據(jù),而很多時僅用來分析某一項特定的細胞特徵。因此,我們一直缺乏有效的解決方案,對細胞的發(fā)展作全面的軌跡推斷。”研究團隊成員李嘉誠醫(yī)學(xué)院生物醫(yī)學(xué)學(xué)院副教授何永基博士說。
謝堅文教授進一步解釋:“細胞在正常健康和疾病過程中演變成不同的細胞狀態(tài)和類型,要準確預(yù)測這些演變的軌跡,從而了解身體如何正常發(fā)育及如何染病等,我們需有能力測量和分析每個細胞的所有相關(guān)特徵。這就好像登山者在山峰循不同的途經(jīng)進發(fā),我們在出發(fā)前向每位登山者深入查問,收集他/她的身份、登山裝備、身體/精神狀況等信息后作運算,從而推算出他們的登山軌跡,甚至預(yù)知他們會如何應(yīng)變,是否成功等?!敝x教授也是工學(xué)學(xué)士(生物醫(yī)學(xué)工程)課程總監(jiān)。
謝教授團隊開發(fā)的名為VIA的新軌跡推理算法,利用一種新穎的“無監(jiān)督式”機器學(xué)習方法,模擬人類的思維過程,像人腦般發(fā)掘數(shù)據(jù)背后的邏輯規(guī)律作推敲。在引導(dǎo)VIA機器學(xué)習的過程中,團隊廣泛收集包括單細胞蛋白質(zhì)組學(xué)、基因相關(guān)和其他生物訊息的組學(xué)數(shù)據(jù),對各個重要的生物過程作了全面的分析研究。
“我們的方法,通過新策略能夠有效地識別生物演化的軌跡,無論細胞軌跡有多複雜。需要處理的細胞數(shù)量以百萬計,VIA依然取得良好效果?!痹擁椦芯康淖髡呒半姍C電子工程系學(xué)生Shobana Stassen解釋說。Shobana近獲授港大“校長杰出博士生獎學(xué)金”。
VIA處理數(shù)據(jù)規(guī)模之龐大、度之高,目前未有任何運算方法能及。例如,VIA能推算出在骨髓造血過程中,細胞狀態(tài)微妙複雜的轉(zhuǎn)變,從而可預(yù)測一些像血癌等的病變及病情發(fā)展,為方案提供病理基礎(chǔ)。VIA又能把單個受精卵(單個細胞)變成器官齊全的新個體,複雜、奇特的過程展示出來,團隊利用新運算方式,將小鼠胚胎不同器官形成的先后過程展示出來,當中需要處理達130萬的小鼠胚胎單細胞的基因表現(xiàn)數(shù)據(jù)。
“利用VIA,可以在各種生物過程中,發(fā)現(xiàn)難以捉摸的細胞譜系及稀有細胞變異的情況,這些都是其他方法難以做得到,VIA同時亦為疾病的演變帶來重要啓示。”Shobana Stassen補充說。
團隊又利用VIA來分析細胞的圖像數(shù)據(jù),細胞圖像能顯示細胞的物理特質(zhì),除了組學(xué)資料外,還包含各種細胞的外觀差異,以及隨時間流逝細胞外觀(形態(tài))變化的豐富信息。循細胞的外觀特徵了解并推斷細胞的發(fā)展軌跡,過往少為人探討,而VIA提供了有效的手段。
團隊使用謝教授的研究實驗室新開發(fā)的光學(xué)顯微鏡系統(tǒng),系統(tǒng)具備高速和成像的優(yōu)點,能以比現(xiàn)時任何典型顯微鏡快至少100倍的速度,生成大量高解像度的單細胞圖像數(shù)據(jù)。團隊利用VIA成功揭示了細胞週期進程中細胞質(zhì)量的細微變化及質(zhì)量含量的分佈。細胞週期演化是維持生命的基本細胞代謝過程,如果過程出錯,可能會導(dǎo)致癌癥等病變。這新穎的光學(xué)顯微鏡早前已在《自然-實驗室指南》(Nature Protocols)發(fā)表,謝教授的實驗室已成立初創(chuàng)公司作相關(guān)技術(shù)轉(zhuǎn)移。
謝教授亦是香港研究資助局2020年“研資局研究學(xué)者計劃”的得獎?wù)?,他表示:“基于已完成的前期基礎(chǔ)工作,我們現(xiàn)時與香港和海外的研究人員合作將VIA應(yīng)用于不同的生物醫(yī)學(xué)和生物技術(shù),其中包括跟蹤的效果,以及加速制藥行業(yè)的藥物研發(fā)過程等。我們把VIA設(shè)定為開放使用的工具,與全球科學(xué)家分享,目前在美國和國內(nèi)已有科研團隊,把VIA相關(guān)工具應(yīng)用于新冠病毒研究,包括推斷感染后免疫系統(tǒng)的反應(yīng)、預(yù)測重癥的發(fā)生,疫苗產(chǎn)生的抗體量和反應(yīng),以及對療程的反應(yīng)等,而免卻例如重複抽血檢查等的一些常規(guī)程序?!?/p>