科學(xué)家開發(fā)新的適體生成計(jì)算模型,應(yīng)用廣泛
來(lái)自日本的研究人員近開發(fā)了 RaptGen,這是一種重要的計(jì)算模型,可用于新的適體生成
適體是通過(guò)指數(shù)富集 (SELEX) 系統(tǒng)進(jìn)化配體產(chǎn)生的單鏈寡核苷酸。它們具有廣泛的應(yīng)用,但計(jì)算方法對(duì)于有效識(shí)別候選適體是必要的。來(lái)自日本的一組研究人員現(xiàn)已開發(fā)出 RaptGen,這是一種變分自動(dòng)編碼器,可有效發(fā)現(xiàn)輸入 SELEX 數(shù)據(jù)集中未包含的新適配體。這種新穎的計(jì)算模型有朝一日可能成為適體生成的標(biāo)準(zhǔn)方法。
寡核苷酸是合成 DNA 或 RNA 的短單鏈。盡管很小,但這些分子在分子和合成生物學(xué)應(yīng)用中發(fā)揮著重要作用。一種寡核苷酸——適體——可以選擇性地與特定靶標(biāo)結(jié)合,例如蛋白質(zhì)、肽、碳水化合物、病毒、毒素、金屬離子甚至活細(xì)胞。由于它們與抗體相似,它們?cè)谏飩鞲衅?、和診斷領(lǐng)域具有多種用途。然而,與抗體相比,適體不會(huì)在我們體內(nèi)引起免疫反應(yīng),并且易于合成和修飾。此外,適配體的三維折疊結(jié)構(gòu)使其能夠與更廣泛的目標(biāo)結(jié)合。
適體通常由體外選擇和擴(kuò)增技術(shù)產(chǎn)生,稱為指數(shù)富集配體系統(tǒng)進(jìn)化,或 SELEX。簡(jiǎn)而言之,SELEX 基于核苷酸的結(jié)合、分離和擴(kuò)增的重復(fù)循環(huán)。這個(gè)過(guò)程會(huì)產(chǎn)生一個(gè)豐富的核苷酸序列庫(kù),然后對(duì)其進(jìn)行分析以進(jìn)行候選選擇。高通量 SELEX (HT-SELEX) 可以生成大量候選適體,但目前實(shí)際適用的測(cè)序僅允許我們?cè)u(píng)估有限數(shù)量的這些候選物(大約 10 6)。因此,計(jì)算過(guò)程對(duì)于優(yōu)化新適體的發(fā)現(xiàn)至關(guān)重要。
據(jù)報(bào)道,基于變分自動(dòng)編碼器(VAE,一種機(jī)器學(xué)習(xí)方法)的化合物設(shè)計(jì)有利于發(fā)現(xiàn)其他小分子。現(xiàn)在,由日本早稻田大學(xué)高等科學(xué)與工程研究生院的 Michiaki Hamada 教授領(lǐng)導(dǎo)的一組研究人員介紹了 RaptGen,這是一種可用于適體生成的 VAE。在他們于 2022 年 6 月 2 日在Nature Computational Science上發(fā)表的論文中,他們描述了 RaptGen 如何使用帶有輪廓隱藏馬爾可夫模型解碼器的 VAE 來(lái)創(chuàng)建序列可以形成簇的潛在空間。通過(guò)使用這種潛在表示,RaptGen 能夠生成甚至不包含在原始測(cè)序數(shù)據(jù)或 HT-SELEX 數(shù)據(jù)集中的適配體。
當(dāng)被問(wèn)及 RaptGen 究竟如何促進(jìn)適體發(fā)現(xiàn)時(shí),Hamada 教授說(shuō):“ RaptGen 首先用序列基序可視化一個(gè)潛在空間,然后通過(guò)這個(gè)潛在空間生成多個(gè)新的適體序列。例如,它通過(guò)在分析序列子集的活動(dòng)后考慮附加信息,在潛在空間中搜索優(yōu)化的適體序列。此外,RaptGen 能夠設(shè)計(jì)縮短(或截?cái)啵┑倪m體序列。”
該團(tuán)隊(duì)還通過(guò)使用來(lái)自兩個(gè)獨(dú)立 HT-SELEX 數(shù)據(jù)集的數(shù)據(jù)成功地評(píng)估了 RaptGen 的性能。RaptGen 可以以活動(dòng)引導(dǎo)的方式生成適體衍生物,并提供優(yōu)化其活動(dòng)的機(jī)會(huì)?!?em style="box-sizing: inherit;">這很重要,因?yàn)檫@意味著 RaptGen 可以生成具有所需特性的序列,例如抑制某些酶或蛋白質(zhì)-蛋白質(zhì)相互作用, ” Hamada 教授解釋說(shuō)。這些分子的應(yīng)用可能會(huì)在未來(lái)打開許多大門。
展望未來(lái),該團(tuán)隊(duì)計(jì)劃進(jìn)行廣泛的研究,評(píng)估替代模型是否可以提高 RaptGen 的性能,以及 RaptGen 是否可以通過(guò)使用 RNA 序列來(lái)促進(jìn) RNA 適體的生成。使用 RaptGen 的缺點(diǎn)是計(jì)算成本高和訓(xùn)練時(shí)間增加,這兩者都可以在進(jìn)一步的研究中得到改進(jìn)。
Hamada 教授總結(jié)說(shuō):“據(jù)我們所知,RaptGen 是可以直接從 HT-SELEX 數(shù)據(jù)設(shè)計(jì)和優(yōu)化截?cái)噙m配體的數(shù)據(jù)驅(qū)動(dòng)方法。我們相信,在適當(dāng)?shù)臅r(shí)候,RaptGen 將被公認(rèn)為高效適體發(fā)現(xiàn)的關(guān)鍵工具。”
這是他們對(duì)擁有更好療法的健康長(zhǎng)壽社會(huì)的愿景!
參考
作者: Natsuki Iwano 1、 Tatsuo Adachi 2、 Kazuteru Aoki 2、 Yoshikazu Nakamura 2和Michiaki Hamada 1,3,4
原始論文標(biāo)題: Generative aptamer discovery using RaptGen
期刊: Nature Computational Science
DOI: 10.1038 / s43588-022-00249 -6
隸屬關(guān)系
1 :早稻田大學(xué)科學(xué)與工程研究生院
2 : 東京 RIBOMIC Inc.
3 :國(guó)立先進(jìn)工業(yè)科學(xué)技術(shù)研究院 (AIST)計(jì)算生物大數(shù)據(jù)開放創(chuàng)新實(shí)驗(yàn)室 (CBBD-OIL )
4 : 研究生院日本醫(yī)科大學(xué)醫(yī)學(xué)系