“運(yùn)用傳統(tǒng)的序列信息,人類(lèi)對(duì)m6A修飾的預(yù)測(cè)準(zhǔn)確率只能達(dá)到80%;在此基礎(chǔ)上我們加入了35種其他組學(xué)信息,使準(zhǔn)確率一下子提升到90%。”
近期,由西交利物浦大學(xué)生物科學(xué)系孟佳博士帶領(lǐng)的科研團(tuán)隊(duì),實(shí)現(xiàn)了對(duì)全轉(zhuǎn)錄組RNA分子m6A修飾的最精準(zhǔn)預(yù)測(cè),相當(dāng)于為人類(lèi)繪制了迄今為止最精準(zhǔn)的m6A觀轉(zhuǎn)錄修飾地圖。其研究成果已發(fā)表于生物信息領(lǐng)域的一流期刊《核酸研究》(影響因子:11.561)。
該團(tuán)隊(duì)對(duì)m6A修飾出現(xiàn)在基因的位置做出預(yù)測(cè),并盡最大可能提升預(yù)測(cè)的精準(zhǔn)度。
m6A修飾屬于“RNA修飾”的一種。“RNA修飾”指的是發(fā)生在RNA分子上的生物化學(xué)修飾,可以在不改變RNA分子序列信息的情況下改變其特性,并調(diào)控基因信息的表達(dá)。
RNA修飾是個(gè)內(nèi)容及其豐富的研究領(lǐng)域,為當(dāng)前生物科學(xué)領(lǐng)域的熱點(diǎn)內(nèi)容之一。“目前已知的RNA修飾有100多種,其中m6A是含量最高的一種,可能也是最重要、最具有研究?jī)r(jià)值的一種。”孟佳博士解釋道。
“過(guò)去的研究只考慮序列信息,預(yù)測(cè)的準(zhǔn)確率是80%。序列信息是生物信息里最重要的,這點(diǎn)我們不否認(rèn),但還有其他信息也是有價(jià)值的。”孟佳博士說(shuō)。
在RNA修飾領(lǐng)域,西浦是第一個(gè)應(yīng)用35種組學(xué)信息進(jìn)行預(yù)測(cè)的科研團(tuán)隊(duì)。“通過(guò)該方法將預(yù)測(cè)準(zhǔn)確性提升到90%,這是一個(gè)比較大的突破。該工作為RNA修飾領(lǐng)域的研究工作提供了更為可靠的參考信息。”孟佳博士補(bǔ)充道。
在繪制m6A表觀轉(zhuǎn)錄組地圖的過(guò)程中,該團(tuán)隊(duì)運(yùn)用機(jī)器學(xué)習(xí)的技術(shù),通過(guò)已有的特征,訓(xùn)練出預(yù)測(cè)模型,預(yù)測(cè)基因的哪些位置可能與RNA修飾相關(guān)。
“最大的難點(diǎn)是如何構(gòu)建和選擇用于機(jī)器學(xué)習(xí)的特征,”論文第一作者之一、博士生魏震介紹道,“這些特征是我們自己構(gòu)建的。這是研究過(guò)程最基礎(chǔ)最困難的部分,但也是我們能夠取得突破的關(guān)鍵。”
“實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)并了解了基因RNA修飾的位點(diǎn)之后,接下來(lái)就能更容易知道哪些酶會(huì)參與到這個(gè)過(guò)程中來(lái),對(duì)進(jìn)一步研究基因的功能、性狀及其與人類(lèi)某些疾病的關(guān)系會(huì)有一定的價(jià)值。”論文第一作者之一、博士生陳鯤淇補(bǔ)充道。
發(fā)表于《核酸研究》上的這篇論文有四位共同第一作者,他們均為西浦生物科學(xué)系學(xué)生,包括博士生陳鯤淇、博士生魏震、本科畢業(yè)生張晴和博士生吳翔宇。該團(tuán)隊(duì)的指導(dǎo)老師包括生物科學(xué)系的孟佳博士、呂志良教授、榮榮博士以及數(shù)學(xué)科學(xué)系的蘇炯龍博士。孟佳博士為論文的通訊作者。
早在2012年,孟佳博士在美國(guó)麻省理工學(xué)院從事生物信息分析研究時(shí)就開(kāi)始專(zhuān)注于RNA修飾領(lǐng)域的研究。他于2013年回國(guó)加入西交利物浦大學(xué),近年來(lái)其關(guān)于RNA修飾的研究項(xiàng)目獲得了包括國(guó)家自然科學(xué)基金在內(nèi)的多個(gè)科研基金項(xiàng)目的支持。(通訊員:石露蕓 陳炳宇 寇博 田麗萍)