2月5日,中國(guó)農(nóng)業(yè)科學(xué)院深圳基因組研究所合作研究成果在線發(fā)表于《細(xì)胞(Cell)》。該研究揭示了脊椎動(dòng)物從水生到陸生進(jìn)化歷程呈現(xiàn)三步式演化特征,并分析表明新基因的起源、新調(diào)控原件的出現(xiàn)、基因編碼氨基酸的改變這三類(lèi)遺傳創(chuàng)新在脊椎動(dòng)物從水生到陸生的演化過(guò)程中發(fā)揮了作用?;蚪M所阮玨研究員為并列第一作者,主要參與完成了非洲肺魚(yú)的基因組組裝工作。
![](http://unionsn.com/skin/new/image/lazy.gif)
脊椎動(dòng)物從水生到陸生的轉(zhuǎn)變是脊椎動(dòng)物演化史上的一次飛躍,這一過(guò)程需要在呼吸系統(tǒng)、運(yùn)動(dòng)系統(tǒng)、神經(jīng)系統(tǒng)等方面進(jìn)行各種生理和形態(tài)的革新才能實(shí)現(xiàn)。從硬骨魚(yú)祖先到肉鰭魚(yú)祖先、再到陸生脊椎動(dòng)物各種進(jìn)化改變的遺傳創(chuàng)新基礎(chǔ)是什么,一直是科學(xué)界懸而未決的重大科學(xué)問(wèn)題。經(jīng)過(guò)長(zhǎng)期的古生物學(xué)和脊椎動(dòng)物學(xué)研究,已知現(xiàn)在還存活的四足動(dòng)物的最近魚(yú)類(lèi)近親是肺魚(yú)。因此,解析肺魚(yú)和早期輻鰭魚(yú)類(lèi)這些“活化石”魚(yú)類(lèi)的基因組是解決這一重大問(wèn)題的關(guān)鍵。肺魚(yú)擁有已知脊椎動(dòng)物中最為龐大的基因組40Gb,是人類(lèi)基因組3Gb的10多倍。肺魚(yú)基因組充斥著大量的重復(fù)序列,對(duì)研究人員解析其完整序列提出了極大挑戰(zhàn)。
阮玨帶領(lǐng)團(tuán)隊(duì)參與研究?jī)?yōu)化wtdbg算法,高質(zhì)量解析了迄今為止組裝難度最大的非洲肺魚(yú)基因組。團(tuán)隊(duì)在原開(kāi)發(fā)組裝方法wtdbg-1.2.8的基礎(chǔ)上,一方面大幅擴(kuò)展了算法支持的數(shù)據(jù)容量,使其理論組裝最大基因組高達(dá)1000Gb,滿足所有已知生物的基因組組裝需求;另一方面進(jìn)一步提高了算法的組裝速度,最終開(kāi)發(fā)出組裝算法的新版本wtdbg2。使用wtdbg2算法,僅在3天內(nèi)(192CPU)就完成了1.5TB的三代校正數(shù)據(jù)的分析,得到了39.1Gb的基因組序列(contigs),基于脊椎動(dòng)物核心基因的BUSCO評(píng)估顯示其完整度高達(dá)95%。這一結(jié)果顯示出wtdbg2在攻克最大脊椎動(dòng)物基因組解析研究中的巨大優(yōu)勢(shì)。此次研究的非洲肺魚(yú)基因組不僅是目前最大的基因組,而且是首個(gè)完整且高質(zhì)量的超大基因組,標(biāo)志著我國(guó)科技人員在超大基因組解析方面已經(jīng)達(dá)到國(guó)際頂尖水平。
![](http://unionsn.com/file/image/newsad20210415.jpg)