小麥是重要的糧食作物之一。小麥基因組龐大、高度重復(fù)且為異源六倍體,使得小麥的完整組裝面臨挑戰(zhàn)。2018年,國際小麥基因組測序聯(lián)盟發(fā)布了中國春小麥參考基因組。但是,該基因組組裝存在大量未解析的重復(fù)區(qū)域和復(fù)雜序列結(jié)構(gòu),導(dǎo)致小麥基因組學(xué)研究難以全方位覆蓋整個(gè)基因組,阻礙了針對特定區(qū)域開展精細(xì)化研究,制約了小麥基因組學(xué)研究的發(fā)展和育種應(yīng)用。
近日,中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所傅向東研究組與魯非研究組,聯(lián)合中國農(nóng)業(yè)大學(xué)科研人員,綜合利用ONT超長讀長測序、PacBio HiFi高精度測序和Hi-C數(shù)據(jù),實(shí)現(xiàn)了中國春小麥基因組的近完整組裝(CS-CAU)。CS-CAU大小為14.46 Gb,堿基準(zhǔn)確率大于99.9963%,僅剩290個(gè)組裝間隙。其中,1D、3D、4D、5D染色體首次實(shí)現(xiàn)無間隙組裝,1D和5D染色體達(dá)到端粒到端粒級別。
該研究解決了小麥基因組重復(fù)序列高、多倍體復(fù)雜的組裝難題,為解析其他復(fù)雜作物基因組提供了范本?;诮暾蚪M組裝,研究共注釋到151,405個(gè)高置信度基因,其中59,180個(gè)是新注釋基因,包括7,602個(gè)首次組裝出的基因。通過整合RNA-seq數(shù)據(jù)集和跨物種蛋白同源性證據(jù),研究解析了6類種子儲(chǔ)藏蛋白的基因組分布與表達(dá)特征。研究發(fā)現(xiàn),ω-醇溶蛋白表達(dá)完全由B亞基因組貢獻(xiàn),而其他5類SSP表達(dá)則主要由D亞基因組貢獻(xiàn),為剖析小麥面筋品質(zhì)的遺傳基礎(chǔ)和分子改良奠定了基礎(chǔ)。除chr1B的著絲粒存在與超長GAA重復(fù)序列相關(guān)的間隙外,其余20條染色體的著絲粒序列均全部組裝完成。對于著絲粒區(qū)序列組成進(jìn)行分析發(fā)現(xiàn),著絲粒區(qū)域主要由逆轉(zhuǎn)座子構(gòu)成,其中A/B亞基因組著絲粒富含著絲粒相關(guān)反轉(zhuǎn)錄轉(zhuǎn)座子CRW和Quinta,而D亞基因組著絲粒中只有30%的序列為CRW和Quinta。相似的是,串聯(lián)重復(fù)序列在3個(gè)亞基因組間分布存在高度的不均勻性,其中71.89%的簡單串聯(lián)重復(fù)富集于B亞基因組,而接近一半的衛(wèi)星序列則集中于D亞基因組。同時(shí),研究解析了著絲粒區(qū)CRW和Quinta逆轉(zhuǎn)座子的插入時(shí)間,明確了其在3個(gè)亞基因組間的主要擴(kuò)張時(shí)期。
上述研究為小麥遺傳改良和基礎(chǔ)研究提供了關(guān)鍵資源。
相關(guān)研究成果以Near-complete assembly and comprehensive annotation of the wheat Chinese Spring genome為題,在線發(fā)表在《分子植物》(Molecular Plant)上。研究工作得到國家重點(diǎn)研發(fā)計(jì)劃和國家自然科學(xué)基金等的支持。
