皺皮木瓜(Chaenomeles speciosa),又名貼梗海棠,為薔薇科木瓜海棠屬落葉灌木。皺皮木瓜花朵艷紅,貼生枝干之上,鮮艷奪目。陸游“千點猩紅蜀海棠,誰憐雨里作啼妝”中所指便是貼梗海棠。除觀賞價值外,皺皮木瓜還兼具食用價值與藥用價值,其干果富含齊墩果酸和熊果酸,具有抗菌抗炎、抗病毒、抗氧化等作用。構(gòu)建皺皮木瓜高質(zhì)量基因組,解析皺皮木瓜藥用成分生物合成途徑,可為調(diào)控其重要藥用成分的生物合成、提高藥用木瓜品種提供新見解、新途徑。
近日,華中農(nóng)業(yè)大學(xué)藥用植物學(xué)梅之南教授團隊聯(lián)合南京農(nóng)業(yè)大學(xué)、中南民族大學(xué)、國藥集團中聯(lián)藥業(yè)有限公司、武漢碳碼生物科技有限公司以及北卡羅萊納州立大學(xué)等單位科研人員在園藝一區(qū)(1/36)Horticulture Research上聯(lián)合發(fā)表題為“A Telomere-to-telomere Reference Genome Provides Genetic Insight into the Pentacyclic Triterpenoid Biosynthesis in Chaenomeles speciosa”的研究論文。該研究通過HiFi和Hi-C測序,構(gòu)建了首個皺皮木瓜T2T參考基因組,并結(jié)合比較基因組解析皺皮木瓜的三萜生物合成機制,為了解薔薇科植物馴化和植物進化提供了寶貴的資源。
皺皮木瓜為二倍體植物,原產(chǎn)于中國,廣泛栽培于世界各地。基于基因組survey,研究團隊評估了皺皮木瓜基因組大小約為650.4 Mb。隨后進行PacBio HiFi和Hi-C測序,利用Hifiasm組裝出兩套單體型,Hap1和Hap2。Hap1的基因組大小為592.84 Mb,包含230個contigs (N50為25.57 Mb),125個scaffold (N50為36.12 Mb),GC含量為37.41%。Hap2基因組大小為608.28 Mb,包含97個contigs (N50為29.34 Mb), 42個scaffold (N50為36.92 Mb), GC含量為37.25%。Hap1和Hap2,在基因組大小和基因數(shù)量方面具有相似性,同時具有良好的共線性。此外,兩個單倍型基因組之間的單核苷酸多態(tài)性(SNP)、插入-缺失(InDels)和結(jié)構(gòu)變異(SV)存在明顯差異,為了解皺皮木瓜遺傳多樣性提供了大量信息來源?;贖ap1和Hap2,研究團隊組裝了T2T水平的皺皮木瓜基因組。其基因組全長650.4Mb,contig N50為35.5Mb。其中,632.3 Mb被錨定在17條染色體上,有12條染色體僅有1條contig組成,在11條染色體兩端鑒定到端粒,17條染色體上均鑒定到著絲粒。BUSCO評估結(jié)果、LAI評分、二三代數(shù)據(jù)比對結(jié)果均證實了組裝基因組良好的完整性和準(zhǔn)確性。
研究團隊使用從頭注釋和同源注釋的方法來鑒定重復(fù)序列,49.5%的皺皮木瓜基因組序列被預(yù)測為重復(fù)序列,約312.9 Mb。序列分析表明,重復(fù)序列主要由TE組成。其中,LTR最為豐富,占整個基因組的36.3%,包括Gypsy元件(22.7%)、Copia元件(7.3%)和其它序列。
基于從頭注釋、同源注釋和轉(zhuǎn)錄組注釋,共在皺皮木瓜中基因組中預(yù)測到45515個高置信度的蛋白編碼基因,其中93%的基因都能得到功能注釋。共鑒定到685個tRNA、4205個rRNA、274個snRNA和739個snoRNA。
研究團隊選擇11個物種與皺皮木瓜進行比較基因組學(xué)分析?;蚣易寰垲惙治霰砻?1個物種中普遍存在6958個基因家族,皺皮木瓜存在5658個特有基因家族。GO富集分析表明這些特有基因主要參與輔因子代謝、輔酶代謝和蛋氨酸代謝過程。KEGG富集分析表明,物種特有基因主要參與碳代謝、丙酮酸代謝、半乳糖代謝和萜類物質(zhì)生物合成。系統(tǒng)進化發(fā)育分析表明,皺皮木瓜和蘋果、杜梨、西洋梨被聚類在一起,它們可能由同一祖先進化而來。皺皮木瓜和蘋果的分化時間約為10.0個百萬年前,蘋果族與桃亞屬的祖先在約10.92個百萬年前分化,薔薇科物種在約98.81個百萬年前分化?;蚣易迨湛s擴張分析表明,皺皮木瓜有320個基因家族發(fā)生擴張,與蘋果擴張基因家族數(shù)量相似;有158個基因家族發(fā)生收縮,約為蘋果收縮基因家族的50%。皺皮木瓜收縮的基因家族主要富集于脂質(zhì)轉(zhuǎn)運、信號轉(zhuǎn)導(dǎo)過程等,擴張的基因家族與單萜類、二苯乙烯庚烷類、姜辣素、亞油酸、類黃酮、倍半萜類和三萜類的生物合成有關(guān)。
六種薔薇科物種的系統(tǒng)發(fā)育分析表明,西洋梨、蘋果、皺皮木瓜同屬一個分支,約46個百萬年前從同一祖先分化而來。這三個物種共同經(jīng)歷了一次四倍化事件,導(dǎo)致它們的染色體數(shù)量加倍,達到16條。WGD分析顯示,Ks分布在0.2~0.3處出現(xiàn)了顯著峰值,這一事件可能與西洋梨、蘋果、皺皮木瓜中近期發(fā)生的四倍化事件有關(guān)。
齊墩果酸和熊果酸是羥基五環(huán)三萜烯酸,《中國藥典》中以齊墩果酸和熊果酸含量作為木瓜中藥材質(zhì)量控制的重要指標(biāo)。植物五環(huán)三萜類化合物主要由甲羥戊酸途徑和戊糖磷酸途徑合成。本研究將皺皮木瓜與其它七個物種中涉及甲羥戊酸途徑的四個基因家族進行比較,發(fā)現(xiàn)皺皮木瓜基因組中存在11個β-香樹素合酶基因,其中10個基因分布在9號染色體上的兩個基因簇中?;虼?的長度從12,157,281 bp到12,428,418 bp,包含8個β-香樹素合酶基因,9個其它基因和64個LTR反轉(zhuǎn)錄轉(zhuǎn)座子?;虼?的長度從31,206,028 bp到31,327,645 bp,包括2個β-香樹素合酶基因,5個其它基因和29個LTR反轉(zhuǎn)錄轉(zhuǎn)座子。
基因家族的鑒定進一步揭示了2個角鯊烯合酶的成員、12個角鯊烯2,3-氧化環(huán)化酶的成員、11個β-香樹素合酶的成員和9個β-香樹脂醇28-單加氧酶的成員。與其它薔薇科物種相比,角鯊烯合酶、β -amyrin合酶和β-香樹脂醇28-單加氧酶基因家族在皺皮木瓜基因組中顯著擴張,這可能是該物種具有高含量的齊墩果酸和熊果酸的原因。
本研究通過HiFi和Hi-C測序構(gòu)建了首個木瓜屬植物皺皮木瓜的T2T基因組,通過比較基因組分析確定了皺皮木瓜擴張和收縮的基因家族與植物代謝或生物過程的關(guān)聯(lián),鑒定了與齊墩果酸和熊果酸生物合成途徑相關(guān)的基因家族,為了解植物五環(huán)三萜類物質(zhì)的生物合成提供了寶貴的資源,為了解薔薇科植物馴化提供了新的見解。
我校賀少方和張毅鵬、國藥集團中聯(lián)藥業(yè)有限公司翁端陽為論文共同第一作者,植物科學(xué)技術(shù)學(xué)院舒少華副教授、王學(xué)奎副教授和南京農(nóng)業(yè)大學(xué)虞夏清副教授為共同通訊作者。該研究得到了湖北省產(chǎn)業(yè)鏈關(guān)鍵項目(2021ACA004和2022AC003-01-003)的資助。
【英文摘要】
Chaenomeles speciosa (2n?=?34), a medicinal and edible plant in the Rosaceae,is commonly used in traditional Chinese medicine. To date, the lack of genomicsequence and genetic studies has impeded efforts to improve its medicinalvalue. Herein, we report the use of an integrative approach involving PacBioHiFi (third-generation) sequencing and Hi-C scaffolding to assemble ahigh-quality telomere-to-telomere genome of C. speciosa. Thegenome comprised 650.4 Mb with a contig N50 of 35.5 Mb. Of these, 632.3 Mb wereanchored to 17 pseudo-chromosomes, in which 12, 4, and 1 pseudo-chromosomeswere represented by a single contig, two contigs, and four contigs,respectively. Eleven pseudo-chromosomes had telomere repeats at both ends, andfour had telomere repeats at a single end. Repetitive sequences accounted for49.5% of the genome, while a total of 45,515 protein-coding genes have beenannotated. The genome size of C. speciosa wasrelatively similar to that of Malus domestica.Expanded or contracted gene families were identified and investigated for theirassociation with different plant metabolisms or biological processes. Inparticular, functional annotation characterized gene families that wereassociated with the biosynthetic pathway of oleanolic and ursolic acids, twoabundant pentacyclic triterpenoids in the fruits of C. speciosa. Taken together, this telomere-to-telomereand chromosome-level genome of C. speciosa notonly provides a valuable resource to enhance understanding of the biosynthesisof medicinal compounds in tissues, but also promotes understanding of theevolution of the Rosaceae.
論文鏈接:https://doi.org/10.1093/hr/uhad183
![](http://unionsn.com/file/image/newsad20210415.jpg)