2月8日,華中農(nóng)業(yè)大學(xué)生物信息團(tuán)隊(duì)楊慶勇教授課題組在國(guó)際學(xué)術(shù)期刊Molecular Plant在線發(fā)表題為“BnVIR: bridging the genotype-phenotype gap to accelerate mining of candidate variations for traits in Brassica napus”的研究論文,該研究建立了甘藍(lán)型油菜基因型與基因表達(dá)、表型的關(guān)聯(lián),為快速、高效地挖掘油菜候選變異/基因提供了平臺(tái)。
該研究首先構(gòu)建了一套由2,311個(gè)甘藍(lán)型油菜核心種質(zhì)鑒定的10,090,561個(gè)遺傳變異的數(shù)據(jù)集,其中包括SNP、InDel和不同種類的SV,這是目前已發(fā)表的最為系統(tǒng)、最為完整的甘藍(lán)型油菜遺傳變異集合。該研究以其中1,703個(gè)材料的18個(gè)性狀的表型數(shù)據(jù)和309個(gè)材料的RNA-seq數(shù)據(jù)為基礎(chǔ),構(gòu)建出甘藍(lán)型油菜變異信息資源數(shù)據(jù)庫(kù)BnVIR(http://yanglab.hzau.edu.cn/BnVIR)(圖1)。
![](http://unionsn.com/skin/new/image/lazy.gif)
圖1 BnVIR數(shù)據(jù)庫(kù)主頁(yè)、構(gòu)建流程和概貌
該數(shù)據(jù)庫(kù)提供了群體水平的遺傳變異基因型與表型和基因表達(dá)量的關(guān)聯(lián),可輔助快速挖掘與油菜性狀相關(guān)的候選變異和基因(圖2)。此外,該數(shù)據(jù)庫(kù)為甘藍(lán)型油菜種質(zhì)資源的查詢、群體遺傳學(xué)和進(jìn)化分析以及關(guān)聯(lián)分析等提供了多種工具。最后,該研究通過挖掘一些已報(bào)道的(如FLC.A10、FAE1.A08、FAE1.C03、FAD2.A05)和新鑒定的候選基因和功能變異的案例分析,以及獨(dú)立表型數(shù)據(jù)集的檢驗(yàn)分析等系列工作,系統(tǒng)全面地展示了該數(shù)據(jù)平臺(tái)在挖掘與表型相關(guān)的候選變異和基因的潛力、可靠性與穩(wěn)健性(圖3)。與現(xiàn)有甘藍(lán)型油菜數(shù)據(jù)庫(kù)不同,BnVIR提供了更加全面、更加豐富的變異及其與多個(gè)組學(xué)數(shù)據(jù)的關(guān)聯(lián)和更加友好和豐富的用戶界面,可顯著提高研究者挖掘候選變異和基因的效率,并為甘藍(lán)型油菜的分子育種開發(fā)提供有價(jià)值的標(biāo)記。
![](http://unionsn.com/skin/new/image/lazy.gif)
圖2 使用BnVIR數(shù)據(jù)庫(kù)驗(yàn)證/挖掘候選基因/變異的實(shí)例
遺傳變異是物種表型多樣性形成的物質(zhì)基礎(chǔ),包括單核苷酸多態(tài)性(SNP),小片段的插入/缺失(InDel)以及大規(guī)模結(jié)構(gòu)變異(SV)。目前,遺傳變異已被廣泛應(yīng)用于人類疾病、動(dòng)植物重要農(nóng)藝或經(jīng)濟(jì)性狀相關(guān)遺傳位點(diǎn)的鑒定、重要功能基因的克隆、分子標(biāo)記輔助選擇育種等工作。對(duì)于作物遺傳育種,準(zhǔn)確了解遺傳變異對(duì)基因的調(diào)控效應(yīng)以及與表型分化的關(guān)聯(lián),對(duì)種質(zhì)資源的精準(zhǔn)鑒定和優(yōu)異等位基因的挖掘具有重要作用。
油菜作為世界四大油料作物之一,在全球范圍內(nèi)為人類的生活和生產(chǎn)提供優(yōu)質(zhì)的食用植物油和飼料蛋白來(lái)源。我國(guó)年均油菜生產(chǎn)和消費(fèi)居世界首位,常年種植面積1億畝左右,占油料作物面積的50%以上,油菜安全生產(chǎn)在保障我國(guó)食用油供應(yīng)和蛋白飼料需求上發(fā)揮著重要作用。近年來(lái),經(jīng)過一代又一代油菜科學(xué)家的努力,我國(guó)油菜研究實(shí)現(xiàn)了從理論、技術(shù)、產(chǎn)品到轉(zhuǎn)化的鏈?zhǔn)絼?chuàng)新,推動(dòng)了我國(guó)油菜基礎(chǔ)研究與應(yīng)用步入世界第一方陣(《中國(guó)農(nóng)業(yè)農(nóng)村科技發(fā)展報(bào)告(2012—2017)》)。然而,當(dāng)前我國(guó)油菜大多仍以常規(guī)育種與分子標(biāo)記輔助選擇育種技術(shù)為主,與國(guó)外大規(guī)模應(yīng)用的以基因組選擇為核心的分子育種技術(shù)相比,在品種育成速度、成功率及效率等方面仍有較大差距。因此,如何將基礎(chǔ)研究中長(zhǎng)期積累的資源和多組學(xué)數(shù)據(jù)(基因組、轉(zhuǎn)錄組等)優(yōu)勢(shì)轉(zhuǎn)化成育種優(yōu)勢(shì),是當(dāng)前油菜遺傳育種的核心研究?jī)?nèi)容之一。
隨著后基因組代的到來(lái),作物科學(xué)領(lǐng)域已積累海量數(shù)據(jù),利用生物信息技術(shù)將大規(guī)模的多組學(xué)數(shù)據(jù)進(jìn)行系統(tǒng)的整合和分析,并構(gòu)建更友好的圖形化、可視化數(shù)據(jù)庫(kù),將極大促進(jìn)重要農(nóng)藝性狀的功能基因的發(fā)掘及機(jī)制解析,推動(dòng)優(yōu)異種質(zhì)資源的開發(fā)和利用,加快品種選育。這對(duì)發(fā)展高效、精準(zhǔn)的新一代生物育種,打贏種業(yè)翻身仗具有重要意義。該研究不僅為甘藍(lán)型油菜今后的遺傳育種提供了重要平臺(tái),也為其他作物進(jìn)行整合和利用多組學(xué)數(shù)據(jù)推動(dòng)育種產(chǎn)業(yè)發(fā)展提供重要參考。
我校信息學(xué)院楊慶勇教授為論文通訊作者,信息學(xué)院已畢業(yè)博士生楊植全(現(xiàn)廣州大學(xué)博士后)、博士研究生梁聰園和碩士研究生魏璐露為論文共同第一作者。我校作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室周永明教授、郭亮教授對(duì)本研究提供了重要指導(dǎo)。該研究得到國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研究發(fā)展計(jì)劃和中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目資助。
楊慶勇教授課題組近年來(lái)聚焦“油菜基因組學(xué)與分子育種”研究方向,先后與國(guó)內(nèi)多個(gè)研究團(tuán)隊(duì)合作,通過系統(tǒng)整合和分析甘藍(lán)型油菜的多組學(xué)數(shù)據(jù),構(gòu)建了首個(gè)油菜泛基因組(Nature Plants, 2020)及其數(shù)據(jù)庫(kù)BnPIR(Plant Biotechnology Journal, 2021)、油菜轉(zhuǎn)錄組數(shù)據(jù)庫(kù)BnTIR (Plant Biotechnology Journal, 2021)、油菜遺傳變異數(shù)據(jù)庫(kù)BnVIR(Molecular Plant, 2022)和植物遺傳變異參考面板數(shù)據(jù)庫(kù)Plant-ImputeDB (Nucleic Acids Research, 2021),搭建了我國(guó)自主可控的油菜參考基因組生態(tài)。目前在Molecular Plant、Nature Plants、Nucleic Acids Research、Plant Biotechnology Journal等雜志發(fā)表多篇油菜基因組和數(shù)據(jù)庫(kù)論文。
【英文摘要】
Genetic variations, which range from single nucleotide polymorphisms (SNPs) and short insertion/deletions (InDels) to large-scale structural variations (SVs), are the basis of phenotypic diversity. Understanding the effect of genetic variations on traits is critical for uncovering the genetic architecture of various phenotypes. In humans, great efforts have been made to catalog the huge amounts of variations in single locus and their functional and phenotypic impacts, as well as detect the genetic interactions between loci underlying complex diseases, which are of great significance for pathologic studies (Civelek and Lusis 2014; Karczewski et al., 2020; Li et al., 2013)。 In plants, the functional and phenotypic impacts of genetic variations remain largely unknown. As an important oil crop, Brassica napus (B. napus) provides high-quality vegetable oil and feed protein worldwide (Chalhoub et al., 2014)。 Substantial genotypic, transcriptomic and phenotypic data of B. napus have become available in public databases recently (Liu et al., 2021; Song et al., 2020; Yan et al., 2021), which provide important resources for molecular marker-assisted breeding and genetic improvement of B. napus. However, the mining of candidate variations/genes has been largely hindered by the lack of solid association between genotype and phenotype and the corresponding platform (Yan et al., 2021)。 Here, to bridge the gap between genotype and phenotype, we first constructed a large panel of genetic variations, and presented the most systematic and complete variations of B. napus, including SNPs, InDels and various SVs. Then, phenotype data from traits of 1,703 accessions and RNA-seq data of 309 accessions were used as a basis to assemble a B. napus variation information resource (BnVIR; http://yanglab.hzau.edu.cn/BnVIR)。 The database provides genotype-phenotype maps for rapid mining of candidate variations/genes associated with various traits in B. napus. Besides, it is the first platform for checking the genetic interactions between candidate loci or genes associated with quantitative traits.
論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674205222000508
![](http://unionsn.com/file/image/newsad20210415.jpg)