本網(wǎng)訊 近日,安徽農(nóng)業(yè)大學(xué)農(nóng)學(xué)院水稻分子育種創(chuàng)新團(tuán)隊聯(lián)合華中農(nóng)業(yè)大學(xué)、中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所在國際權(quán)威期刊《Plant Biotechnology Journal》(中科院1區(qū)TOP,五年影響因子12.1)在線發(fā)表了題為“MFMGP: an integrated machine learning fusion model for genomic prediction”的研究論文(https://doi.org/10.1111/pbi.14532)。
2024年10月,農(nóng)業(yè)農(nóng)村部印發(fā)《關(guān)于大力發(fā)展智慧農(nóng)業(yè)的指導(dǎo)意見》,進(jìn)一步著重強(qiáng)調(diào)了開發(fā)智能設(shè)計育種工具,推進(jìn)育種智能化進(jìn)程的迫切性。基因組選擇(geomic selection,GS)作為分子育種的關(guān)鍵技術(shù)之一,其相關(guān)基礎(chǔ)研究是提高我國動植物設(shè)計育種水平的重大亟需。因此,開發(fā)一款具有普適性且預(yù)測精度高的GS工具對分子育種應(yīng)用具有重要的理論與實(shí)踐意義。
本研究基于多種機(jī)器學(xué)習(xí)(ML)訓(xùn)練方法,開發(fā)出一款融合模型“MFMGP”,能夠用于預(yù)測動植物育種群體的復(fù)雜農(nóng)藝性狀表型。MFMGP利用指數(shù)衰減權(quán)重的歸一化融合方法,通過為每個ML模型的預(yù)測結(jié)果分配權(quán)重,并對這些權(quán)重應(yīng)用指數(shù)衰減,再通過歸一化這些權(quán)重計算模型預(yù)測結(jié)果的加權(quán)平均值,從而獲得最終的融合預(yù)測結(jié)果。為了測試MFMGP的預(yù)測效果,將其與7種常用的GS模型進(jìn)行比較(傳統(tǒng)模型GBLUP、4種機(jī)器學(xué)習(xí)LightGBM、SVR、XGBoost和HGBoost以及2種深度學(xué)習(xí)DNNGP和DeepCCR),結(jié)合植物中數(shù)據(jù)集(水稻、棉花、小麥與玉米)和動物測試數(shù)據(jù)集(豬),證明MFMGP具有更高的預(yù)測精度和更好的穩(wěn)定性。同時發(fā)現(xiàn),基因型-環(huán)境相互作用影響預(yù)測結(jié)果的準(zhǔn)確度,高遺傳力農(nóng)藝性狀往往具有較高的預(yù)測精度。特別在亞洲栽培稻中,無論是利用秈稻作為訓(xùn)練群體預(yù)測粳稻亞群,或粳稻作為訓(xùn)練群體預(yù)測秈稻亞群,其預(yù)測精度均較低,提示育種家應(yīng)根據(jù)測試群體選擇合適的亞群構(gòu)建訓(xùn)練群體。綜上,MFMGP可以顯著提高預(yù)測精度,縮短育種周期,降低育種成本,有望在動植物育種中具有更廣泛的應(yīng)用。
該研究聯(lián)合了國內(nèi)多家科研單位,實(shí)現(xiàn)了動植物學(xué)科交叉攻關(guān)農(nóng)業(yè)“卡脖子難題”。未來,成果有望吸引更多科研單位和育種公司進(jìn)一步進(jìn)行實(shí)踐和應(yīng)用,打造智能快速育種技術(shù)體系,助力我國分子育種技術(shù)邁向智能化、高效化發(fā)展的新階段。
安徽農(nóng)業(yè)大學(xué)農(nóng)學(xué)院青年教師張超普、華中農(nóng)業(yè)大學(xué)植物科學(xué)技術(shù)學(xué)院已畢業(yè)碩士梁齊齊、喻宇燁為本文的共同第一作者。安徽農(nóng)業(yè)大學(xué)農(nóng)學(xué)院黎珉副教授、華中農(nóng)業(yè)大學(xué)金雙俠教授、安徽農(nóng)業(yè)大學(xué)農(nóng)學(xué)院黎志康講席教授為本文的共同通訊作者。該研究得到了國家自然科學(xué)基金、安徽省自然科學(xué)基金、中國農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程、南繁專項的共同資助。