近日,中國(guó)農(nóng)業(yè)科學(xué)院植物保護(hù)研究所聯(lián)合揚(yáng)州大學(xué)、湖南農(nóng)業(yè)大學(xué)等多家單位在中國(guó)工程院主刊 Engineering (專業(yè)頂刊)上以綠色植物保護(hù)創(chuàng)新(Green Plant Protection Innovation)為方向發(fā)表了題為《Development of Machine Learning Methods for Accurate Prediction of Plant Disease Resistance》的研究成果。該研究通過(guò)優(yōu)化多種機(jī)器學(xué)習(xí)流程,開發(fā)了基于高通量基因型數(shù)據(jù)的作物抗病表型精準(zhǔn)預(yù)測(cè)方法,實(shí)現(xiàn)了對(duì)水稻稻瘟病、紋枯病、黑條矮縮病,以及小麥麥瘟病、條繡病抗性的精準(zhǔn)預(yù)測(cè)。
傳統(tǒng)抗病育種往往通過(guò)篩選已知抗?。≧)基因、依據(jù)病圃抗性鑒定來(lái)選擇抗病新品種。在作物對(duì)不同病害抗性研究中,已知的抗病基因數(shù)量還十分有限,加上近年研究發(fā)現(xiàn),不少感?。⊿)基因突變、能塑造植物健康微生物組的M基因等對(duì)作物的最終抗性表型均起到了重要貢獻(xiàn)。因此,高效選育抗病品種需要充分考慮和利用全基因組信息,但目前基于作物高通量基因型數(shù)據(jù)篩選作物抗病表型的高效精準(zhǔn)方法報(bào)道較少。
為此,本研究以水稻主要病害稻瘟病、紋枯病和黑條矮縮病,以及小麥麥瘟?。–IMMYT已發(fā)表數(shù)據(jù))和條銹病為研究對(duì)象,利用水稻、小麥自然品種資源的高通量基因型數(shù)據(jù)、表型數(shù)據(jù)、通過(guò)全基因組關(guān)聯(lián)分析挖掘抗病關(guān)聯(lián)位點(diǎn)信息,通過(guò)多種機(jī)器學(xué)習(xí)方法對(duì)抗病關(guān)聯(lián)位點(diǎn)基因型和表型進(jìn)行訓(xùn)練以構(gòu)建預(yù)測(cè)模型,基于該模型實(shí)現(xiàn)了基于個(gè)體基因型精準(zhǔn)預(yù)測(cè)其抗病性水平,解決了傳統(tǒng)抗病育種中通常僅依賴少數(shù)抗病基因而不能精準(zhǔn)選擇抗病新材料的問題。
在整體設(shè)計(jì)中,本研究將小麥和水稻核心群體(各包含超過(guò)300個(gè)代表性品種)進(jìn)行多種病害抗性鑒定,對(duì)不同病害的抗性分為R(抗?。┖蚐(感?。﹥煞N類型(去除部分抗感不確定品種),將復(fù)雜的群體數(shù)量抗性問題簡(jiǎn)化為二分類問題;在機(jī)器學(xué)習(xí)訓(xùn)練過(guò)程中,對(duì)取樣過(guò)程進(jìn)行干預(yù),將親緣關(guān)系(K)加入到取樣過(guò)程,使其每次取樣在群體中的分布由隨機(jī)改為均勻,避免訓(xùn)練過(guò)程中的取樣不均。研究結(jié)果表明,在適當(dāng)P閾值范圍內(nèi)(P值代表全基因組關(guān)聯(lián)分析獲得的抗病關(guān)聯(lián)SNP標(biāo)記的關(guān)聯(lián)值),隨機(jī)森林分類(RFC)、支持向量機(jī)分類(SVC)、以及輕量級(jí)梯度提升機(jī)器學(xué)習(xí)(lightGBM)、深度神經(jīng)網(wǎng)絡(luò)(DNNGP)、稠密連接卷積網(wǎng)絡(luò)(DenseNet)等機(jī)器學(xué)習(xí)算法均能實(shí)現(xiàn)較高準(zhǔn)確性預(yù)測(cè)。其中,當(dāng)RFC、SVC、以及l(fā)ightGBM結(jié)合親緣關(guān)系均勻取樣訓(xùn)練情況下,即RFC_K、SVC_K、以及l(fā)ightGBM_K方法(與未結(jié)合K取樣方法相比較)均能顯著提高預(yù)測(cè)準(zhǔn)確性,本研究對(duì)水稻稻瘟病抗性的預(yù)測(cè)準(zhǔn)確性最高達(dá)95%,跨群體預(yù)測(cè)結(jié)合人工接種鑒定確定的準(zhǔn)確性也高達(dá)91%。另外,對(duì)小麥麥瘟病和條銹病的預(yù)測(cè)準(zhǔn)確性分別達(dá)到90%和94%。對(duì)水稻紋枯病和水稻黑條矮縮病兩種公認(rèn)難以準(zhǔn)確鑒定抗病性的病害,其預(yù)測(cè)準(zhǔn)確性都達(dá)到85%。上述結(jié)果說(shuō)明本研究開發(fā)的基于基因型精準(zhǔn)篩選表型的機(jī)器學(xué)習(xí)方法對(duì)于作物多種病害抗性表型預(yù)測(cè)具有廣適性,未來(lái)合理利用可顯著提高作物抗病育種效率。
中國(guó)農(nóng)業(yè)科學(xué)院植物保護(hù)研究所研究生劉琪、揚(yáng)州大學(xué)/生物育種鐘山實(shí)驗(yàn)室左示敏教授為共同第一作者,中國(guó)農(nóng)業(yè)科學(xué)院植物保護(hù)研究所康厚祥副研究員為通訊作者。湖南農(nóng)業(yè)大學(xué)李魏教授、中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所李慧慧研究員和熊葉輝研究員、中國(guó)農(nóng)業(yè)大學(xué)楊俊教授、海南大學(xué)林潤(rùn)茂副教授、揚(yáng)州大學(xué)馮志明副教授等也參與了數(shù)據(jù)分析、論文修改等工作。植保所彭莎莎、彭燁博士,作物所張昊博士也為該研究做出了重要貢獻(xiàn)。該研究受到國(guó)家自然科學(xué)基金國(guó)際合作項(xiàng)目(32261143468)、國(guó)家重點(diǎn)研發(fā)計(jì)劃(2021YFC2600400)、江蘇省種業(yè)振興計(jì)劃(JBGS(2021)001)等項(xiàng)目的聯(lián)合資助。
文章鏈接:https://www.sciencedirect.com/science/article/pii/S2095809924002431
![](http://unionsn.com/file/image/newsad20210415.jpg)