玉米穗軸是玉米產量的重要組成部分,在本地品種和現代品種中表現出高度的大小、形狀和顏色多樣性。該文章開發了一系列表型方法來實現高通量測量玉米穗軸的相關性狀。近年來,卷積神經網絡 (CNN) 等深度學習方法的快速發展,為高通量表型分析提供的新方法與思路。該文使用來自秘魯的本地玉米地方品種制作了大型的多樣圖像數據集,并將基于深度學習的圖像分割方法與經典的圖像處理方法進行了分析比較。
方法處理流程:
使用Mask R-CNN網絡分割出標尺的掩膜以及玉米穗軸的掩膜。通過圖像處理算法提取玉米穗軸的長度、直徑、平均 RGB 顏色以及形狀參數如橢圓度和不對稱性。并且通過測量單個標尺的輪廓,將以像素為單位的玉米穗軸長度和直徑測量值轉換為真實世界的厘米值。
三種圖像分析方法的比較表明,在一組不同的玉米穗軸圖像上訓練的 Mask R-CNN 結果優于Felzenszwalb-Huttenlocher 算法和基于窗口的 CNN 的經典圖像分析算法,因為Mask R-CNN算法對圖像質量沒有嚴苛的要求并且有著非常高的魯棒性能保證較好的分割精度(r=0.99)。并且作者將Mask R-CNN集成到一個高通量的處理流程之中,同時對圖像中的玉米穗軸以及標尺進行分割,對8個表型性狀進行自動定量分析,包括直徑、長度、橢圓度、不對稱度、長寬比和穗軸顏色通道R、G、B的平均值。統計分析確定了在該任務中可實現模型有效迭代的關鍵訓練超參數。作者還發現,少量的10–20張圖像足以很好地訓練Mask R-CNN模型,以處理不同的玉米穗軸圖像。
使用三種圖像分割方法(Felzenszwalb-Huttenlocher分割法、滑動窗CNN分割法、Mask R-CNN分割法)預測出來的玉米穗軸性狀與真實值的 Pearson 相關性。每個圖像的(x 軸)代表真實值,(y 軸)預測值。(a, c)展示的是玉米穗軸長度預測值和真實值的散點圖,(b, d) 展示的是玉米穗軸直徑預測值和真實值的散點圖。按數據集劃分的不同,分為 ImgOld 和 ImgNew兩種不同的預測情況。在所有情況下,Mask R-CNN的效果均優于其他方法,相關性最低也是0.99。
SingleMask R-CNN 模型和相關的分析方法流程是在基因庫表型組學或植物育種等背景下可廣泛適用的玉米穗軸表型分析工具。
來源:Plant Methods.DeepCob: precise and high-throughput analysis of maize cob geometry using deep learning with an application in genebank phenomics.Lydia Kienbaum, Miguel Correa Abondano, Raul Blas & Karl Schmid
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-021-00787-6