本項研究的目的是雙重的,首先從植物高度 (PH) 和植被指數 (VI) 圖中確定預測番茄產量的重要變量。這些地圖來自無人機 (UAV) 拍攝的圖像。其次,使用選定的變量集,檢驗多機器學習算法對番茄鮮枝質量(SM)、果實重量(FW)和果實數量(FN)的預測準確性。為了實現目標,無人機在 2020 年番茄生長季節的十天內收集了超高分辨率 RGB 和多光譜圖像。從這些圖像中,作者提取了756個總變量,包括每種植物的一階(如平均值、標準差、偏度、范圍和最大值)和二階(如灰度共生矩陣特征和PH和VIs的生長率)統計數據。使用幾種選擇算法(即Boruta、DALEX、遺傳算法、最小絕對收縮和選擇算子以及遞歸特征消除)來選擇對預測SM、FW和FN有用的變量集。隨機森林,嶺回歸和支持向量機被用來預測產量使用前五個選定的變量集。
本研究中使用的實驗場。位于日本東京。這張正射影像是使用6月18日拍攝的無人機影像創建的
在果實形成早期到中期,大約在收獲前一個月收集的PH和VIs的一階統計數據是預測SM的重要變量。與SM的情況類似,收獲前大約一個月收集的變量對于預測FW和FN很重要。此外,與 PH 相關的變量對于預測并不重要。 與僅用一階統計量得到的預測結果相比,用VIs的二階統計量得到的預測結果對FW和FN更為準確。由所有變量構建的模型(rRMSE = 8.8-28.1%)對SM、FW和FN的預測精度優于一階統計量模型(rRMSE = 10.0-50.1%)。
利用無人機和傳感器系統
除了基本統計數據(如平均值和標準差),作者還利用超高分辨率無人機圖像導出了植物水平的PH和VIs的二階統計數據。結果表明,該變量選擇方法減少了番茄產量預測所需的變量數量,提高了表型數據收集的效率,有助于育種計劃中高產品系的選擇。
來源:Plant Methods.Prediction of plant-level tomato biomass and yield using machine learning with unmanned aerial vehicle imagery.Kenichi Tatsumi, Noa Igarashi & Xiao Mengxue
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-021-00761-2