正在開發和采用光學傳感解決方案來對包括農作物種子在內的各種生物對象進行分類。光學分類模型的性能評估仍然是一個重點和挑戰。作為訓練數據,作者從兩個番茄品種的 3646 顆番茄種子(發芽是/否)中獲取了高光譜成像數據。作者進行了三個實驗數據操作:(1)對象分配錯誤:訓練數據中的單個對象被分配到錯誤的類的影響。(2) 光譜重復性:引入已知范圍(0-10%)的隨機噪聲對單個反射率值的影響。(3) 訓練數據集的大小:減少訓練數據中觀察值的影響。基于兩個函數[線性判別分析 (LDA) 和支持向量機 (SVM)] 的分類器都可以表征和量化這些實驗數據每一個操作的影響。
本研究中包括的番茄種子的圖像和平均反射率分布。來自兩個品種 A 和 B 的番茄種子照片,以及每個品種的五個子樣本 (a)。本研究中番茄種子品種1 (B)和2 (c)的五個子樣本的平均反射率分布。
兩種分類函數精度均隨著目標分配誤差的引入和光譜可重復性的實驗降低而線性下降。 作者還證明了將訓練數據減少 20% 的實驗對分類準確性的影響可以忽略不計。LDA 和 SVM 分類算法被用于獨立驗證種子樣本。 基于 LDA 的分類預測種子萌發的 RMSE?=?10.56(品種 1)和 26.15(品種 2),基于 SVM 的分類預測種子萌發的 RMSE?=?10.44(品種 1)和 12.58(品種 2)。
發芽和非發芽種子的平均反射率分布。品種 1 和 2 (a) 中未發芽和發芽的番茄種子的平均分布,以及品種 1 和 2 (b) 的發芽(發芽/未發芽)的相對影響
作者認為,這項研究是第一次在光學種子分類中既包含基于實驗數據操作的兩個單獨分類函數的全面性能評估,又將分類模型應用于驗證未包含在訓練數據中的種子樣本。提出的實驗數據操作在更廣泛的背景和一般相關性中進行了討論,并建議將它們作為光學分類模型的深度性能評估的方法。
來源:Plant Methods.Experimental data manipulations to assess performance of hyperspectral classification models of crop seeds and other objectsChristian Nansen, Mohammad S. Imtiaz, Mohsen B. Mesgaran & Hyoseok Lee
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-022-00912-z