正在開發(fā)和采用光學傳感解決方案來對包括農(nóng)作物種子在內(nèi)的各種生物對象進行分類。光學分類模型的性能評估仍然是一個重點和挑戰(zhàn)。作為訓練數(shù)據(jù),作者從兩個番茄品種的 3646 顆番茄種子(發(fā)芽是/否)中獲取了高光譜成像數(shù)據(jù)。作者進行了三個實驗數(shù)據(jù)操作:(1)對象分配錯誤:訓練數(shù)據(jù)中的單個對象被分配到錯誤的類的影響。(2) 光譜重復性:引入已知范圍(0-10%)的隨機噪聲對單個反射率值的影響。(3) 訓練數(shù)據(jù)集的大小:減少訓練數(shù)據(jù)中觀察值的影響。基于兩個函數(shù)[線性判別分析 (LDA) 和支持向量機 (SVM)] 的分類器都可以表征和量化這些實驗數(shù)據(jù)每一個操作的影響。
本研究中包括的番茄種子的圖像和平均反射率分布。來自兩個品種 A 和 B 的番茄種子照片,以及每個品種的五個子樣本 (a)。本研究中番茄種子品種1 (B)和2 (c)的五個子樣本的平均反射率分布。
兩種分類函數(shù)精度均隨著目標分配誤差的引入和光譜可重復性的實驗降低而線性下降。 作者還證明了將訓練數(shù)據(jù)減少 20% 的實驗對分類準確性的影響可以忽略不計。LDA 和 SVM 分類算法被用于獨立驗證種子樣本。 基于 LDA 的分類預(yù)測種子萌發(fā)的 RMSE?=?10.56(品種 1)和 26.15(品種 2),基于 SVM 的分類預(yù)測種子萌發(fā)的 RMSE?=?10.44(品種 1)和 12.58(品種 2)。
發(fā)芽和非發(fā)芽種子的平均反射率分布。品種 1 和 2 (a) 中未發(fā)芽和發(fā)芽的番茄種子的平均分布,以及品種 1 和 2 (b) 的發(fā)芽(發(fā)芽/未發(fā)芽)的相對影響
作者認為,這項研究是第一次在光學種子分類中既包含基于實驗數(shù)據(jù)操作的兩個單獨分類函數(shù)的全面性能評估,又將分類模型應(yīng)用于驗證未包含在訓練數(shù)據(jù)中的種子樣本。提出的實驗數(shù)據(jù)操作在更廣泛的背景和一般相關(guān)性中進行了討論,并建議將它們作為光學分類模型的深度性能評估的方法。
來源:Plant Methods.Experimental data manipulations to assess performance of hyperspectral classification models of crop seeds and other objectsChristian Nansen, Mohammad S. Imtiaz, Mohsen B. Mesgaran & Hyoseok Lee
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-022-00912-z