高通量表型能夠大規模有效地收集植物性狀數據。一個例子是在作物生長季節的關鍵階段使用成像系統。雖然生成的圖像為植物表型的統計分析提供了豐富的數據,但需要進行性狀提取的圖像處理作為先決條件。目前的特征提取方法主要是基于人類標記數據的監督學習或人類標記數據與非監督數據混合的半監督學習。不幸的是,準備足夠大的訓練數據既費時又費力。
KAT4IA圖。從左上方順時針到左下方的子圖說明了從原始RGB圖像到擬合生長曲線的算法工作流程。
作者描述了一個自監督管道(KAT4IA),它在溫室圖像上使用 K 均值聚類來構建訓練數據,用于從基于圖像的田間表型系統中提取和分析植物性狀。KAT4IA 管道包括以下主要步驟:自監督訓練集構建、從田間種植的植物圖像中分割植物、目標植物的自動分離、植物性狀計算以及提取性狀的函數曲線擬合。
訓練數據(植物類)獲取示例。
圖(a)是裁剪后的溫室圖像;
圖(b)是使用K-means算法(K=3)的聚類結果。白色部分隨后用作植物類的訓練數據。簇的數量K可以選擇為2。對于K=3,第三類給出了植物的邊緣。
圖(c)是直接應用于現場圖像的 K-means 算法的結果,該算法無法分離植物像素。
為了解決田間圖像中目標植物與噪聲背景分離的難題,提出了一種利用變換域神經網絡學習分割圖像的行切割和列切割的新方法,該方法利用從溫室圖像中識別的植物像素來訓練田間圖像的分割模型。這種方法是有效的,不需要人工干預。實驗結果表明,KAT4IA能夠準確提取植物像素并估計植物高度。
來源:Plant Phenomics.KAT4IA: K-Means Assisted Training for Image Analysis of Field-Grown Plant Phenotypes.Xingche Guo, Yumou Qiu , Dan Nettleton, Cheng-Ting Yeh, Zihao Zheng, Stefan Hey, and Patrick S. Schnable
https://spj.sciencemag.org/journals/plantphenomics/2021/9805489/