深度學習模型已經成功地應用于各種基于圖像的植物表型應用,包括疾病檢測和分類。然而,有監督的深度學習模型的成功部署需要大量的標記數據,由于固有的復雜性,這在植物科學(和大多數生物學)領域是一個重大挑戰。具體來說,數據注釋是昂貴的、費力的、耗時的,并且需要用于表型任務的領域專業知識,尤其是對于疾病。為了克服這一挑戰,已經提出了主動學習算法來減少深度學習模型所需的標記量,以實現良好的預測性能。
在大豆葉子上收集的九類數據(八類應激數據和一類健康數據),其中包括第一個數據集
主動學習方法通過使用采集函數自適應地建議樣本進行注釋來工作,以在固定標記預算下實現最大(分類)性能。本文作者報告了四種不同的主動學習方法的性能,(1)深度貝葉斯主動學習(DBAL),(2)熵,(3)最小置信度,(4)核心集,基于傳統的隨機采樣標注的兩種不同的基于圖像的分類數據集。
第二個數據集的九個類別包括八個雜草種類和一個無雜草類別(標記為陰性)。從與相關的公開數據集中獲取的圖像(Olsen et al., 2019)
第一個圖像數據集由屬于八種不同大豆脅迫和健康類別的大豆 [Glycine max L. (Merr.)] 葉子組成,第二個圖像數據集由來自田間的九種不同雜草組成。對于固定的標記預算,作者觀察到,對于兩個數據集,使用基于主動學習的獲取策略的深度學習模型的分類性能優于基于隨機采樣的獲取。數據注釋的主動學習策略的集成可以幫助減輕植物科學應用中的標簽挑戰,特別是在專用于注釋的資源有限的情況下。
來源:Wiley Online Library.How useful is active learning for image-based plant phenotyping?
Koushik Nagasubramanian, Talukder Jubery,Fateme Fotouhi Ardakani, Seyed Vahid Mirnezami, Asheesh K Singh, Arti Singh, Soumik Sarkar, Baskar Ganapathysubramanian.
https://acsess.onlinelibrary.wiley.com/doi/10.1002/ppj2.20020