中科院植物所專家測評國內8款常用植物識別軟件 – 技術(植物識別軟件排名)
來源 | 生物多樣性雜志
花事未了,春光尚在,園林、郊野中的花次第開放,人們在戶外踏青賞花的同時不免會好奇,身邊植物的名字是什么?有什么用途?背后有怎樣的故事?為了滿足這種需求,目前手機應用市場已經出現了不少植物識別App,可以實現拍照識別,相當方便。但面對種類繁多的植物識別App,怎樣挑選一款準確率更高、參考價值更大的呢?
中國科學院植物研究所研究員、《生物多樣性》主編馬克平在中國科學院大學講授《保護生態學》課程時,組織學生對國內8款常用的植物識別app進行了準確率測試。
▲用你的App識別下這是什么花吧
首先,將中國植被區劃的八個區域中植物區系相對相似的區域歸并,選擇溫帶區(包括寒溫帶針葉林區、溫帶針闊混交林區和暖溫帶落葉闊葉林區)、亞熱帶區(亞熱帶常綠闊葉林區)、熱帶區(熱帶雨林、季雨林區)和干旱半干旱區(溫帶草原區和溫帶荒漠區)四個區。其次,分別在中國自然標本館(CFH)中每個區選擇100張圖片作為基本數據集,用以比較不同軟件的植物識別能力。再次,控制測試環境(網絡環境、手機內存足夠)的統一,記錄識別結果的中文名、拉丁名、科名和屬名。最后,種、屬、科準確識別正確分別計4分、2分、1分,以此標準對軟件識別能力按總得分進行排序。
正確率得分由高到低依次為:花幫主、百度識圖、花伴侶、形色、花卉識別、植物識別、發現識花、微軟識花。
▲國內8款常用植物識別軟件總得分排序
參與測試的照片共計有植物122科164屬340種。這些植物以野生種為主,栽培植物較少。在400張圖片中,分別包含喬木98張,灌木99張,草本180張,木質藤本13張,草質藤本10張;根據國家重點保護野生植物名錄,這400張照片中包含23張國家一、二級保護植物的圖片。測試還包括各App對不同氣候區物種的識別能力、對不同生長型植物的識別能力、對國家保護植物的識別能力。
各App的識別能力各有側重,但總體來說,花伴侶、形色、花幫主、百度識圖這4款App的準確率更高,與微軟識花、植物識別、花卉識別、發現識花4款App明顯分成了兩大組。
▲國內8款常用植物識別軟件對于不同生長型識別到種(a)、屬(b)、科(c)的比例
在植物識別App出現前,植物識別主要靠專家鑒定、查植物志、網絡論壇等。拍照識別的植物識別App的出現,對園林、科研及科普工作者甚至普通民眾,都意義重大。許多植物識別App有多樣的功能模塊,獲取植物的葉、花、種子等特征后,就能生成結果,包括中文學名、拉丁名、俗名、用途、民俗故事、栽培技巧等,既有查詢功能,也可作為植物知識庫。如果自身有一定分類學基礎,能理解術語、甄別識別的結果,植物識別App能發揮很好的作用。
隨著深度學習算法的應用,圖像分類精度提高,軟件在部分數據集上可以超越人眼的能力。但這并不代表軟件可以取代植物分類學者。因為識別植物只是分類學最基礎的一步,更深一步的分析,如種以下的鑒別、植物的進化地位等,植物識別App都無法實現。而且,分類學者的研究對象通常是植物識別App數據庫外的不常見植物,鑒定只能由專家完成。
各個植物識別App都在不斷更新和發展,在不同情況下每個App的準確率有一定差異,可考慮交叉使用,相互彌補,提高可信度。識別準確率測試有太多不確定因素,本次結果只能代表部分事實。為了便于更多人可進行重復測試,作者已將鑒定準確的400張照片上傳至NSII服務器( http://www.nsii.org.cn/2017/testPhoto.php/ )。
▲本文作者團隊