清空記錄
歷史記錄
取消
清空記錄
歷史記錄
一、引言
目前,在分析高光譜數(shù)據(jù)這樣的高維數(shù)據(jù)時,進(jìn)行特征波段的提取是非常必要的。首先,提取特征波段可以從原始數(shù)據(jù)中獲取最具代表性和區(qū)分性的特征集,從而有效地降低數(shù)據(jù)的維度,減少存儲和計算成本。其次,特征波段的提取可以通過選擇與目標(biāo)相關(guān)的波段來減少噪聲和冗余的影響,提高數(shù)據(jù)的準(zhǔn)確性和可靠性。關(guān)于在田間復(fù)雜環(huán)境下,高光譜技術(shù)如何實現(xiàn)對早期水稻秧苗與稗草精準(zhǔn)識別的具體方法及能力,以及利用競爭性自適應(yīng)重加權(quán)采樣算法從高光譜數(shù)據(jù)中高效篩選出對水稻和稗草分類最有效的特征波長方面的研究鮮見報道。本研究以二葉-四葉期水稻秧苗和稗草為研究對象,利用高光譜技術(shù)分別獲取田間和實驗室培育的苗期水稻和稗草的光譜數(shù)據(jù),采用CARS篩選出特征波長,利用MATLAB分類學(xué)習(xí)器工具箱進(jìn)行種類識別,構(gòu)建一種高效、準(zhǔn)確的早期水稻與稗草分類識別模型,旨在探究水稻秧苗與稗草的早期準(zhǔn)確識別方法,以期為農(nóng)田雜草的精準(zhǔn)防控、減少化學(xué)除草劑的使用提供科學(xué)依據(jù)。
二、材料與方法
2.1 材料
以水稻、稗草為研究對象,供試水稻品種為‘農(nóng)香優(yōu)204’。試驗對象數(shù)據(jù)采集為秧田直接采集和實驗室內(nèi)培育后采集,田間數(shù)據(jù)采集地點為湖南省長沙縣春華鎮(zhèn)張家坊的春華基地(28.29085°N,113.27462°E,海拔73.7m)。根據(jù)其生長發(fā)育階段的不同,具體分為二葉期和二葉-四葉期2個樣本集,樣本數(shù)據(jù)情況見表1。
表1 樣本數(shù)據(jù)采集信息情況
2.2 技術(shù)方法
通過分別采集秧田和實驗室培育2種試驗條件下的苗期水稻和稗草的高光譜反射率,利用光譜參數(shù)構(gòu)建苗期水稻和稗草快速無損分類模型,并進(jìn)行模型精度驗證(圖1)。
2.2.1 試驗設(shè)計和數(shù)據(jù)采集方法
圖2 實驗室培育、田間種植的水稻和稗草的生長情況
田間試驗小區(qū)的種植密度為22萬株/hm2,設(shè)置2個小區(qū),每個小區(qū)面積180m2,分別種植水稻和稗草。樣本進(jìn)行光譜數(shù)據(jù)取樣時,按照五點取樣法,每個取樣點12個光譜數(shù)據(jù),取樣時間分為2次,分別為2023年8月11日和8月15日(10:00—11:30),水稻或稗草的樣本量計120個(圖2)。2023年8月18日于實驗室培養(yǎng)箱中培育水稻和稗草(圖2),分別于8月26日、8月31日和9月1日在室外進(jìn)行光譜數(shù)據(jù)采集。利用地物光譜儀對早期水稻和稗草樣本進(jìn)行光譜測定,該儀器波段范圍是400~920nm。便攜光譜儀經(jīng)白板校準(zhǔn)后進(jìn)行測試,光纖探頭置于葉片表面上方20~30mm,探頭視場角為25°。試驗采用黑色背景以防影響植物的反射率。
2.2.2 光譜數(shù)據(jù)處理
原始光譜數(shù)據(jù)采用SG平滑和SG求導(dǎo)進(jìn)行預(yù)處理,對二葉期數(shù)據(jù)集和二葉-四葉期數(shù)據(jù)集分別進(jìn)行SG卷積平滑、SG卷積平滑-SG卷積求導(dǎo)和SG卷積平滑-SG卷積求導(dǎo)-CARS處理。其中,SG卷積平滑的寬口寬度設(shè)置為5,SG卷積求導(dǎo)的階數(shù)設(shè)置為2,寬口寬度設(shè)置為5。
采用競爭性自適應(yīng)重加權(quán)采樣算法(CARS)來進(jìn)行特征波段的提取。CARS的參數(shù)設(shè)置為:最大主因子數(shù)為10,交叉驗證次數(shù)為10,數(shù)據(jù)預(yù)處理方法設(shè)置為“center”,蒙特卡羅采樣次數(shù)為1000。
2.2.3 建模方法
采用10折交叉驗證的方法建立LDA、PLSDA、二次SVM、子空間判別和RBF-SVM模型對稗草和水稻進(jìn)行分類。基于上述處理后的數(shù)據(jù)集,進(jìn)行了校正集和驗證集的劃分。對于二葉期數(shù)據(jù)集,從水稻和稗草樣品中隨機(jī)各取20個樣品劃入驗證集中,剩下的79個樣品被劃入校正集。對于二葉-四葉期數(shù)據(jù)集,從水稻和稗草樣品中隨機(jī)各取40個
樣品劃入驗證集中,剩下的151個樣品被劃入校正集。將劃分好的校正集作為輸入數(shù)據(jù)結(jié)合PLSDA、線性判別、二次SVM、子空間判別、RBF-SVM等建模方法分別建立模型,且對建立的所有模型進(jìn)行10折交叉驗證和外部驗證集驗證。
在建立分類模型之前,需要先進(jìn)行參數(shù)設(shè)置。其中,二次SVM模型有3個參數(shù),分別是核函數(shù)、框約束級別和核尺度模式,將其分別設(shè)置為“二次”“1”和“自動”。子空間判別模型有集成方法、學(xué)習(xí)器類型、學(xué)習(xí)器數(shù)量和子空間維度4個參數(shù),將其分別設(shè)置為“Subspace”“判別”“30”和“256”。RBFSVM有學(xué)習(xí)器、擴(kuò)展維度數(shù)、Lambda、核尺度和迭代次數(shù)等參數(shù),將其分別設(shè)置為“SVM”“16384”“0.006623”“1”和“1000”。
三、結(jié)果與分析
3.1 水稻秧苗及早期稗草高光譜特征分析
由圖3可知,在700~900nm二葉期水稻的吸收強度略高于稗草,但從光譜曲線趨勢來看,水稻和稗草的吸收峰位置大致相同,且曲線相互混雜,無法進(jìn)行分類。通過主成分分析(PCA)發(fā)現(xiàn),盡管前3個主成分能夠解釋數(shù)據(jù)集中97.70%的總方差,有效降低了數(shù)據(jù)維度,水稻與稗草在PCA得分圖上的分布也具有一定的區(qū)分趨勢,水稻偏右上方(PC2:?10%~20%),稗草偏左下方(PC2:?20%~0%),其重疊與聚集現(xiàn)象仍較為嚴(yán)重,不足以作為直接分類的依據(jù)(圖3(b))。
二葉-四葉期水稻和稗草在400~900nm波段的吸收光譜特性與二葉期水稻和稗草的光譜特性基本一致,但混雜程度更高(圖3(c))。對光譜數(shù)據(jù)進(jìn)行主成分分析發(fā)現(xiàn),該時期數(shù)據(jù)集的聚集程度也高于二葉期數(shù)據(jù)集(圖3(d))。綜上,水稻秧苗與稗草在光譜特征上存在重疊,難以直接分類,且隨著生長階段變化,混雜程度增加,需結(jié)合多特征參數(shù)或高級分類算法以提高分類準(zhǔn)確性。
圖3 不同時期水稻和稗草的光譜曲線及主成分分析
3.2 光譜數(shù)據(jù)處理
圖4 競爭自適應(yīng)重加權(quán)采樣算法(CARS)篩選的特征波長
由圖4可知,CARS算法在二葉期和二葉-四葉期數(shù)據(jù)集選擇的特征光譜變量位置大致一致,在二葉期數(shù)據(jù)集中選擇了54個變量,在二葉-四葉期數(shù)據(jù)集中選中了58個變量,在2個數(shù)據(jù)集共同選擇了12個變量。綜上,盡管數(shù)據(jù)集的時間背景存在差異(一個是二葉期,另一個覆蓋了二葉-四葉期)CARS算法仍能有效識別出跨時期穩(wěn)定的特征光譜波段,意味著這12個共同的變量可能是區(qū)分不同水稻和穆草的關(guān)鍵特征波段。
3.3 水稻秧苗及早期稗草識別估測模型的建立及檢驗
3.3.1 PLS-DA和線性判別分類模型分析
表2 不同處理和建模方法下稗草與水稻的識別準(zhǔn)確率
由表2可知,PLS-DA模型中2個數(shù)據(jù)集中表現(xiàn)最好的是基于SG平滑-SG求導(dǎo)-CARS優(yōu)化后的模型,其中二葉期準(zhǔn)確率在校正集、交叉驗證集和外部驗證集中都為100.00%,二葉-四葉期數(shù)據(jù)集校正集、交叉驗證集和外部驗證集的準(zhǔn)確率分別為100.00%、98.00%和99.00%。對于無處理和SG平滑-SG求導(dǎo)建立的模型,其在二葉期數(shù)據(jù)集中表現(xiàn)一致,在二葉-四葉期數(shù)據(jù)集中基于無處理所建立的模型效果更好。
基于二葉期數(shù)據(jù)集建立的線性判別模型性能略低于PLS-DA模型,其中于SG平滑-SG求導(dǎo)-CARS優(yōu)化后的模型效果最優(yōu),校正集、交叉驗證集和外部驗證集的準(zhǔn)確率分別為100.00%、98.70%和100.00%。但在二葉-四葉期數(shù)據(jù)集中,線性判別模型表現(xiàn)較差,對于無處理和SG平滑-SG求導(dǎo)建立的模型,其交叉驗證集的正確識別率僅在75.00%左右。但基于SG平滑-SG求導(dǎo)-CARS優(yōu)化后的模型,其交叉驗證集的正確識別率提升到97.40%,表明CARS算法能夠提取有效光譜信息,提升模型的性能。
3.3.2 非線性分類模型分析
在二葉期數(shù)據(jù)集中,基于SG平滑-SG求導(dǎo)-CARS處理建立的二次SVM模型和子空間判別模型表現(xiàn)最優(yōu),二者校正集、交叉驗證集和外部驗證集的準(zhǔn)確率分別為100.00%、98.70%和100.00%(表2)。在二葉-四葉期數(shù)據(jù)集中,基于SG平滑-SG求導(dǎo)-CARS處理建立的子空間判別模型表現(xiàn)最好,其校正集、交叉驗證集和外部驗證集的準(zhǔn)確率分別為98.00%、96.70%和97.50%。但子空間判別在無處理和SG平滑-SG求導(dǎo)處理的數(shù)據(jù)集中的交叉驗證集中的正確識別率為84.00%左右,低于二次SVM和RBF-SVM建模方法。
四、討論
本研究應(yīng)用高光譜技術(shù)于稻田稗草的早期識別,為除草機(jī)器人的精準(zhǔn)作業(yè)提供了有力的決策支持,是實現(xiàn)農(nóng)業(yè)變量施藥、精準(zhǔn)除草策略的關(guān)鍵一步。研究表明,705nm是區(qū)別水稻和稗草的特征光譜波長,本研究中使用的CARS算法在兩類數(shù)據(jù)集都在705nm附近進(jìn)行變量選擇,這更加表明CARS算法能夠成功的提取區(qū)分水稻和稗草的特征光譜變量。采用低成本的地物光譜儀,結(jié)合特征光譜篩選算法,成功構(gòu)建高敏感性的稻田稗草識別模型,該模型在二葉期達(dá)到100.00%的識別準(zhǔn)確率,在二葉-四葉期也保持98.00%的高精度,相較于利用圖像識別技術(shù)獲得的識別準(zhǔn)確率范圍在91.01%~97.48%,本模型展現(xiàn)出更為優(yōu)越的性能。這不僅證明了光譜技術(shù)在雜草識別中的有效性,也凸顯了其在提高農(nóng)業(yè)生產(chǎn)效率方面的巨大潛力。
與圖像識別技術(shù)相比,光譜識別技術(shù)以其較低的時間成本具有更大的應(yīng)用潛力。研究中采用的人工光譜數(shù)據(jù)采集方式保證數(shù)據(jù)的準(zhǔn)確性,但其耗時費力的問題限制了在大面積稻田中的廣泛應(yīng)用。因此,未來的研究應(yīng)聚焦于開發(fā)高效的數(shù)據(jù)采集系統(tǒng),如引入無人機(jī)或田間自主移動機(jī)器人,以實現(xiàn)光譜數(shù)據(jù)的快速、實時獲取與分析,從而加速稻田稗草識別與施藥過程的智能化集成。此外,高光譜數(shù)據(jù)在采集過程中易受多種噪聲源干擾,這些噪聲不僅降低了數(shù)據(jù)質(zhì)量,也影響了后續(xù)建模的準(zhǔn)確性和可靠性。針對這一問題,本研究均強調(diào)了數(shù)據(jù)預(yù)處理的重要性,包括平滑、求導(dǎo)和散射校正等措施對減少或消除噪聲、提升數(shù)據(jù)質(zhì)量具有顯著效果。
然而,隨著應(yīng)用環(huán)境的復(fù)雜化,如何進(jìn)一步優(yōu)化預(yù)處理算法,以適應(yīng)不同條件下光譜數(shù)據(jù)的處理需求,仍是下一步研究的重要方向。
五、結(jié)論
利用高光譜技術(shù)結(jié)合多種分類算法對二葉-四葉期水稻和稗草的葉片光譜數(shù)據(jù)進(jìn)行識別分析發(fā)現(xiàn),SG平滑-SG求導(dǎo)結(jié)合CARS預(yù)處理再結(jié)合PLS-DA算法在提升模型識別精度和穩(wěn)定性方面表現(xiàn)最優(yōu),可顯著提升二葉-四葉期水稻和稗草識別模型的交叉驗證和外部驗證的正確率,分別高達(dá)98%和99%,尤其在水稻二葉期單一時期的樣本集上,無論是校正集、交叉驗證集還是外部驗證集,均實現(xiàn)100%的識別率,該模型充分驗證其在水稻二葉期數(shù)據(jù)建模中的高效性和準(zhǔn)確性,可應(yīng)用于水稻早期田間稗草識別和防除。