摘要:【目的】對昆明市 2000—2015 年的火點數據進行分析,確定主要林火驅動因子,建立昆明市林火預報模型并進行火險區劃,為昆明市林火預防提供參考?!痉椒ā炕诹只饠祿?,選取氣象、地形、植被、人為等 17 個林火驅動因子構建 Logistic 回歸林火概率模型,并劃分 5 個中間模型選取全樣本的顯著變量因子,用受試者工作特征曲線 (ROC) 進行模型檢驗與評價,基于全樣本的模型結果分析昆明市主要林火驅動因子,并計算得到林火發生概率的最佳閾值,根據 Logistic 模型結果劃分五級火險區?!窘Y果】海拔、距居民點距離、距鐵路距離、歸一化植被指數 (NDVI) 值、月均地表溫度、月均氣壓、月均相對濕度、月均風速、人均國內生產總值 (GDP) 等 9 個因子與昆明市林火發生概率存在顯著關系;Logistic 模型的預測準確率高達 81.7%;ROC 曲線下面積 (AUC) 的值為 0.905;劃分的最佳閾值為 0.342;火險區劃的五級火險區面積比率分別為 48.82%、35.17%、11.26%、2.55%、2.20%?!窘Y論】昆明市林火主要驅動因子是氣象因子;昆明市高火險區集中分布在五華區、盤龍區、官渡區、呈貢區、西山區、安寧市等西南部地區。圖 4 表 3 參 22
關鍵詞:林火驅動因子;Logistic 回歸模型;火險區劃;衛星林火數據;昆明市
朱政; 趙璠; 王秋華; 高仲亮; 鄧小凡; 黃鵬桂 浙江農林大學學報 2021-12-20
森林火災是一種失去人為控制肆意燃燒毀壞林地的森林燃燒現象,嚴重威脅著生物多樣性、森林生態系統和人類生命財產安全[1−2]。森林火險區劃是有效防止和減小森林火災危害的手段,結合火環境將森林區域劃分為不同的火險等級便于分級管理[3]。國內外許多學者研究表明,林火受多種驅動因子共同影響,因子可以分為氣象、地形、植被和人為因素[4−5]。森林火險區劃與林火驅動因子之間存在復雜聯系,根據前人研究,其劃分方法主要包括模糊聚類法、主成分分析法、模糊綜合評判法等[6−8]。 Logistic 模型是林火研究常用的一種回歸模型,因其模型的解釋性好和預測準確率較高被廣泛應用在林火研究之中。本研究應用 Logistic 回歸模型結合氣象、地形、植被、人為等因素建立林火預測模型,對昆明市林火驅動因子進行分析并劃分等級,以期為昆明市林火預防和管理工作提供參考。
1 研究區和數據 1.1 研究區概況
昆明市行政管轄范圍包括 7 個區 6 個縣,代管安寧市。地處云貴高原中南部,24°23′~26°22′N, 102°10′~103°40′E,行政面積為 2 1473 km2。地勢北高南低,地形以高原為主,多數地區海拔為 1 500~ 2 800 m,垂直地域特征明顯,物種多樣性豐富。昆明屬于亞熱帶高原季風氣候,四季如春,日照長、霜期短,市區年平均氣溫為 15.0 ℃,全年干濕季明顯,干季在 11 月至次年 4 月,屬于森林火災高頻期?,F有森林面積 110.69 萬 hm2,森林覆蓋率達 52.62%,森林蓄積量達 6 057 萬 m3。主要樹種有云南松 Pinus yunnanensis、華山松 P. armandii、櫟類 Quercus spp.、杉木 Cunninghamia lanceolata、楊樹 Populus spp.等。衛星火點數據 (圖 1)表明:昆明市 2000—2015 年間共發生森林火災 321次,落在昆明防火期 12 月到次年 5 月的火點有 280 個,占總火點的 80% 以上。
1.2 數據來源和處理
1.2.1 因變量 林火發生受多種驅動因子共同影響[9−10]?;瘘c數據來自地理空間數據云平臺 (http:// www.gscloud.cn/) 提供的 MOD14A2 衛星火點數據。該數據為 8 d 合成數據,該產品被國內外學者用于林火的廣泛研究[11−12]。用 ArcGIS 10.7 對下載的 MOD14A2影像數據投影和裁剪獲得昆明市范圍的影像數據,利用重分類功能將 firemask 灰度屬性值按照 0~6 和 7~9 劃分為未過火和過火像元,將過火像元比對昆明市地物類型圖,將所有落在類型為林地的火點提取作為本研究使用的林火數據。
1.2.2 自變量 選取氣象、地形、植被、人為活動等共 17 個因子。地形初始變量有海拔、坡度、坡向,數據來源于地理空間云 (http://www.gscloud.cn/) 的 GDEMV2 30 m 數字高程模型 (DEM) 數據。使用 ArcGIS 10.7 按掩膜提取昆明市 DEM,采用“值提取到點”分別提取各火點對應的值。氣象初始變量有月均地表溫度、月均氣壓、月均相對濕度、月均風速、月均氣溫、月均日照時長,數據來源于中國氣象數據共享網 (http://cdc.cma.gov.cn/),氣象數據采用月均值的方式計算,對各火點直接賦值。植被數據有植被類型和季度歸一化植被指數 (NDVI)。植被類型來源于全國地理信息資源目錄系統下 30 m 全球地表覆蓋數據 Globeland 30,運用 ArcGIS 10.7 值提取至點,得到分類變量值。NDVI 來源于中國科學院資源與環境科學與數據中心下中國季度 1 km 植被指數空間分布數據集,數值分為春夏秋冬 4 個季節,對火點年份和月份按照對應的季度 NDVI 進行分類和提取。人為活動因素有距河流距離、距居民區距離、距公路距離、距鐵路距離、人均國內生產總值 (GDP)、人口密度,數據來源于全國地理信息資源目錄系統下 1∶25 萬全國基礎地理數據庫和中國科學研究院資源與環境數據中心下分辨率 1 km 人口和 GDP 格網數據。導入基礎設施矢量圖后,利用 ArcGIS 10.7 的近鄰分析工具得到火點距離各要素的最近距離,人口密度和人均 GDP 只有 2000、2005、2010 年的柵格數據,通過比對《云南省統計年鑒》測算各年人口密度和人均 GDP 增長率,用“值提取至點”功能得到各火點對應數據。各變量因子之間的量綱不同且存在數據級之間的巨大差別,為消除量綱,避免存在數據級引發的結果貢獻問題,對數據采取歸一化處理。
2 研究方法 2.1 二項 Logistic 林火回歸模型
二項 Logistic 回歸模型可以有效進行二分類數據的判別,被國內外學者廣泛運用于林火區劃[8,13]。以林火發生概率作為二項 Logistic 回歸模型的因變量,以 y=1 或 0 代表林火是否發生。設 P 為林火發生概率,則林火未發生概率為 1−P,由此得公式: P = eβ0 +β1 x1 +β2 x2 +···+βjx j 1+eβ0 +β1 x1 +β2 x2 +···+βjxj 。將上面公式做 logit 變換,得到公式為: ln( P 1− P ) = β0 +β1 x1 +β2 x2 +···+βjxj。 β0 β1 β2、···、βj x1、x2、···、x j e ln( P 1− P ) 其中: 、 、 為各自變量因子的回歸系數, 為各自變量因子, 為常量, j 為自變量個數,P 為林火發生概率, 為 P 的比數的對數。建立二項 Logistic 林火預測回歸模型時,需要一些隨機非火點與火點共同構成樣本數據?;谇叭说难芯拷涷瀃14],將火點與非火點比例調整為 1∶2,對非火點日期進行隨機賦值,保證時間和空間上的雙隨機。將樣本數據隨機分成 60% 作為模型樣本,40% 進行獨立檢驗,重復 5 次隨機劃分,避免樣本分布對最終模型結果的影響。
2.2 多重共線性檢驗
多重共線指變量因子之間存在相關關系使模型精度下降,利用多重共線性診斷可以有效剔除相關變量。使用方差膨脹因子 (VIF) 進行多重共線性檢驗,通常認為 0
2.3 自變量篩選
為減小隨機選擇自變量對建模結果的影響,提高模型的精確度,采用 SPSS 中系統默認的“強迫回歸方法”進行自變量的篩選,逐步剔除變量使剩余變量 VIF 值均小于 10。在上述 5 次劃分的隨機模型中選取至少出現 3 次的顯著變量參與全樣本數據的擬合。
2.4 模型檢驗
受試者工作特征曲線 (receiver operator characteristic curve,ROC) 常用于評價分類模型精度和計算最佳閾值。該曲線以特異性 (正類誤判為負類) 為橫坐標,以敏感性 (正類判斷為正類) 為縱坐標,ROC 曲線下面積 (area under curve AUC) 的值用來評價模型的精度,AUC 的值越接近于 1 則表示該模型的精度越高,通常認為 AUC>0.8 時該模型擁有較好預測能力[15]。約登指數 (Youden index,敏感性+1-特異性) 是 ROC 曲線上最靠近左上角的一點,代表兩分類模型預測準確度最佳閾值[16],用該閾值計算可以得到模型的預測準確率。
2.5 火險概率及火險等級劃分
依據全樣本運算得到的 Logistic 回歸方程式計算結果,使用 ArcGIS 的克里金插值法進行圖層運算,獲得昆明市的林火發生概率分布圖?!度珖只痣U區劃等級》 [17] 將全國森林火險等級劃分為 3 級,但該標準只適用于縣級或林場的等級區劃,對于大區域的宏觀預測精度和指導意義遠遠不夠。本研究按照前人的經驗和國際慣例[18],依據概率等間距將昆明市劃分為五級森林火險:0~0.2 為一級火險區, 0.2~0.4 為二級火險區,0.4~0.6 為三級火險區,0.6~0.8 為四級火險區,0.8~1.0 為五級火險區。
3 結果與分析 3.1 自變量確定
共線性診斷適用于連續變量不適用于分類變量,因此,先對 15 個連續變量進行多重共線性診斷,再綜合 5 個中間模型加上非連續性變量“植被類型”和“坡向”進行模型顯著性檢驗確定最終林火驅動因子。多重共線性診斷的結果如表 1 所示:在剔除月均氣溫之后,不存在多重共線性。將篩選的連續變量和分類變量采用“Wald 向前”原則對 5 個樣本進行擬合,選擇結果中出現 3 次及以上的顯著變量作為全樣本模型的自變量因子,全樣本的擬合結果如表 2 所示。
3.2 模型檢驗結果與評價
如 圖 2 所示: 用 ROC 曲線分別計算模型 的 AUC 和約登指數并以此計算測試樣本預測準確率。如表 3 所示:5 個中間模型的樣本的 AUC 值均大于 0.890,對樣本的預測準確率均高于 80%,全樣本 AUC 值為 0.905,預測準確率為 81.7%,說明 Logistic 回歸模型對昆明市林火發生預測有較好的預測效果,適用于昆明市林火發生預測。根據全樣本擬合結果建立昆明市 Logistic 回歸概率模型為: ln( P 1− P ) = −2.138x1 +1.768x2 −1.373x3 −3.159x4+ 2.110x5 −1.654x6 −2.373x7 +1.169x8 +6.638x9 +2.061。 x1 x2 x3 x4 x5 x6 x7 x8 x9 其中:P 是林火發生概率, 為海拔, 為居民點,為離鐵路距離, 為 NDVI, 為月均地表溫度,為月均氣壓, 為月均相對濕度, 為平均風速, 為人均 GDP。
3.3 昆明市火險概率及火險等級區劃
由圖 3 可見:5 類森林火險等級分別占昆明市區面積的 48.82%、35.17%、11.26%、2.55%、2.2%,高火險地區集中分布在五華區、盤龍區、官渡區、呈貢區、西山區、安寧市等,四級和五級火險區集中在一起。與實際火點進行比對,這片區域發生歷史火災集中且次數最多??傮w來看,昆明市的重點火險區主要分布在昆明市西南部、嵩明縣的中部地區、東川區的邊界和石林彝族自治縣的中部地區。
3.4 林火驅動因子與火點頻次關系
從表 3 可以看出:對昆明市林火發生概率具有顯著影響的林火驅動因子分別為海拔、距居民點距離、距鐵路距離、NDVI 值、月均地表溫度、月均氣壓、月均相對濕度、月均風速、人均 GDP。由圖 4 可得:火點集中在距居民區 1 500~2 500 m,這個區間屬于人口密集區,人為活動頻繁導致林火發生概率增大?;瘘c集中分布在月均地表溫度 15~25 ℃ 區間,該溫度對應昆明市春夏季,此時正是昆明市的防火期,降水稀少,日照時間長,可燃物含水率低,容易引發火災發生。昆明市火點頻次在月均風速 2.0~4.0 m·s −1 時呈下降趨勢,到達 4.5 m·s −1 先上升后下降,該區間對應昆明市春夏季過渡到秋季,降水增多,植物含水率和溫度較低,不易發生火災。 11 月進入冬季,為昆明市防火期時段,從月均相對濕度來看,昆明市火點主要集中在 40%~60%,在相對濕度高于 60% 之后的區間,月均相對濕度與火點頻次呈負相關關系。
火頻次與距鐵路距離關系呈明顯的負相關,火點主要分布在 0~20 km 的區域內,隨距離增加,火點越來越少,距居民區的火點集中在 0~2 000 m 的區域內,2 000 m 以后呈明顯的負相關。人均 GDP 與火點頻次呈明顯的負相關,隨人均 GDP 的增長火點減少,人均 GDP 較少的區域多處于農村、鄉鎮區域,森林面積大,火點占有可能性較高。NDVI 代表植被覆蓋率,其值與植被覆蓋率呈正比關系,火點落入 0.2~0.5 最多,這表明昆明市火災易發生在森林覆蓋率低的地帶,該區域可燃物較少且容易干燥引發火災。
4 結論與展望
林火驅動因子中,月均地表溫度、月均氣壓、月均相對濕度、月均風速都屬于氣象因素,氣象因素是影響昆明市林火發生的主要因素。氣象因素影響火三角中可燃物與溫度這 2 個因素,相對濕度影響可燃物含水率,抑制林火發生,與林火發生呈負相關[19]。地溫和風速通過減小可燃物含水率影響林火發生,風速還可以加快空氣流動,影響火災蔓延的方向和速率,與林火發生呈正相關。氣壓隨海拔升降發生變化,火點落入 806~816 hPa 為多,其中,火點主要分布在 810 hPa。昆明市范圍內的林火不僅受到氣象因素的影響,還受到地形、可燃物、人為活動等因素的共同影響,氣象因素決定大范圍內林火發生的可能性,而地形、可燃物、人為活動等因素從更精細的空間角度預示著潛在的林火分布狀況。
進行二項 Logistic 多重線性診斷時,5 個中間模型得到的林火驅動因子都不相同,海拔作為顯著變量卻成為中間模型剔除因素,林火驅動因子之間存在復雜關聯,僅僅考慮自變量之間的相關性可能會剔除模型中存在重要影響的因子[20]。本研究選取了當前林火驅動因子所有時間段的數據,Logistic 回歸風險模型進行擬合,沒有考慮可能存在氣候差異明顯的時間段,比如昆明市存在明顯的干濕季,對于林火發生概率也會產生顯著影響。在接下來的的研究中應考慮做多個不同時期的森林火險區劃。除本次研究中使用的 Logistic 回歸模型以外,預測林火的模型還有隨機森林算法、地理加權回歸模型等,國內已有相關學者用于林火預測的研究[21−22]。不同林火模型對于地區的適用性和解釋性都不相同,可針對昆明市的林火分布特征找出最優解釋模型。本研究所選的自變量沒有包含日值氣象數據,對于極端值情形研究不足,可將研究極端值情況對于林火發生概率的影響。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >