摘 要:模糊規則模型廣泛應用于許多領域,而現有的模糊規則模型主要使用基于數值形式的性能評估指標,忽略了對于模糊集合本身的評價,因此提出了一種模糊規則模型性能評估的新方法。該方法可以有效地評估模糊規則模型輸出結果的非數值(粒度)性質。不同于通常使用的數值型性能指標(比如均方誤差(MSE)),該方法通過信息粒的特征來表征模型輸出的粒度結果的質量,并將該指標使用在模糊模型的性能優化中。信息粒性能采用(數據的)覆蓋率和(信息粒自身的)特異性兩個基本指標得以量化,并通過使用粒子群優化實現了粒度輸出質量(表示為覆蓋率和特異性的乘積)的最大化。此外,該方法還優化了模糊聚類形成的信息粒的分布。實驗結果表明該指標對于模糊規則模型性能評估的有效性。
關鍵詞:模糊規則模型;粒計算;覆蓋率;特異性;優化;模糊聚類
《計算機工程與設計》(月刊)創刊于1980年,由中國航天科工集團第二研究院706所主辦,是中國計算機學會會刊、北京計算機學會會刊和中國宇航學會會刊,是全國中文核心期刊、中國科技核心期刊。
0 引言
粒計算[1]是一種模擬人類層次模糊認知方式的智能方法,通過把復雜問題抽象、劃分,從而更好地分析和解決問題。作為粒計算中常見的一類方法,模糊規則模型是在模糊理論下,使用模糊規則來描述系統輸入和輸出之間復雜的非線性關系并實現推理的方法[2]。模糊規則模型被認為是一種用于處理信息粒的且具有良好結構的框架,在此框架下能在一個系統中同時處理數值信息粒和語義信息粒。一般地,針對回歸問題的模糊規則模型一般由數值型性能指標(本文以“數值型性能指標”指代均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)、R平方(Rsquared)等這一類計算數值精度的評價指標)加以評價。這意味著,盡管模糊集是整個模型最為重要的組成部分,但最終模糊規則模型的輸出仍是數值的,并需要以此才能進行模型性能的評估。因此,對于這類模型,模糊集的優勢則無法充分體現出來。特別是,在某些情況下,模糊規則模型的數值性能表現可能低于其他的一些數值模型,如神經網絡等,這是因為評估方法并沒有足夠公平地衡量模糊集的其他特性是導致該現象的重要因素。模糊集構成模型的典型案例是曼達尼(Mamdani)模糊規則模型[3-4]。
該模型以規則的形式出現,其條件和結論部分分別由輸入和輸出空間中定義的模糊集描述。根據規則的結構,這種模糊規則模型表現出顯著的可解釋性,參見文獻[5-6],其模型的設計、評估和分析方案的研究[7-9]也取得了一定進展。研究中發現,以數值型性能指標的模型性能評價方式只能反映回歸模型的數值精度,而不能反映出模型的可解釋性和模型輸出的語義內涵,因此成為這一評價方式的主要缺陷。近年來,特別是在人們普遍認識到智能系統需要以人為中心的重要性的背景下,人們越來越關注粒計算理論[10-15]并用于系統建模。模糊集作為粒計算中信息粒的一種重要的形式被廣泛地關注和研究。模糊建模的主要目標不僅是模型的準確性,而且還需要具有可解釋性和語義導向的透明度。而作為模糊規則模型的直接輸出,數值型性能指標(如MSE)不能直接用于評價模糊集輸出的性能,而模糊集由于去模糊化過程中的信息損失,也不應該簡單地通過去模糊化形成的數值結果用數值型性能指標進行評價。這就迫切地需要一種基于粒計算理論的視角進行信息粒的性能評估。
本文主要聚焦于Mamdani類型的模糊規則模型,首先,研究了如何在數值數據的基礎上構建模糊規則模型,并基于合理的粒度原理(principle of justifiable granularity)[16]設計了一個新的模糊規則模型性能的粒度評估指標;然后,討論了以最大化該性能指標為目標的模型優化方式。本文提供了一種評估模糊模型的新方法,即通過更加符合信息粒特征的視角,從模糊集合對于目標信息的涵蓋程度和模糊集合本身的涵蓋范圍兩個維度對模糊集合進行性能評估,從而一方面不失對于模型準確性的評價,同時兼顧了模型的可解釋性和語義內涵。
1 基于合理的粒度原則設計模糊規則模型
模糊集被用以表示規則的條件和結論部分的信息粒,在模糊規則模型中起著關鍵作用。就設計而言,模糊集的獲取主要有兩個途徑:專家經驗驅動和數據知識驅動。雖然模糊集可以通過專家經驗確定(在低維輸入空間的情況下是可行的),但是在高維輸入空間的情況下,數據驅動的建模方法更為有效。本文中的模糊規則模型旨在描述數據在輸入空間和輸出空間之間的非線性映射關系。該模型通常在監督學習的模式下基于N對輸入輸出數據(xk, targetk)進行建模,其中k=1,2,…,N,輸入xk位于輸入空間Rn中,而輸出targetk在輸出空間R中。該模型的規則結構描述如下:
Rulei: If x isAithenyisBi; i=1, 2, …, c(1)
其中:x是模型的輸入,y是模糊規則的輸出,Ai 和Bi是分別用于描述輸入和輸出的隸屬度函數(模糊集)。
一種較為合適和常用的構建模糊規則中模糊集合的方法是使用模糊聚類,例如模糊C均值(Fuzzy CMeans, FCM)等相關方法[17-19]已廣泛應用于分析輸入和輸出空間,利用聚合提取能夠語義化描述數據特征的信息粒,從而構建模糊規則模型。這種方法的優勢在于能夠極大地提高數據到規則建模的可解釋性,為人與模型的交互提供基礎。通過對輸入輸出聯合空間中數據的聚類,可以得到輸入數據的聚類中心集合{v1, v2, …, vc},以及輸出數據的聚類中心集合{w1, w2, …, wc}。得到的聚類中心形成隸屬度函數,從而建立模糊規則。模型中的規則數量與聚類中心的數量c相同。規則中的模糊集Ai和Bi由下列隸屬度函數描述:
Ai(xk)=1∑cj=1‖xk-vi‖‖xk-vj‖2/(m-1)(2)
Bi(yk)=1∑cj=1yk-wiyk-wj2/(m-1)(3)
對于任意輸入xk,輸出的模糊集B計算如下:
B(ykxk)=∑ci=1A(xk)Bi(yk) (4)
基于FCM的模糊規則模型的另一個優點在于非常簡單和直接。聚類中心和模糊集幾乎是自動形成的,一旦構造了模糊集并指定了去模糊化機制,就可以認為建模過程已經完成。模糊模型可能的優化則與FCM方法的主要參數相關聯,即聚類中心的數量c和模糊化系數m。一般認為:較大數量的聚類中心意味著更高的模型準確性,但出于計算復雜度的考慮,聚類中心的數量不應該太高。模糊化系數m(m>1)可用于調節形成規則之間的適當水平的相互作用: 雖然模糊化系數m的常用值是2,但該系數的調節有助于模型性能的進一步的優化; 當模糊化系數值接近1時,隸屬度函數類似于特征函數,在模型方面意味著輸入空間中的各個區域相對獨立地獲得輸出。隨著模糊化系數值的增加,規則傾向于更明顯的相互作用并可能有助于改進輸出。
為了強調對于xk的輸出,這里將輸出簡寫為Bk。常見性能指標以RMSE形式表示:
V=1N∑Nk=1(targetk-Dec(Bk))2(5)
其中Dec(B)表示產生單個數值的B的去模糊化運算。通常Dec(B)可以考慮任何去模糊化方法,如重心法、最大隸屬度法、模態值法等,參見文獻[20-21]。然而,所有這些方法的共同特征是:通過去模糊化得到單個數值,因此,去模糊化使得模糊集B信息損失,所傳達的整體信息也在很大程度上被忽略且未被使用, 需要設計一種更加合理的評價指標。
2 粒度評價指標及其優化
在本章中,重點考慮了模糊模型輸出的粒度特征,設計并提出了一個粒度評價指標,并在此基礎上設計了模糊規則模型的優化方法。
2.1 模糊規則模型性能的量化評估
為了更加合理地量化模糊集B形成的特征因素,本文采用一種更加有益的量化方法,即粒度的評估方法,用于衡量模糊集的信息粒輸出。在合理的粒度原理的指導下,文獻中常用覆蓋率(coverage)和特異性(specificity)這兩個標準來評估信息粒的性能[16,22],本文以此為參照來設計模糊集輸出的評估指標:
覆蓋率 通過計算隸屬度B(targetk)來表示目標targetk在多少程度上被模糊集B覆蓋。隸屬度越高,則覆蓋率越高,說明該數值樣本被模糊集輸出覆蓋的程度越好。覆蓋率性能指標能夠充分包含數值型評價指標對于模型誤差的描述,同時避免了模糊集的信息損失。
特異性 用于計算該模糊集的獨特性,是否表現出清晰明確的語義。模型輸出的特異性越高說明模糊集的語義越明確。特異性性能指標能夠描述模糊集的語義廣度(范圍),從而充分反映模糊集的語義性能,這一點是數值型評價指標所不具備的能力。
評估指標的詳細計算方法如下:
cov(targetk)=B(targetk|xk)(6)
本文中覆蓋率的意義對應于數值樣本在模糊集中的隸屬度,而模糊集B的特異性描述的是模糊集的“尺寸”。為便于解釋,本文首先考慮區間形式的信息粒[a, b],如圖1(a)所示,其特異性為1-(b-a)/range,其中range=ymax-ymin,ymax和ymin為輸出空間的極值。信息粒的區間越小,特異性越大。如果a=b,信息粒退化為一個數值點,其特異性也最大(最大值為1);如果信息粒覆蓋整個輸出空間,其特異性則最小(最小值為0)。對于模糊集,利用截集(αcut)進行特異性的計算,如圖1(b)所示,即:sp(Bk)=∫αmax01-h(α)rangedα(7)
h(α)=max{y| B-1(y)=α}-
min{y| B-1(y)=α}(8)
其中αmax是最大隸屬度。在實際運算中,式(7)中的積分項可以采用離散化的計算方法。對于多峰的隸屬度函數,考慮將多個截集長度求和的方法進行計算,如圖1(c)所示,即:
h(α)=length(Ω1) + length(Ω2)+
…+ length(Ωn)(9)
圖2展現了一個評估模糊集覆蓋率和特異性的案例。其中曲線表示模糊集,黑點表示目標輸出數據。
整體的覆蓋率和特異性性能通過計算所有數據點對應性能指標的平均值得到,即:
cov=1N∑Nk=1cov(targetk)(10)
sp=1N∑Nk=1sp(Bk)(11)
為了評估信息粒(模糊集)輸出的整體質量,本文采用覆蓋率和特異性乘積作為全局指標。因此,信息粒B的整體性能指標如下:
Q=cov·sp(12)
2.2 模糊規則模型的優化
聚類能夠揭示數據結構,然而模糊規則模型旨在刻畫輸入和輸出的內在關系。基于FCM的模糊規則建模雖然可以通過調整參數c和m優化模型,但是這樣的調整也存在一定的片面性。聚類過程是無方向的,因此不能完全支持有向的模糊規則建模。此外,FCM對于聚類中心分布的平均效應是不可避免的,這意味著模糊規則建模的輸出范圍可能會減小,從而產生一些額外的誤差。因此,本文采用了一種通過移動調整輸入和輸出空間聚類中心vi和wi位置的優化方法提高模糊規則模型的性能。
基于群體智能的啟發式算法可以有效處理復雜目標函數和大范圍搜索空間的問題,非常適合本研究問題。其中,粒子群優化(Particle Swarm Optimization, PSO)算法[23]由于其良好的效率和可用性,被應用于許多類似研究[11,24]中。在PSO中,粒子模仿群體活動特征在搜索空間中搜索最優解。粒子運動的速度取決于其自身和群整體的經驗。而速度決定粒子在下一步搜索中的位置。在每個搜索步驟t,使用以下兩個公式連續更新第i個粒子的速度u和位置l。
ut+1i=ωut+1i+δr1·(pbest-lti)+βr2·(gbest-lti)(13)
lt+1i=lti+ut+1i(14)
其中:pbest表示第i個粒子目前最優的位置;gbest表示所有粒子中的最優位置;ω是慣性權重因子;δ和β分別是個體認知和群體社會常數;r1和r2是在[0, 1]區間中均勻分布的隨機向量,以保證粒子搜索的隨機性。
優化過程中,將輸入空間和輸出空間的聚類中心組合成粒子l,使其在數據空間中的每個特征維度上進行移動調整,從而使得目標函數Q達到最大。為了增加聚類中心的適應度,這里將每個維度的搜索空間進行適當的放大,即[minj(1-γ), maxj (1+γ)],其中γ是一個正值的擴張系數,minj和maxj表示第j維特征上的最大和最小值。
3 實驗與結果
本章通過實驗展現了所提優化方案的性能,并將獲得的結果與僅通過使用FCM方法構建的模糊模型獲得的結果進行對比。在本文中,PSO優化參數設置如下:種群大小設置為100,最大迭代次數設置為600。多次實驗表明,這樣的參數設置足以實現優化過程的收斂,并且超出這些值不會導致性能的明顯改善。擴張系數的值設定為0.5, 慣性權重因子設定為1.1,而個體認知和群體社會常數的值均等于1.49,這些參數值的選擇與文獻[25]中一致。
3.1 人工數據實驗
本文采用一個常用的兩輸入非線性函數[26]:
y=(1+x-0.51+x-12)2(15)
其中:x1和x2是兩個獨立分布在笛卡爾積[1, 5]×[1, 5]上的變量。在其中隨機抽取900(30×30) 組數據,并劃分為70%的訓練樣本和30%的測試樣本。模糊系數m設置為3個具有典型性的值1.05, 2.0, 3.0。
圖3顯示的是目標函數值Q在優化前后的變化,圖4繪制的是不同數量的聚類中心生成的模型得到的覆蓋率和特異性的平均值。兩個圖中圓形表示聚類中心優化前的結果,而菱形則表示優化后的結果。最淺的顏色表示聚類中心數量為2建立的模糊規則模型(擁有2條模糊規則),最深的顏色表示聚類中心數量為10建立的模糊規則模型(擁有10條模糊規則)。
從實驗結果中可以看出,通常Q值隨著聚類中心的數量增加而減小。可能的原因分析如下:隨著聚類中心數量的增加,Ai和Bi的隸屬度值減小,則Ai和Bi的乘積也減小,因此覆蓋率隨之下降。同時,當聚類中心數量增加時,因為輸入和輸出的隸屬函數越來越具體,隸屬度函數B的形狀尺寸縮小,因此,特異性的值增加。總體而言,覆蓋性對性能指標Q的影響比特異性更強,因此Q值隨著聚類數量的增加而減小。聚類中心優化后,當模糊化系數較小(如1.05)時,Q值最大。在這種情況下,覆蓋率比特異性有更明顯的提高,這是由這種隸屬度函數的特征決定的。隸屬度通常從接近0變為接近1,并且聚類中心的修改可能會移動隸屬度函數中心的位置或合并其中一些隸屬度函數,因此很容易將一些目標數據對應的隸屬度從接近0提高到接近1,使得優化后的覆蓋率顯著改善。然而,當模糊化系數較高(比如3.0)時,目標數據附近的隸屬度較為接近,通過優化對于隸屬度的改變較少,因此覆蓋率的提高相對有限。總之,由于覆蓋率對總體性能指標Q的影響更大,當模糊化系數較小時,模型性能提高的幅度較大。
圖5繪制了聚類中心在數據空間中優化前后的位置變化, 從圖5中可以看出,聚類中心在優化前后有著明顯的變化。一些調整后的聚類中心彼此靠近甚至趨于重疊。該結果與上面的結論一致,即可以通過重疊聚類中心和聚合隸屬函數來提高覆蓋率。這一現象支持了在建模過程中減少聚類中心及模糊規則數量的可能性,并借以消除一些冗余的規則。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >