BP神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈污水處理廠(chǎng)脫氮效果模擬預測
中國污水處理工程網(wǎng) 時(shí)間:2016-4-30 8:12:50
污水處理技術(shù) | 匯聚全球環(huán)保力量,降低企業(yè)治污成本
1 引言
通過(guò)數學(xué)模型對污水處理的生化過(guò)程進(jìn)行模擬分析一直是污水處理運行與管理領(lǐng)域的研究熱點(diǎn).20 世紀 50 年代以來(lái),國外一些學(xué)者把反映生化過(guò)程機理的微生物生長(cháng)動(dòng)力學(xué)引入污水處理領(lǐng)域.20世紀 80年代末,國際水協(xié)會(huì )(IWA)提出的活性污泥 1號模型(ASM1,Activated Sludge Model No. 1)取得了很大的成功,是早期較為完善的污水處理數學(xué)模型研究之一.通過(guò)模擬計算,使污水處理的設計和運行更加理論化和系統化,提高了人們對污水生物處理過(guò)程的認識,不僅節省了大量的經(jīng)濟成本,而且提高了污水處理相關(guān)工作的質(zhì)量和效率.
然而,隨著(zhù)污水處理工藝及設備設施的日漸復雜,活性污泥數學(xué)模型在污水處理廠(chǎng)的實(shí)際應用中具有一定的局限性.一方面,數學(xué)模型的建立過(guò)程比較復雜,需要對水質(zhì)組分及動(dòng)力學(xué)參數進(jìn)行測定,大部分污水廠(chǎng)缺乏這方面的基礎有效數據;另一方面,污水處理過(guò)程實(shí)際上是一個(gè)十分復雜的由物理、生物、化學(xué)等因素協(xié)同作用的過(guò)程,最終的處理效果不僅與決定其生物反應的一系列特征相關(guān),同時(shí)還受大量不確定因素的影響,而活性污泥數學(xué)模型還遠未將這些因素考慮在內,這在一定程度上降低了模型預測的精確性和實(shí)際應用價(jià)值.
對此,筆者提出可通過(guò)基于數據驅動(dòng)的黑箱模型對污水廠(chǎng)處理效果進(jìn)行模擬預測.然而污水處理過(guò)程中去除污染物的種類(lèi)很多,每種類(lèi)型污染物都有其獨特的去除機理和影響因素,因此,僅通過(guò)建立一個(gè)黑箱模型就對所有指標進(jìn)行預測勢必無(wú)法保證準確性.綜合考慮,本研究將黑箱模型主要用于污水處理脫氮工藝模擬分析,主要基于以下幾方面原因:①污水廠(chǎng)出水總氮是評判其工藝水平和運行水平的重要指標之一,對于一般水廠(chǎng)而言要保持出水總氮平穩達標,存在一定的技術(shù)難度和較大的調控空間;②對于傳統反硝化脫氮的機理及影響因素已研究的較為透徹,因此,可以很好地確定對脫氮效果有顯著(zhù)影響的參數,同時(shí)這些參數在一般污水廠(chǎng)都有大量的實(shí)際數據;③隨著(zhù)未來(lái)污水處理標準的日益提高,如何能保障前端脫氮效果,對后續深度處理工藝的成本控制有重要影響.
基于此,本文采用BP神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈的組合預測模型,首先通過(guò)BP神經(jīng)網(wǎng)絡(luò )模型對北京某大型污水處理廠(chǎng)實(shí)際進(jìn)出水數據和工藝參數進(jìn)行粗略擬合;其次,利用馬爾可夫鏈對擬合結果及誤差進(jìn)行狀態(tài)劃分以進(jìn)一步提高預測精確度;最后,運用基于BP神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈的組合模型預測分析該廠(chǎng)的實(shí)際出水水質(zhì).
2 BP神經(jīng)網(wǎng)絡(luò )和馬爾可夫鏈模型的構建
2.1 BP神經(jīng)網(wǎng)絡(luò )模型構建
神經(jīng)網(wǎng)絡(luò )模型是以神經(jīng)元的數學(xué)模型為基礎來(lái)描述的,是一種按誤差逆向傳播算法訓練的多層前饋網(wǎng)絡(luò ),它由網(wǎng)絡(luò )拓撲、節點(diǎn)特點(diǎn)和學(xué)習規則來(lái)表示,能在未知被構建對象和輸入參數的數學(xué)關(guān)系式的情況下,通過(guò)學(xué)習和貯存大量的輸入-輸出模式關(guān)系,自適應地獲取輸入與輸出的非線(xiàn)性映射關(guān)系.這其中又屬BP 神經(jīng)網(wǎng)絡(luò )的應用最為普遍,它使用最速下降法,通過(guò)反向傳播來(lái)不斷調整網(wǎng)絡(luò )的權值和閾值,使網(wǎng)絡(luò )的誤差平方和最小.應用 BP 神經(jīng)網(wǎng)絡(luò )一般包括4個(gè)基本步驟:①確定網(wǎng)絡(luò )結構形式;②收集訓練和測試樣本;③進(jìn)行網(wǎng)絡(luò )模型訓練;④利用訓練后的網(wǎng)絡(luò )進(jìn)行應用計算.
神經(jīng)網(wǎng)絡(luò )模型的模擬過(guò)程中會(huì )應用到大量的樣本訓練和測試數據,一般污水廠(chǎng)生產(chǎn)運行過(guò)程中會(huì )產(chǎn)生大量數據,但這些數據大部分是由人工或儀表檢測而來(lái),受取樣、化驗操作、瞬時(shí)波動(dòng)、儀表等因素影響,這些數據經(jīng)常存在誤差和波動(dòng).用這樣的數據進(jìn)行神經(jīng)網(wǎng)絡(luò )的訓練,往往會(huì )導致預測結果在一定范圍內隨機波動(dòng),降低了預測的準確性.馬爾可夫鏈恰能有效地預見(jiàn)并消除由系統隨機性而產(chǎn)生的預測誤差.因此,通過(guò)建立神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈的組合預測模型,將二者進(jìn)行優(yōu)勢互補,能夠得到更為準確的預測結論
2.2 馬爾可夫鏈模型構建
馬爾可夫鏈是根據俄國數學(xué)家馬爾可夫發(fā)現的系統狀態(tài)轉移規律,分析隨機事件未來(lái)發(fā)展趨勢及可能結果的一種預測方法其實(shí)質(zhì)是對于事件發(fā)生的概率進(jìn)行預測,根據目前狀況來(lái)預測其將來(lái)時(shí)刻變動(dòng)狀況.馬爾可夫鏈預測主要分兩個(gè)過(guò)程:一是確定馬爾可夫鏈的狀態(tài)空間;二是要通過(guò)計算確定狀態(tài)轉移概率與狀態(tài)轉移矩陣.
在事件發(fā)展變化過(guò)程中,狀態(tài)Ei經(jīng)過(guò)k步轉移到狀態(tài)Ej的轉移概率Pkij為:

式中,Mi表示狀態(tài)Ei出現的總次數,mkij表示狀態(tài)Ei經(jīng)k步轉移到狀態(tài)Ej的次數,m為劃分的狀態(tài)數目.
對于BP神經(jīng)網(wǎng)絡(luò )模擬預測的結果,通過(guò)馬爾可夫鏈模型可以分析其誤差的波動(dòng)范圍,并且預測波動(dòng)的發(fā)展趨勢,通過(guò)誤差的狀態(tài)轉移概率矩陣對BP神經(jīng)網(wǎng)絡(luò )預測的結果進(jìn)行進(jìn)一步的精細優(yōu)化.馬爾可夫鏈是一個(gè)典型的無(wú)后效應隨機過(guò)程,即模型在時(shí)刻t的狀態(tài)只與它的前一個(gè)時(shí)刻t-1的狀態(tài)條件相關(guān),與以前的狀態(tài)條件獨立.
在污水處理過(guò)程中,下一時(shí)刻污染物濃度變化情況只與當前時(shí)期(8~12 h)的系統狀態(tài)有關(guān),而與之前的狀態(tài)無(wú)關(guān).此外,該模型的最終預測結果不是一個(gè)具體數值,而是生成一組不同概率的預測區間值,該方法可從一定程度上彌補因化驗產(chǎn)生的數值誤差,提高預測準確度.
3 污水處理廠(chǎng)脫氮效果模擬預測分析
本文采用北京某大型污水處理廠(chǎng)的實(shí)際生產(chǎn)數據為實(shí)驗依據,該廠(chǎng)設計日處理規模100萬(wàn)m3 · d-1,其主體工藝采用A/O法去除有機污染物(COD)和總氮(TN),同時(shí)還通過(guò)投加化學(xué)藥劑來(lái)去除總磷(TP),最終出水主要指標可穩定達到《城鎮水污染物排放標準》(GB18918)中的一級B標準.
由于污水處理過(guò)程中每種類(lèi)型污染物的去除都有其各自的原理和特點(diǎn),因此,其影響因素也各不相同.例如,對于BOD、COD等有機指標,一般水廠(chǎng)均能較徹底的去除,其出水的殘留值主要與原水中的溶解性不可降解有機物有關(guān).再例如懸浮物指標,主要與沉淀單元的水力負荷和狀態(tài)點(diǎn)有關(guān),而與其它水質(zhì)指標關(guān)聯(lián)不大,等等.其中,總氮是污水中的主要污染物之一,其去除機理和影響因素目前研究的較為明確,因此,本文主要以脫氮工藝模擬為研究對象,對該廠(chǎng)出水總氮進(jìn)行數學(xué)模擬分析.
3.1 基于BP神經(jīng)網(wǎng)絡(luò )的污水廠(chǎng)脫氮效果模擬
以該廠(chǎng)2013年全年數據為基礎,共收集了365組樣本集,其中250組作為訓練集,115組作為測試集.試驗工具采用新西蘭懷卡托大學(xué)開(kāi)發(fā)的WEKA數據挖掘應用平臺,BP神經(jīng)網(wǎng)絡(luò )輸入層節點(diǎn)數為 8,分別表示進(jìn)水流量、生物反應池溫度、進(jìn)水BOD、進(jìn)水COD、進(jìn)水TN濃度、進(jìn)水NH+4-N濃度、生物反應池MLSS濃度、生物反應池MLVSS濃度;輸出層節點(diǎn)為出水TN濃度,隱藏層數取1,迭代次數為500,采用不同的隱含層節點(diǎn)數分別對網(wǎng)絡(luò )進(jìn)行訓練,當隱含層節點(diǎn)數取4時(shí),神經(jīng)網(wǎng)絡(luò )訓練誤差最低(平均誤差0.073).利用訓練后的模型,以2013年各月的月均參數值為輸入量(表 1),模擬各月月均TN值,模擬結果與真實(shí)值的線(xiàn)性相關(guān)度為0.921(圖 1).
北京某污水處理廠(chǎng)2013年1—12月主要運行數據
圖1 神經(jīng)網(wǎng)絡(luò )模型擬合結果
利用訓練后的神經(jīng)網(wǎng)絡(luò )對該廠(chǎng)2014年1—12月數據進(jìn)行模擬預測,最終模擬值與實(shí)際值對比情況如圖 2和表 2所示.從表 2可以看出,12個(gè)月的數據模擬誤差范圍為±10%,有3次模擬結果低于實(shí)際值,9次高于實(shí)際值.其中,最小誤差為0.79%,最大誤差為9.49%.
表2 污水處理廠(chǎng)實(shí)際出水水質(zhì)及BP網(wǎng)絡(luò )計算擬合值
3.2 基于馬爾可夫鏈的預測結果修正模型 3.2.1 馬爾可夫狀態(tài)區域劃分
馬爾可夫鏈的預測精度主要由轉移矩陣決定,為了構造轉移矩陣,首先需要合理劃分誤差狀態(tài)區間,一般以樣本-均方差方法來(lái)確定.以樣本的均值 為中心,標準差s=

為標準進(jìn)行分組.一般可將數據序列分為:(x-s,x-0.5s)、(x-0.5s,x+0.5s)、(x+0.5s,x+s)等幾組.
從表 2可以看出,模擬值與實(shí)際值誤差在-10%~5%之間,誤差平均值為x=-2.5,標準差為s=4.28.根據均值-標準差分級方法,通過(guò)BP模擬結果的誤差均值和標準差,可將馬爾可夫狀態(tài)區域劃分為4種狀態(tài):a[-10%,-5%],b[-5%,0],c[0,+5%],d[5%,10%]
3.2.2 污水廠(chǎng)出水總氮BP擬合結果一步轉移概率矩陣
對于馬爾可夫鏈,描述其概率性質(zhì)的重要的量是轉移概率矩陣.把轉移概率Pij=(n,n+k)記為Pij,當k=1時(shí),Pij(1)稱(chēng)為1步轉移概率,記為Pij.設 P 表示一步轉移概率Pij(k)所組成的矩陣(式(2)),且狀態(tài)空間E={1,2,…,n},則 P 稱(chēng)為系統狀態(tài)的一步轉移概率矩陣.

根據之前的3種區域狀態(tài)劃分,pij為由狀態(tài)i轉向狀態(tài)j的頻數,如pab表示當前誤差在a狀態(tài),下一組模擬誤差在b狀態(tài)的頻數,其余以此類(lèi)推.設:

那么由狀態(tài)i轉向狀態(tài)j的轉移概率為fij≈pij/pi,(i=1,2,…,n),這樣便可得到BP模擬出水TN誤差的一步轉移概率矩陣,具體如表 3和式(3)所示.
表3 污水處理廠(chǎng)出水水質(zhì)預測結果的馬爾可夫狀態(tài)轉移表
3.2.3 馬氏性檢驗
檢驗隨機過(guò)程是否具有馬氏性是應用馬爾科夫鏈模型的必要前提,通常離散序列的馬爾科夫鏈是用χ2 統計量來(lái)檢驗的.
j表示(nij)q×q的第j列之和同各行各列的總和的比值,Pij表示狀態(tài)i轉到狀態(tài)j的概率,計算公式如下:

統計量服從自由度為(q-1)2的χ2分布.選定置信度α,查表得χ2α((q-1))2,令:

若χ2>χ2α((q-1))2,則{ri,i=T}具有馬氏性.對該廠(chǎng)12個(gè)月的狀態(tài)序列做馬氏檢驗.根據表 3再結合步長(cháng)為1的一步轉移概率矩陣 P,可算得統計量χ2=32.14,給定置信度α=0.05,查表可得分為點(diǎn)χ2a(4)=27.85.由于χ2>χ2α((q-1))2,故這組序列滿(mǎn)足馬氏性.
3.2.4 2015年1—5月出水總氮預測
根據2014年1—12月模擬結果,通過(guò)馬爾可夫鏈預測模型,得到2015年1—5月出水總氮狀態(tài)轉移表,結果如表 4所示.其中,參考2014年12月的模擬誤差,初始向量為[0.17,0.33,0.33,0.17].
表4 2015年1—5月出水TN預測狀態(tài)向量
綜上,得出2015年1—5月出水的最終預測結果(表 5).馬爾可夫鏈改進(jìn)后的預測結果是不通過(guò)概率下的區間范圍值,符合污水廠(chǎng)出水水質(zhì)和檢測結果在一定程度呈隨機變化的特性,通過(guò)最大概率區間預測值可以很準確地預測實(shí)際出水水質(zhì)范圍.從該廠(chǎng)2015年1—5月的模擬預測結果可知,出水的實(shí)際水質(zhì)均符合最大概率區間內的預測范圍值,表明基于 BP神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈的組合預測模型具有較高的精度,可應用于污水處理的水質(zhì)模擬.
表5 污水處理廠(chǎng)2015年1—5月出水實(shí)際值、BP擬合值與馬爾可夫改進(jìn)值對比情況
4 結論
1)污水處理過(guò)程是多種復雜生物化學(xué)反應綜合作用的結果.本文所采用的模擬方法和預測模型是對傳統污水處理數學(xué)模型的一種補充,即通過(guò)數據挖掘手段,采用基于BP 神經(jīng)網(wǎng)絡(luò )與馬爾可夫鏈的組合預測模型,充分挖掘出數據中的變化規律與擬合趨勢,恰好彌補了傳統數學(xué)模型的不足.
2)通過(guò)對北京某污水處理廠(chǎng)實(shí)際數據分析計算表明,BP神經(jīng)網(wǎng)絡(luò )模型結合馬爾可夫鏈組合模型具有很好的適用性,能夠準確預測出水水質(zhì)范圍.在不掌握生物反應機理模型參數或缺乏數據的情況下,為污水處理廠(chǎng)水質(zhì)模擬提供了一種新的途徑.具體參見(jiàn)污水寶商城資料或http://www.sharpedgetext.com更多相關(guān)技術(shù)文檔。
3)本方法尤其適合于運行工藝和進(jìn)出水水質(zhì)相對穩定,且具有大量歷史數據積累的水廠(chǎng).由于污水處理過(guò)程影響因素的多樣性和不確定性,對于不同類(lèi)型的水廠(chǎng),在具體建模時(shí)還應結合實(shí)際情況,在神經(jīng)網(wǎng)絡(luò )輸入層節點(diǎn)(即污水處理的影響因素)選取和馬爾可夫狀態(tài)區域劃分方面進(jìn)一步研究分析.