污水處理軟測量技術研究進展
污水處理過程中需要檢測大量的水質參數。這些參數用于監測反應器的運行狀態和出水水質,并指導反應器的運行。人工檢測水質參數的方式不能及時地提供反應器的水質信息。在線儀器檢測水質參數的方式雖然可以避免人工檢測的弊端,但是在線檢測化學需氧量等指標的儀器價格較為昂貴,維護成本也高。因此,在線測量儀器難以在小型污水處理廠、農村污水處理設施中普及。同時,大量的小型污水處理設施難以配備專業的技術人員進行日常監管。因此,這些污水處理設施的運行在客觀上需要智能化控制或者集中化控制。這在客觀上需要準確、便捷、成本低的水質參數檢測手段,以擺脫對現有昂貴檢測儀器的依賴。
軟測量可以通過機器學習等方式建立基礎指標(例如溶解氧等)與目標指標(例如生化需氧量等)之間的數學關系,并最終從基礎指標推斷目標指標的數值。與常規目標指標的檢測方法相比,這些基礎指標檢測耗時短、費用低,獲得的相應的目標指標耗時較短、費用低廉。軟測量的這些優點使其在部分工業領域得到了廣泛的應用,這也為污水處理設施水質指標的日常監測與實現污水廠運行智能化提供了新的解決途徑。
近年來,國內的研究人員在污水處理領域對軟測量技術進行了大量的研究。本文通過綜述現有文獻,概述了軟測量技術測量污水處理相關水質指標的進展。相關論文的研究由自動化、計算機等專業人員完成。本文從水處理專業角度探討有待進一步研究之處,期望可以起到拋磚引玉的效果。
Part 1 軟測量技術測量水質的技術原理
軟測量技術本身未采用任何硬件去測量目標水質指標的數值。其構建了一批其他水質參數的檢測值與已經獲得的目標水質指標檢測值之間的某種相關關系,從數值上,通過其他水質指標數值來推斷目標水質指標的數值。軟測量技術一般通過機器學習的方式來實現,故上述相關關系的準確構建過程不受人工干預,最后構建成的關系也是未知的。然而,構建相關關系在實踐中具備使用價值。
軟測量在實際運用過程中有多種可使用的機器學習方式。這些機器學習手段均使用了復雜的數學手段,在有限的篇幅中對任意一種數學手段的原理進行詳細介紹是非常困難的。本文僅對使用廣泛的BP(back propagation,誤差反向傳播)神經網絡、RBF(radical basis function,徑向基函數)神經網絡以及支持向量機方法的基本原理進行介紹。實際運用過程中,上述3種軟測量手段存在多種變種。這些變種的技術細節可參考本文的參考文獻。
1.1 BP 神經網絡原理
BP神經網絡由輸入層、隱藏層和輸出層構成。每層節點數量沒有限制,但是隱藏層節點數一般大于等于輸入層節點數。圖1為有3個輸入變量的BP神經網絡。輸入層接收來自輔助變量的數據。隱藏層中每一個節點的輸入是通過線性組合得到的一個數值,該數值是輸入層所有節點數值與對應權重乘積的和加上一個常數項;該節點的輸出是該線性組合值作為變量經過該節點上的一個激勵函數處理后的函數值。隱藏層每個節點的輸出與相應權重相乘的和加上一個常數項是輸出層節點的輸入。該輸入經過輸出節點中的激勵函數處理后,作為該輸出節點的輸出。若該輸出與測量值不一致,那么結合反饋,采用最優化方法,調整上述過程中涉及的權重值以及激勵函數中的參數,直到輸出層輸出數值與測量值之間的差值足夠小。神經網絡的訓練過程就是利用已有目標參數的數值監督學習,并調整上述權重和激勵函數中參數值的過程。當訓練完成之后,該神經網絡具備將輸入參數轉化成輸出的能力。
BP神經網絡是應用廣泛的神經網絡,如圖1所示。但是,其計算量大,易于陷入局部最小點,從而使預測不準確。
1.2 RBF神經網絡原理
RBF 神經網絡的結構與BP神經網絡類似,也包括輸入層、隱藏層和輸出層。不同的是,輸入層到隱藏層之間的權重恒等于1。BP神經網絡中的激勵函數一般采用Sigmoid 函數,而RBF神經網絡隱藏層中一般采用高斯函數等具備徑向對稱性的函數。隱藏層任意節點高斯函數的輸入為輸入層的參數向量與該高斯函數權值向量之間的距離。若輸入的參數向量與該節點高斯函數的權值向量距離較遠,那么該輸入向量對該節點的輸出影響很小。RBF神經網絡的訓練過程就是確定高斯函數的中心、方差和隱藏層到輸出層權重的過程。根據函數中心優化方法的不同,RBF高斯函數有多種函數中心優化方法,如隨機選取法、自組織選取中心法、有監督選取中心法和正交最小二乘法。
與BP神經網絡相比,RBF神經網絡學習速度快,并可有效避免陷入局部最小值。RBF神經網絡可能存在過學習的問題,即訓練得到的模擬曲線在兩個樣本點之間不平滑。
1.3 支持向量機原理
若樣本點可被一個空間面在多維空間被有效地分開成兩批,該空間面向這兩批樣本點分別平移所碰到的第一個樣本點稱為支持向量。基于支持向量的支持向量機方法不但可以用作樣本點的分類,也可以用作回歸分析。
當用作回歸分析時,支持向量機方法將輸入向量通過非線性映射φ(x)變換到另一個高維空間,并在此空間內進行線性回歸。對于一個訓練集[式(1)],對該訓練集進行訓練,實際上是求函數[式(2)],使得函數值與yi之間的距離盡可能小。經過數學變化,上述函數等價變換成式(3)和式(4)。
支持向量機方法原則上可以避免過學習的問題。
Part 2 軟測量技術測量水質的途徑
在軟測量領域,目標指標稱為主變量(primary variable)。主變量一般是化學需氧量、生化需氧量等檢測需時長、流程復雜的水質指標,是軟測量的預測目標。相應地,基礎指標稱為輔助變量(secondary variable)。輔助變量一般是酸堿度等容易檢測的指標。軟測量模型的開發及使用一般包括下述步驟。
2.1 篩選輔助變量
不是所有易檢測的水質參數都與主變量相關,有的輔助變量與主變量相關性較弱。因此,為了方便收集和處理數據,通常需要限定輔助變量的選擇范圍。輔助變量的選擇可根據研究人員的專業知識通過提出初步的范圍以及主成分分析等數學工具篩選必要的輔助變量。
2.2 數據處理
現場采集到的輔助變量的測量數值不是恒定的。對于任意一個輔助變量,若部分檢測值與其他數值的偏差較大,需將顯著偏離其他數值的數據篩選出去。通常情況下,將與樣本平均值差別大于樣本標準差3倍的數據剔除。必要時,需將數據進行標準化處理,還需將獲得的數據按照一定的方式分為2~3批,以滿足后續構建模型的學習和檢驗。
2.3 模型的選用
大量的機器學習手段可以用來構建輔助變量和主變量之間的相關關系。然而,不同的機器學習方式在復雜程度、計算速度、收斂于全局最優點的能力、過學習的性能方面存在較大的差異。原則上,在有大量訓練數據的情況下,現有的機器學習方式均可以實現良好的預測效果。
2.4 模型訓練、驗證、使用
采用樣本對建立的模型進行訓練后,應采用其他樣本驗證模型的正確性。只有在模型的正確性得以驗證的前提下,該模型才具備可被運用的前提。該步驟應該考慮避免模型的過擬合和欠擬合。
2.5 模型的在線矯正
模型在使用的過程中,受到進水水質變動等因素的影響,軟測量的預測能力可能會退化。因此,需對軟測量模型進行一定的矯正,使其預測能力在受到干擾的情況下也能預測準確。
Part 3 國內污水處理軟測量的研究進展
圖2為2008年至今所有發表在中文期刊上涉及不同軟測量技術的論文與相關論文總數的比例。圖2顯示,基于神經網絡的軟測量技術是最常見的軟測量技術手段,支持向量機方法相關的論文比例略低于基于神經網絡的論文,采用其他方法的論文數量較少。表1顯示,國內的相關研究主要關注反應器出水水質的預測。在此方面,國際上的主流方法是神經網絡,支持向量機方法非常少見。在軟測量的運用上,除對反應器出水水質做監測之外,軟測量還可用于監測反應器和其他在線測量設備的運行狀態。國內的研究基本不涉及后兩者。
3.1 軟測量方法的準確性
BP神經網絡是最為成功的神經網絡,但BP神經網絡并未被作為主要研究方法,而是被作為對比方法出現在論文中。由于BP神經網絡易收斂于局部最優點,該方法的預測結果與測量值偏差較大。軟測量技術一般采用可以避免收斂到局部最優點的神經網絡方法。例如,采用徑向基函數神經網絡,該神經網絡在一定程度上解決了BP 網絡訓練時間長、收斂速度慢、收斂到局部最小的問題。類似地,支持向量機方法具有全局最優解,對新鮮樣本適應能力更強,故其也得到了較多的應用。研究人員使用各式各樣的神經網絡和支持向量機方法。盡管方法不同,但是這些方法的預測結果一般與測量值均很接近(表1),這說明軟測量技術具備很高的準確性。
3.2 軟測量方法可靠性
表1顯示各項研究用于訓練模型的樣本數用于測試模型的樣本數存在巨大差異。由于城市污水水質全年波動較大,只有在軟測量模型可以準確地、長期地在線預測污水處理設施出水水質的情況下,該軟測量模型的實用性才能得到充分的檢驗。只用少數幾個或幾十個樣本去檢驗構建的軟測量模型的有效性尚缺乏說服力。
污水水質的變化等因素會對污水處理設施的出水效果造成影響,這就導致構建的軟測量模型的預測效果存在退化的問題。因此,構建的軟測量模型需要具備在線矯正的能力。只有少量的軟測量方法可以做到在線預測而非僅采用歷史數據對出水進行模擬。相關科研人員在此方面做了有益的探索,這些研究以使用支持向量機方法為主。
3.3 軟測量方法實用性
國內的研究工作絕大部分的研究對象為城市污水,只有極少量論文涉及造紙廢水。在污水處理過程中,城市污水的機理建模已經積累了很多的經驗。理論上,活性污泥數學模型具備較好的預測出水水質的能力。在復雜工業污水方面,由于水質與城市污水相差較大,其機理建模相對困難。例如,在污水厭氧處理方面,雖然厭氧過程有厭氧消化數學模型可供使用,但是該模型只是提供了一個大致的模型框架,相關過程參數的具體數值在模型運用時一般需要標定。這給厭氧消化數學模型的運用帶來了極大的困難。這說明,軟測量在工業污水處理方面具備較大的運用空間。將軟測量用于工業污水方面的研究,國際上的案例相對較多。Molga等采用神經網絡對處理紡織工業廢水生物反應器的出水化學需氧量(COD)和氮類化合物進行了準確的預測。類似地,軟測量在預測生物反應器處理造紙廢水、醫藥廢水、制糖廢水等工業廢水的出水水質方面也取得了較好的效果。這意味著采用軟測量技術預測工業廢水的出水水質是可行的。
表1顯示,預測指標以出水生化需氧量(BOD)、COD、總氮(TN)、總磷(TP)為主。這些指標的人工測試較為繁瑣,且儀器在線測試耗時較長,故這些指標是軟測量的目標指標。即使是預測同樣一個水質指標,例如BOD,不同的研究所采用輔助變量的數量以及類型差異較大。這意味著,面對一個同樣的目標指標,所對應的輔助變量需要根據具體的情況進行選擇。除了上述4個指標,目前尚缺乏對硝酸鹽、凱氮等指標的預測,而這些指標也是可以進行軟測量預測的。
絕大部分的中文論文預測反應器出水水質參數而忽略了進水水質參數的軟測量檢測。通過對進水水質的檢測以及事先建立的活性污泥模型,有望可以及時調整反應器的操作,從而保障出水水質。相關論文認為,活性污泥模型涉及的參數眾多,實際應用麻煩。當應用于城市污水時,雖然活性污泥參數眾多,但是除了自養細菌的最大生長系數需要矯正之外,其他參數一般均不需要矯正。正確使用活性污泥模型的關鍵正是對入水水質的準確測量。國外很早就實現了對進水TP濃度的在線軟測量,并取得了很好的測量精度,這說明進水水質的在線軟測量也是可以實現的。
現有軟測量模型雖然可以很好地預測出水水質,但是難以對調控反應器的運行提出針對性的指導。因為大部分軟測量模型沒有將污水處理設施的操作參數,例如污泥回流量、污水回流量等加入到模型中,而這些操作參數必然對污水處理效果造成影響。
軟測量在某些工業領域得到了廣泛的應用,這說明軟測量技術的應用存在合理性。現有的中文文獻主要以科學研究為主。雖然部分研究成果形成了硬件,但是進行工業化運行的例子還比較少。與國外的情況相比,軟測量技術在國內的應用顯得較為滯后。在韓國,部分小型污水處理設施的水質水量波動較大,缺乏具備專業技能的管理人員。通過對電導率、溫度、酸堿度、溶解氧、氧化還原電位(ORP)以及濁度的檢測,研究人員構建了這些變量與出水化學需氧量以及氮磷濃度的關系,并通過集中管理的方式指導這些小型污水處理設施的運行。通過這種方式,避免了在每個小型污水處理設施配置專業人員的巨大人力成本。這為我國廣大農村污水處理設施的運行提供了很好的范例。在農村,缺乏專業的污水處理設施管理人員是一個現實的問題。在實現軟測量的基礎上,對農村污水處理設施進行中心化管理是一個可能的解決途徑。軟測量也在其他國家實際運行的污水設施中被用于監測反應器出水的氨氮、硝酸鹽、COD、磷酸鹽和TN。這說明軟測量技術在污水處理領域也是具有應用價值的。
3.4 軟測量實例
研究人員采用軟測量技術預測了污水廠的出水水質。該研究以溫度、流量、酸堿度、溶解氧濃度、氧化還原電位、濁度和電導率為輔助變量,以COD、硝酸鹽、磷酸鹽濃度為主變量。在模型訓練階段,每個主變量大約采用了300個數值作為訓練數值。訓練完成后,預測數值約為600個。模型的預測結果以及測量結果之間的比較如圖3所示。由圖3可知,從整體上看,3個主變量的測量值與預測值吻合較好,這說明軟測量取得了良好的預測效果。同時,圖3顯示模型預測早期(前500個數值)的準確性顯著高于后期,這說明軟測量雖然可以取得準確的預測效果,但是若要在后期取得非常準確的預測結果,那么后期的模型矯正也是需要的。但是,即使不采取措施對后期的軟測量模型進行矯正,后期較小的偏差也不影響運行人員對出水水質的判斷。
歐洲的研究人員對一個虛擬的污水廠構建了活性污泥三號模型與神經網絡模型。神經網絡采用的輔助變量是活性污泥數學模型(activated sludge model No.3,ASM3)的進水數值參數。兩個模型的出水效果如圖4所示。在該研究中,以活性污泥模型的計算結果為標準參照值。圖4顯示,神經網絡對出水有機物濃度的預測結果與標準參照值非常吻合,而氮類的部分預測結果稍有偏差。這些偏差一般可以采用優化訓練值以及神經網絡結構來削減。同時,這種偏差遠小于采用活性污泥數學模型預測實際污水廠出水水質的偏差,因為后者的偏差來源于活性污泥的數學結構以及入水水質的準確測量。因此,采用神經網絡代替活性污泥數學模型對污水廠進行出水水質預測是完全可行的。
Part 4 結論
本文總結了國內軟測量技術在污水處理領域的研究狀況。相關的研究人員主要采用神經網絡和支持向量機方法對城市污水處理反應器的出水水質進行預測,預測結果與測量結果均較為接近,取得了很好的預測效果。未來值得關注的研究領域在于拓展現有的預測水質指標,加強對工業污水出水水質的預測,強化對進水水質的軟測量工作以及軟測量模型的在線矯正,并將研究結果運用于實際生產實踐。
使用微信“掃一掃”功能添加“谷騰環保網”