本發(fā)明涉及生產(chǎn)過程能耗預(yù)測,具體涉及一種基于虛擬樣本生成和多輸出神經(jīng)網(wǎng)絡(luò)模型的錫冶煉過程能耗預(yù)測方法。
背景技術(shù):
1、隨著經(jīng)濟(jì)發(fā)展進(jìn)入新常態(tài),錫冶煉作為典型的“三高一資”行業(yè),是節(jié)能減排的重點對象,預(yù)測錫冶煉過程能耗在節(jié)能降耗方面有著重要作用,通過建立能耗預(yù)測模型可以了解錫冶煉過程的能耗使用規(guī)律,模型預(yù)測出的值也為錫生產(chǎn)計劃提供了重要的參考信息。關(guān)于生產(chǎn)過程的能耗預(yù)測模型可分為機(jī)理建模、投入產(chǎn)出法、時間序列預(yù)測、回歸預(yù)測和人工智能模型。其中,機(jī)理建模是根據(jù)生產(chǎn)過程的內(nèi)部機(jī)制建立精確的數(shù)學(xué)模型;投入產(chǎn)出法以系統(tǒng)的觀點分析流程工業(yè)中每個工序之間的投入產(chǎn)出平衡,反映了各工序之間相互影響的關(guān)系;時間序列預(yù)測法需要的輸入變量只有能耗自身,因此模型的計算也相對比較簡單;回歸預(yù)測方法通過輸入相關(guān)歷史變量數(shù)據(jù),挖掘輸入變量與能耗數(shù)據(jù)之間的變化規(guī)律和量化關(guān)系,建立回歸預(yù)測模型計算得到未來的能耗數(shù)值,如:多元回歸分析、邏輯回歸、線性回歸、多項式回歸等模型。人工智能算法被引入導(dǎo)生產(chǎn)過程能耗預(yù)測領(lǐng)域當(dāng)中,常用的模型有支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò),決策樹等。
2、面對錫冶煉過程中高溫、強(qiáng)粉塵等復(fù)雜環(huán)境下,從現(xiàn)場采集到的過程數(shù)據(jù)無法直接用于預(yù)測模型的構(gòu)建。過程數(shù)據(jù)的采集和記錄往往存在缺失值、異常值;不同工序所采集的數(shù)據(jù)還存在量綱和周期的差異。冶煉過程數(shù)據(jù)不僅在數(shù)量上存在不足,還存在數(shù)據(jù)信息的不完整,導(dǎo)致傳統(tǒng)的能耗預(yù)測模型預(yù)測精度低,模型泛化能力差。因此,預(yù)測錫冶煉過程的能耗對錫行業(yè)的持續(xù)發(fā)展和環(huán)境的健康發(fā)展具有重要意義。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中存在的以上問題,本發(fā)明提出了一種基于虛擬樣本生成和多輸出神經(jīng)網(wǎng)絡(luò)模型的錫冶煉過程能耗預(yù)測方法,以解決小樣本數(shù)據(jù)下模型預(yù)測精度低的問題,通過采用虛擬樣本生成技術(shù)方法解決數(shù)據(jù)數(shù)量不足,數(shù)據(jù)信息不完整等問題,從而提高小樣本數(shù)據(jù)集下錫生產(chǎn)能耗預(yù)測效果。
2、為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
3、s1、收集錫冶煉過程中的歷史數(shù)據(jù)并進(jìn)行預(yù)處理,所述歷史數(shù)據(jù)包括:能源消耗類型和能耗影響因素;
4、所述能源消耗類型包括:錫冶煉過程總的電耗、錫冶煉過程總的煤耗、錫冶煉過程總的水耗、錫冶煉過程總的天然氣消耗、錫冶煉過程總的氧氣消耗;
5、所述能耗影響因素包括:焙燒工序壓縮空氣、焙燒工序焙砂、焙燒工序進(jìn)風(fēng)速度、焙燒工序進(jìn)風(fēng)壓力、澳爐熔煉工序壓縮空氣、澳爐熔煉工序爐內(nèi)壓力、澳爐熔煉工序粗錫、澳爐熔煉工序進(jìn)風(fēng)速度、澳爐熔煉工序進(jìn)風(fēng)壓力、澳爐熔煉工序爐渣溫度、精煉工序壓縮空氣、精煉工序焊錫、精煉工序進(jìn)風(fēng)速度、精煉工序進(jìn)風(fēng)壓力、精煉工序錫錠、精煉工序炭渣、精煉工序鋁渣、余熱回收工序煙氣壓力、余熱回收工序煙氣溫度、冶煉總錫錠;
6、所述預(yù)處理具體步驟如下所示:
7、s1.1、對缺失數(shù)據(jù)使用自回歸移動平均arima模型進(jìn)行填補(bǔ),具體表達(dá)式如下所示:
8、
9、式中:xt-i表示時間t-i時刻的值;c表示常數(shù)項;p表示自回歸階數(shù),φi表示自回歸系數(shù),et表示噪聲;
10、s1.2、采用拉依達(dá)準(zhǔn)則進(jìn)行異常值檢測并將其剔除;
11、在拉依達(dá)準(zhǔn)則下,異常值如果超過3倍標(biāo)準(zhǔn)差,那么可以將其視為異常值,拉依達(dá)準(zhǔn)則為:
12、1、數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827;
13、2、數(shù)值分布在(μ-2σ,μ+2σ)中的概率為0.9545;
14、3、數(shù)值分布在(μ-3σ,μ+3σ)中的概率為0.9973;
15、式中:μ表示均值,σ表示方差;
16、可以看出,數(shù)值的取值范圍幾乎全部集中在(μ-3σ,μ+3σ)區(qū)間內(nèi),超出這個范圍的值視為異常值;
17、s1.3、使用歸一化算法消除變量之間的量綱差異,其具體公式如下所示:
18、
19、式中,xmin表示數(shù)據(jù)最小值,xmax表示數(shù)據(jù)最大值,x表示缺失值填充和異常值檢測之后的數(shù)據(jù)。
20、s2、采用互信息算法分析步驟s1預(yù)處理后的歷史數(shù)據(jù)之間的相關(guān)性,去除冗余的影響因素;
21、由互信息算法計算不同輸入變量之間的相關(guān)性,對于相關(guān)性高于0.8的變量,可視為冗余,需要剔除冗余變量,互信息算法具體計算公式如下:
22、
23、式中,p(x,y)表示聯(lián)合概率密度,p(x),p(y)分別表示變量x與變量y的條件概率。
24、s3、將能耗影響因素設(shè)置為輸入變量、能源消耗類型設(shè)置為輸出變量,對輸入變量與輸出變量之間進(jìn)行靈敏度分析,剔除靈敏度值低于0.1的輸入變量,并找出一組最能影響輸出變量變化的輸入變量組合,所述靈敏度分析具體計算公式如下:
25、
26、式中,xk,i表示輸入值,表示輸入的平均值,yi表示第i個數(shù)據(jù)點的輸出值,表示輸出的平均值,n表示數(shù)據(jù)點的數(shù)量,r表示靈敏度系數(shù)。
27、s4、將s2中預(yù)處理好的歷史數(shù)據(jù)按8:2劃分訓(xùn)練集與測試集,選擇多輸出多層感知機(jī)為模型框架,以均方根誤差為損失函數(shù),構(gòu)建多輸出神經(jīng)網(wǎng)絡(luò)模型,并使用訓(xùn)練集進(jìn)行模型訓(xùn)練,使用優(yōu)化器adam來最小化損失函數(shù),在每個訓(xùn)練周期(epoch)之后,使用測試集評估模型性能,防止模型過擬合。
28、s5、采用多分布整體趨勢擴(kuò)散技術(shù)對s3得出的輸入變量組合進(jìn)行虛擬樣本生成,將生成的虛擬輸入樣本送入s4中由訓(xùn)練集訓(xùn)練、測試集評估后,具備準(zhǔn)確預(yù)測新數(shù)據(jù)能力的多輸出神經(jīng)網(wǎng)絡(luò)模型,并將多輸出神經(jīng)網(wǎng)絡(luò)模作為映射模型,由映射模型生成虛擬輸出樣本,并采用粒子群優(yōu)化算法對生成的虛擬輸入與輸出樣本進(jìn)行質(zhì)量篩選;
29、所述虛擬樣本生成包括:采用多分布整體趨勢擴(kuò)散技術(shù)進(jìn)行虛擬輸入樣本的生成、將多輸出神經(jīng)網(wǎng)絡(luò)模型作為虛擬輸出樣本的映射模型,再結(jié)合粒子群優(yōu)化算法,采用平均百分比誤差小于10%作為適應(yīng)度函數(shù)進(jìn)行虛擬輸入與輸出樣本的質(zhì)量篩選;
30、所述多分布整體趨勢擴(kuò)散技術(shù)實現(xiàn)步驟如下:
31、s5.1、計算每個變量數(shù)據(jù)的中心值m,具體表達(dá)式如下:
32、m=median(xi)
33、式中,xi表示第i個變量;
34、s5.2、計算每個變量數(shù)據(jù)的左偏度sleft與右偏度sright,具體表達(dá)式如下:
35、
36、式中,nleft表示小于最小值的樣本數(shù);nright表示大于中心值的樣本數(shù);
37、s5.3、確定可擴(kuò)展域的上界rb和下屆lb,具體表達(dá)式如下:
38、
39、式中,m表示數(shù)據(jù)的中心值,sleft和sright分別表示數(shù)據(jù)的左右偏度,表示第i個變量的方差,nleft表示小于最小值的樣本數(shù);nright表示大于中心值的樣本數(shù);
40、s5.4、在不同區(qū)間生成虛擬樣本xm,在區(qū)間[lb,min]生成的虛擬樣本為:
41、xm=lb+s(min-lb)
42、在區(qū)間[min,max]生成的虛擬樣本xm為:
43、
44、在區(qū)間[max,rb]生成的虛擬樣本xm為:
45、xm=max+s(rb-max)
46、式中,s為服從正態(tài)分布的隨機(jī)數(shù);
47、s5.5、通過粒子群優(yōu)化算法篩選虛擬樣本質(zhì)量,其具體表達(dá)式如下所示:
48、
49、式中,y為輸出值,表示模型預(yù)測的輸出值。
50、s6、結(jié)合s5生成的虛擬輸入、輸出樣本和s2預(yù)處理后歷史數(shù)據(jù),重新劃分訓(xùn)練集與測試集,進(jìn)一步對模型加以訓(xùn)練,并進(jìn)行模型預(yù)測性能評估;
51、在s2預(yù)處理后的歷史數(shù)據(jù)的基礎(chǔ)上加入粒子群優(yōu)化算法篩選出的虛擬輸入與輸出樣本,通過模型實驗,即每次增加10組虛擬樣本觀察模型預(yù)測性能的變化,進(jìn)而確定所需的虛擬輸入與輸出樣本數(shù)量,基于混合樣本對錫冶煉過程能耗進(jìn)行預(yù)測,其中,模型性能評估的指標(biāo)包括:決定系數(shù)、均方根誤差、平均誤差;
52、所述決定系數(shù)(r2)、均方根誤差(rmse)、平均誤差(mae),具體表達(dá)式如下:
53、
54、式中,m表示樣本總數(shù),yi和分別表示測量值與預(yù)測值,表示測量值的平均值,其中決定系數(shù)(r2)、均方根誤差(rmse)、平均誤差(mae)最終得出的值越小越好。
55、本發(fā)明的有益效果
56、1、本發(fā)明的基于虛擬樣本生成和多輸出神經(jīng)網(wǎng)絡(luò)模型的錫冶煉過程能耗預(yù)測方法,通過相關(guān)性分析和靈敏度分析,可以挖掘多輸出情況下最佳組合的輸入變量。
57、2、本發(fā)明的基于虛擬樣本生成和多輸出神經(jīng)網(wǎng)絡(luò)模型的錫冶煉過程能耗預(yù)測方法,引入虛擬樣本生成技術(shù)實現(xiàn)了小樣本數(shù)據(jù)的有效擴(kuò)充,提高了預(yù)測模型的魯棒性。