一種基于大數據技術的配網搶修精益化方法以及管理系統(tǒng)的制作方法

文檔序號：9922359閱讀：589來源：國知局

一種基于大數據技術的配網搶修精益化方法以及管理系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明設及一種電力信息大數據信息挖掘與分析領域，特別是一種基于大數據技術的配網搶修精益化方法W及管理系統(tǒng)。
【背景技術】
[0002] 現有的配網搶修過程管理都是基于傳統(tǒng)的統(tǒng)計分析來進行數據規(guī)范和數據展現的，傳統(tǒng)的統(tǒng)計分析是指運用統(tǒng)計方法及與分析對象有關的知識，從定量與定性的結合上進行的研究活動。統(tǒng)計分析可W分為5個步驟:描述要分析的數據的性質;研究基礎群體的數據關系；創(chuàng)建一個模型，總結數據與基礎群體的聯系;證明（或否定)該模型的有效性;采用該模型來預測將來的趨勢。
[0003] 在運用傳統(tǒng)的統(tǒng)計分析方法進行分析應用時，需對數據分布和變量間的關系做假設，確定用什么概率函數來描述變量間的關系，W及如何檢驗參數的統(tǒng)計顯著性，W驗證假設是否成立，而無法實現自動尋找變量間隱藏的關系或規(guī)律，并且，傳統(tǒng)的統(tǒng)計分析在處理實時、海量、模糊、雜亂的數據時效率低下，不能很好的支撐配網搶修的相關應用，所W，基于大數據技術的分布式并行計算和分析挖掘能力可W實現對海量數據快速準確的進行分析。

【發(fā)明內容】

[0004] 本發(fā)明的目的在于針對傳統(tǒng)統(tǒng)計分析方法在分析應用之前需對數據分布和變量間的關系做假設的問題，基于大數據的數據挖掘技術可W不需要對數據分布做任何假設，數據挖掘中的算法會自動尋找變量間隱藏的關系或規(guī)律。針對傳統(tǒng)統(tǒng)計分析方法處理實時、海量數據效率低下的問題，基于大數據的分布式消息隊列、流計算、內存計算和分布式并行計算技術可W高效率、簡潔、實時的實現對數據的采集和處理。
[0005] 本專利通過定時或實時采集故障搶修管理系統(tǒng)、生產管理系統(tǒng)、市調系統(tǒng)、氣象信息系統(tǒng)中的故障搶修工單信息、搶修班組、用戶、臺區(qū)、線路、氣象信息等數據信息，構建故障搶修效率分析和故障數量預測兩個數據挖掘模型，實現"配網故障搶修實時分析"和 "故障搶修效率分析"場景應用，從而提高供電服務質量，強化配網故障搶修管理水平。
[0006] 本發(fā)明的目的通過如下技術方案實現：
[0007] -種基于大數據技術的配網搶修精益化方法，它包括W下步驟：
[000引步驟a、數據源建立，建立故障搶修工單信息、搶修班組、用戶、臺區(qū)、線路、氣象信息的數據信息；
[0009] 步驟b、數據整合:融合kafka實時數據分布式消息隊列、sqoop離線數據抽取技術，對異構數據的快速接入，構建分布式數據整合功能，具備定時/實時數據的采集處理能力，實現從數據源到平臺存儲的配置開發(fā)、過程監(jiān)控；
[0010] 步驟C、數據存儲:對關系型數據存儲、非關系型數據存儲、分布式文件存儲進行數據存儲，同時提供統(tǒng)一存儲訪問接口，提高數據存儲低成本的橫向擴展能力，提高在高并發(fā) 條件下的快速數據訪問響應能力、滿足海量數據實時與準實時存儲需求；
[0011] 步驟d、數據計算:并支撐SQL查詢，滿足不同時效性計算需求;批量計算支持大批量數據離線分析;流計算支持實時處理，如用電數據實時處理、預警；同時提供類似S化的查詢分析技術，將查詢語句轉譯為并行的分布式計算任務；步驟e、數據分析：集成R語言和 Mahout，形成分布式數據挖掘算法庫，提供挖掘建模設計工具，構建統(tǒng)一的分析建模能力和運行引擎；同時，通過提升改造分析決策平臺，完善分析建模、模型運行、模型發(fā)布等能力，增加對大數據分布式計算的支持，滿足實時、離線應用的分析挖掘需求，為公司分析決策應用構建提供基礎平臺支撐；
[0012] 步驟f、場景展現:實施配網故障搶修實時分析W及故障搶修效率分析。
[0013] 其中，步驟e:數據分析中，包括故障搶修效率分析，故障搶修效率分析具體為采用 K-Means聚類算法觀察探索不同搶修環(huán)節(jié)標準用時與故障、氣象的內在發(fā)展規(guī)律，構建搶修效率分析模型，尋找多維度下不同搶修環(huán)節(jié)的標準用時，區(qū)域、駐點的月度故障統(tǒng)計信息； K-Means依賴于不斷尋找簇中屯、直至其達至穩(wěn)定實現對象的劃分;K-Means算法一開始先 (隨機或依據某種策略)選擇K個簇中屯、，然后在每次迭代時將對象劃分至最相似的簇中屯、，形成新的簇劃分后再計算同簇對象的均值作為新的簇中屯、;運個過程反復進行，直至簇中屯、不再變動或達到最大迭代次數為止。
[0014] K-Means算法實現步驟如下：
[001引1)第一步是為待聚類的點尋找K個聚類中屯、。
[0016] >指定聚類數目K;
[0017] >在所有個案中隨機選取K個類初始中屯、，（OkJk)，k = l，2, ...；
[0018] 2)第二步是計算每個點到聚類中屯、的距離，將每個點聚類到離該點最近的聚類中去，根據距離最近原則進行分類，計算每個樣本數據點到K個類初始中屯、點的歐式距離，并按照距K個類中屯、點距離最近的原則分派所有樣本，形成K類；
[0019] >樣本點到類初始中屯、點的歐式距離公式為：既C￡?((O .n.嘩7；>)=^,-〇tf+Pi-nf， (Oi ,Ti)為樣本點；
[0020] >判斷樣本點到哪類初始中屯、點的距離最小，并將此樣本歸入此類；
[0021] 3)第=步是計算每個聚類中所有點的坐標平均值，并將運個平均值作為新的聚類中屯、。反復執(zhí)行(2)、（3)，直到聚類中屯、不再進行大范圍移動或者聚類次數達到要求為止，依次計算各類中K個變量的均值，W均值點作為K個類的中屯、點；
[0022] >重新確定類中屯、點(ck，tk) n為各類中樣本點的個數；，
[0023] 設置終止聚類的條件:迭代次數n:當目前的迭代次數等于指定的迭代次數時，終止聚類;類中屯、點偏移程度(S):新確定的類中屯、點距上個類中屯、的最大偏移量小于指定的量時停止聚類。當迭代次數和類中屯、偏移成都中任一條件滿足則結束聚類，不滿足上述兩個條件，則反復執(zhí)行(2)、（3)。
[0024] 另外，步驟e:數據分析中，包括故障數量預測，故障數量預測具體為采用隨機森林分類預測算法觀察探索歷史故障發(fā)生情況與負荷、氣象的內在發(fā)展規(guī)律，構建故障量預測模型，預測設備故障量可能發(fā)生的量級區(qū)間范圍；其中隨機森林，指的是利用多棵樹對樣本進行訓練并預測的一種分類器；就是由多棵CART(Classification And Regression Tree) 決策樹構成的;對于每棵樹，它們使用的訓練集是從總的訓練集中有放回采樣出來的，總的訓練集中的有些樣本可能多次出現在一棵樹的訓練集中，也可能從未出現在一棵樹的訓練集中；在訓練每棵樹的節(jié)點時，使用的特征是從所有特征中按照一定比例隨機地無放回的抽取的。
[0025] 隨機森林分類預測模型構建的過程主要包括W下幾個步驟：
[0026] 1)確定特征值，需采用預測算法預測未來一天的天氣信息和負荷信息，將天氣、負荷信息作為模型的特征值；
[0027] 2)進行數據預處理，由于原始數據存在缺失、錯漏等問題，需要對原始數據進行預處理，得到我們的模型輸入數據，另外，隨機森林分類算法的目標變量需為分類變量，而故障量為數值變量，需采用聚類算法將故障量聚為若干聚類區(qū)間，并將故障量映射到聚類區(qū) 間；
[0028] 3)進行模型訓練，采用隨機森林分類算法構建故障量預測模型，輸出預測結果；
[0029] 4)進行模型評估，采用查準率、查全率兩個指標評估模型的預測效果，計算公式如下：
(D (2)
[0032] 其中，precision和recall分別指查準率和查全率，化，Nt,化分別表示預測正確樣本數、預測樣本數及真實樣本數。
[0033] 搶修實時分析:實現對當前上海全市的配網故障發(fā)生的實時情況進行監(jiān)測，并從故障數量實時分析、故障量日趨勢監(jiān)測、故障處理情況=個維度進行詳細的剖析和監(jiān)測，實時跟蹤故障搶修的整個過程，分析各區(qū)域駐點的工作強度。并通過隨機森林分類預測算法，預測未來一天不同供電公司電網故障和非電網故障的故障數量，為搶修資源調配提供建議。
[0034] 搶修效率分析:按照發(fā)生年月、故障分類、電壓等級、設備聚類、設備大類五個維度實現對每月上海全市的非電網\電網\各電壓等級的配網搶修效率進行分析，對上海全市、各區(qū)域、駐點的效率進行評估和分析。并通過聚類算法，W搶修過程重要節(jié)點時長為目標變量，氣象及交通流量等外部信息驗證模型結果，制定各類故障的搶修標準效率，對搶修過程中超期的環(huán)節(jié)進行預警，實現搶修過程中的全面監(jiān)督。
[0(X3日

完整全部詳細技術資料下載

當前第1頁1 2 3 4

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯系技術所有人。
技術研發(fā)人員：許元斌;王繼業(yè);曾楠;陳宏;鄒保平;黃文思;郝悍勇;羅義旺;李金湖;李云;余仰淇;林燊;劉燕秋;駱偉藝;羅文甜;張歡;林翰;吳少平;陳智鵬;劉彩;
技術所有人：國家電網公司;國網信通億力科技有限責任公司;
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種基于大數據技術的配網搶修精益化方法以及管理系統(tǒng)的制作方法