a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 電源與新能源 > 設計應用 > 基于數據驅動的多模型故障診斷

基于數據驅動的多模型故障診斷

作者:胡朝力1,周 剛2,張知宇3,陳寧寧3,吳維維3(1.國網浙江省電力有限公司平湖供電公司,浙江嘉興 314000;2.國網浙江省電力有限公司嘉興供電公司,浙江嘉興 314000;3.國網浙江省電力有限公司海鹽供電公司,浙江嘉興 314000) 時間:2022-11-25 來源:電子產品世界 收藏

摘 要:故障通常特指某個系統或某個運行過程的一系列相關參數喪失了規定性能的狀態,或者在特定場景下控制指標出現了偏差。故障不可避免,故障影響了電力系統正常安全穩定運行。為此迫切需要快速識別診斷故障。本文基于算法,詳細對比分析了多種基于主流模型故障診斷的方法,并通過實例驗證了模型的有效性以及優越性,對模型的選擇具有重要參考意義。

本文引用地址:http://www.j9360.com/article/202211/440879.htm

關鍵詞

0 引言

被控系統處于非正常運行情況時,若能夠采用某種技術快速實時在線檢測故障并且能基于先進定位技術判別故障點準確位置,并盡可能做到故障的預警,便能減輕故障帶來的一系列危害,此類技術即為故障診斷技術,可以對發生故障位置進行鎖定。此類技術具有低延時、靈敏性以及準確性都對系統正常運行起著至關重要的作用。

目前關于故障診斷的方法主要有 k 最近鄰算法 (k-nearest neighbor, KNN)、支持向量機(support vector machine, SVM) 的循環迭代診斷方法以及與差分自回歸移動平均模型(autoregressive integrated moving average , ARIMA) 方法。此外,由于采樣數據集龐大,算法計算時間較長,對故障診斷的時效性進一步帶來挑戰。為此,本文采用 Kid 樹算法提速增效。

本文分別依次采用上述 3 種主流算法與 Kid 樹算法相結合,對變壓器數據集進行故障診斷。數據集將分為完整數據集、缺失數據集以及粗糙數據集(未經數據預處理的數據集)三個場景,分別多場景下逐一比較故障診斷準確率,對算法的適用性做了詳細的分析。

1 故障診斷框架

在飛速發展的大數據時代背景下,電力采用數據也進入井噴式增長階段,緊隨而來的是龐大的計算數據量和建模復雜度。迫切需要一種可適用于冗余數據的計算方法,目前基于的自適應預警的方法受到工程界與學術界的一直關注。其特征主要表現為對海量、異源、高維數據甚至非數值數據的采樣數據(視頻數據、圖像數據等)進行挖掘計算和信息處理。PMU 等高精度、高頻率、多維度的采樣數據得到廣泛的應用,故障診斷可針對采樣設備采集所得的各種不同類型數據、不同來源數據進行快速的診斷以及預警。數據包括圖像數據、視頻數據、數值數據甚至抽象數據,數據的采樣頻率不同、屬性不同、來源不同,甚至維度不同。當數據維度不一致時,需要采用相關的降維數據,將異源數據歸一化為結構屬性一致的數據。在數據一致的基礎上,采用相關的挖掘算法,挖掘可以表征系統運行屬性特性的數據,此類數據信息可以判斷系統是否為正常狀態,從而實現達到系統的檢測與診斷功能,本文所提出的故障診斷的邏輯結構框架如圖 1 所示。

1669349119681598.png

圖1 數據驅動的故障診斷框架

基于數據驅動故障診斷的機理框架如圖 1 所示,可采用時間序列分析、經驗分解的基礎算法處理原始數據,并同時進一步分析數據處理結果。分析過程包括基于數據特征的手動設計以及數據預處理(特征選擇、數據降維等)。最后基于構建的模型進行數據的訓練,并基于訓練的模型輸出故障診斷結果。

2 算法理論模型

2.1 基于k-Nearest Neighbor(kNN)數據修復理論

k-Nearest Neighbor(kNN) 算法通過計算相鄰點的距離來判斷異常點。該算法主要用于尋找某類特征相似、數據接近的鄰近樣本,根據樣本計算的距離判斷是否異常。相同故障通常相關特征指標接近,為此可采用 kNN 用于相關缺失數據或者異常數據的修復。kNN 算法的理論模型如下:基于采集獲得的樣本初始數據集,通過數據預處理方式,確定缺失樣本數據集;確定待修復的測試樣本,歷史數據集中通過 kNN 法尋找與某數據其最鄰近的 k 個計算樣本數據,統籌計算所得的 k 個樣本數 據,針對已知的缺失數據集預估。本文為突出顯示故障發生時,其故障的不同數據相關指標間的關聯性文提出了一種以相關計算指標的負指數作為特定的某類權值,然后采用曼哈頓 -D 作為樣本間距離指標。

假設樣本數據中已有 N 組樣本歷史數據作,每一組樣本歷史數據可以表示為:

1669349258375636.png

1669349290684109.png

采用相關系數法對需要計算的相關特征指標進行空間距離計算,該距離可以體現兩類數據集數據與數據之間的空間相關性,與缺失數據的計算所得相關性越大,即為數據指標權重越小,表示所測試計算得到的樣本,更容易趨近與強關聯特征指標的計算訓練樣本。

選取 k 個最接近測試樣本的訓練樣本,計算對應特征指標的平均值作為缺失數據的估計值:

1669349350883813.png

與常規方法相比較(例如線性法、預測法等),kNN 主要通過數據修補的方法,按類型逐一修補丟失的數據,甚至對于不同結構屬性的數據,可以先將異源異構的數據歸一化處理后進一步修補。此方法可以挖掘歸類不同數據的特征屬性,并且由于此類算法打破了對時間序列原始數據的高度依賴,具備適用于故障特征類同的數據快速變動的場景下,針對丟失數據修復以及異常數據的辨識。

2.2 基于k-d 樹的樣本快速搜索策略

隨著 PMU、RTU 等一系列高精度采樣設備在配網、輸電網中的廣泛應用,電力數據也隨之指數增長。以某省電網作為實力分析,其高精度的采樣設備一個月的采樣數據高達 GB 量級。若仍然采用傳統的方法從海量的歷史數據庫中尋找與訓練樣本數據最靠近的 n 個訓練數據,其傳統各類指標性能皆無法滿足實時故障檢測的要求。以曼哈頓距離計算上述相關系數,此類方法適用于采用基于 k-d 樹的樣本搜尋技術,可以實現缺失數據的快速修復以及缺失數據的快速識別。

每一條樣本數據設定若干個特征指標,因而傳統的采樣數據所得的樣本數據往往是一個高維數據空間。k-d樹是一種以分割數據空間,將空間分為 k 個子空間的運算方法,該方法通常應用于高維度的空間,進行對關鍵數據全域范圍內的快速搜索。圖 2 以一個 k 為 3 的 3 維空間的數據集合為例,簡述 k-d 樹的結構原理。

1669349472760191.png

k-d 樹的生成過程共分為如圖 3 所示的 3 個步驟:

1669349505514832.png

首先,計算樣本數據的維度方法,根據維度計算方差數值大小并判斷距離的遠近以及是否為異常數據,方差越大則表面數據分散性越好;其次,采樣 Split 進行數據維度的分割以及排序,將中間數據點作為中軸點,并且基于子空間進行數據點軸點分割;最后,判斷子樹規模是否達到預定值 k,若達到則終止,反之則循環第一步。

k-d 樹每一個樹叉網絡的節點都為 k 維點的二叉樹,任何子節點都可視作分割所得子空間的超平面,進一步對分割所得的空間進行無層次劃分,從而構建可以應用在快速、高效檢索的索引結構中。該方法可以應用在結構化存儲,任何一個樣本數據包含 k 個特征指標,并存放在 k-d 樹的任意一個節點中。

通過圖 4 可以分析得出如下結論:通過測試方法得到準確率性能比較,在提及的方法中,基于 k-d 樹的快速搜尋法,該算法可以快速搜索附近區域范圍的樣本數值,其計算所需時長呈現出如下趨勢:數據容量越大,所需時間越久,但是增幅并不明顯。也就是當海量樣本的場景下,該鄰近搜索策略具有顯著優勢。

image.png

圖4 不同搜索策略的性能對比

2.3 基于k-最鄰近和SVM的循環迭代診斷方法

支持向量機(SVM)算法的基本思想是通過核函數將線性不可分的樣本數據映射到高維特征空間,從而構造成一個潛在線性可分的問題。單一的 SVM 僅能解決一個二分類問題,本文根據器故障之間的差異性設計了包含多個 SVM 的多分類器,實現對 6 類變壓器故障的準確診斷,多分類 SVM 分類器的結構如圖 5 所示。

image.png

圖5 采用多分類器的SVM模型機理結構

在數據丟失、數據異常的場景下,采用 kNN 方法首先進行對丟失數據的填補與校正。多分類 SVM 分類器的診斷數據必須是修復后的數據;縮小樣本空間的范圍,再縮小后的區域內再次重新利用 kNN 進行缺失數據估計。反復迭代直至鄰近樣本的故障類型與測試樣的故障診斷結果相一致。故障診斷流程如圖 7 所示,具體包含如圖 6 所示的多個步驟:

1669349811950077.png

圖6 采用多分類器的SVM模型機理結構

如圖 6 所示,首先通過原始數據輸入,得到樣本數據集;其次基于多分類 SVM 算法進行故障診斷;接著判斷診斷結果與 k 的相鄰的訓練樣本集的故障特征是否具有一致性,若一致,跳轉至第 4 步,反之進入第 5 步;最后根據診斷結果,將修復所得的數據包括診斷結果存入歷史數據集中。

2.4 AIRMA算法

差分自回歸移動平均模型(autoregressive integrated moving average, ARIMA) 算法通常主要用于時間序列預測分析。時間序列的獲取可以通過實驗分析獲得,也可來自相關部門的提供的數據。對于所得數據,首先篩查數據是否異常,分析這些點的存在是人為導致還是其他原因。保證所獲得數據的質量,以便用于建立合適模型。

時間序列的數據預處理包數據的異常辨識、數據的缺失填補與修復、數據的降噪與降維、數據的冗余過濾等。在數據質量得到保障的條件下,AIRMA 算法可以精準預測,并以此作為分析依據,可以精準、及時掌握故障的預警信息,為故障預警提供保證。

image.png

圖7 數據缺失場景下的診斷方案流程

3 硬件平臺

本文設計了一套自適應診斷系統的硬件執行環境由信號源裝置、故障指示器、診斷服務器 3 部分組成,具體搭建方法如下。

3.1 信號源裝置

信號源裝置連接在變壓器結構的高壓電量輸出端,可在一組接地電阻元件的作用下,實現對溫度控制設備的全面協調,從而使自適應診斷系統的實際應用需求得到較好滿足。在單位傳輸時間內,兩個不同的接地電阻元件分別與控制開關和信號源波段相連,前者可在感知變壓器內部溫度變化情況的同時,對剩余自適應電流進行集中性消耗,后者主要負責對輸出的電量信號源進行精準調試,使系統內部的電子傳輸環境時刻保持相對穩定的應用狀態。信號源裝置右側集中分布著多個輸出波段結構體,且隨著變壓器設備所承擔電壓值水平的提升,這些物理波段的振蕩行為也會逐漸趨于明顯,直至變壓器設備的內部溫度實值達到額定量標準數值。

3.2 故障指示器

自適應診斷系統的故障指示器由直流型、交流型、交感變化型 3 種形式組成。其中,直流型故障指示器的連接適應性相對較弱,僅能負載直流型的變壓器應用設備,當元件內的物理表現穩定值不斷提升時,該類型設備極易出現熔斷變化狀態,從而加劇熱缺陷行為的表現強度。交流型故障指示器的連接適應性具備一定的可更改能力,但僅能負載交流型的變壓器應用設備,當元件內的物理表現穩定值不斷提升時,該類型設備則能長期保持相對穩定的連接狀態,因此可對熱缺陷行為的表現強度進行一定的抑制性影響,從而為自適應診斷系統提供更多的可參考信息條件。

3.3 診斷服務器

在變壓器內部過熱缺陷故障自適應診斷系統中診斷服務器始終以主機集群的形式存在,可聯合故障指示器,對變壓器設備的內表面溫度值進行精準確定,再借助信號源裝置,實現對診斷執行指令的判別與處理。一般情況下,客戶端主機作為診斷服務器模式的頂層執行結構,可根據已記錄的變壓器內部溫度值水平,對自適應診斷權值進行設置,再借助輸入網絡信道,維護整個網絡內的信息診斷環境,從而使得系統內的待處理數據信息能夠具有較強的實用性價值。底層服務器的連接則必須完全遵照自適應診斷網絡的實際規劃需求,一方面記錄客戶端內的數據傳輸需求,另一方面將未完全消耗的溫度值信息反饋至其他系統診斷元件中。

4 算例分析

本文歸類整理了常規的故障類型,并將故障類型根據故障性質進行預先分類。本文收集了充足的基于精準采樣設備獲得的真實采樣數據,該數據集包括了 T1、 T2、T3 三類溫度數據,分別表示低溫低溫、中溫、高溫數據異常;局部放電、低能放電和高能放電三典型故障和正常狀態 Normal(N),并通過插值填補的方法彌補缺失數據。相關各場景下故障準確診斷率結果如表 1 所示。本文進一步采用了分層過濾的數據處理方法,將采樣所得的數據進行分層次過濾,第一層用于過濾周期窄帶干擾信號,第二層用于消除白噪聲,第三層用于抵御脈動干擾,將連續性、周期性比較高的數據進行濾波,盡可能高頻率采集數據。分層過濾抗干擾模型原理圖,如圖 8 所示。

image.png1669353461404716.png

圖8 分層干擾過濾模型原理圖

由表 1 深入分析可知,第 1 種方法采用完整的采樣完整數據集,通過 SVM 的算法,實現了 83.17% 的故障準確率,與預期相近;但是倘若直接采用原始數據集,未采用 SVM 的輔助,故障準確率就下降至 68.25%,此結果與預期也相一致。此外,倘若采用原始數據集,且原始數據集存在數據缺失的情況,分類正確率有了進一步明顯的下降,準確率僅為 59.09%。分析原因:當原始數據集缺失的不是關鍵數據,也就是丟失數據不包含關鍵性指標,則準確率還可以得到保障,但是缺失若為 關鍵數據,則故障診斷準確率驟降,同時包含關鍵特征屬性的數據缺失嚴重影響故障診斷的正確率。

利用的 kNN 法進行在數據缺失的場景下,對系統故障進行實時診斷,提供故障預警信息,此時故障診斷的正確率達到 78.64%,當數據沒有丟失時,該方法可以達到 83.17%,為此可以得出此方法適用于數據缺失的數據集場景,也就是數據丟失對故障診斷影響并不大,仍能保持第 1 類方法得到的故障診斷的高準確性。表 2 和圖 6 通過 1 個實例來進一步闡述兩種方法的差異性。

image.png

(*,12.85,3.65,2.6,0) 為一組原始樣本數據,各數值依次對應 5 個不同屬性的特征指標。其中 * 表示缺失的 A 指標。采用本文所提出的方法在歷史數據庫中搜索到最終數據樣本如表 2 所示,利用最鄰近樣本中 A2 含量平均值作為缺失數據的估計值與相對誤差。利用修復后的樣本數據進行故障診斷,結果為低溫過熱,與實際情況一致。利用 ARIMA 方法擬合該臺變壓器 A 含量的歷史數據,對缺失值進行預測,結果如圖 7 所示,估計值為68.02,基于該估計值進行故障診斷,結果為中溫過熱,診斷錯誤。

算例分析結果表明,本文所提出的故障診斷方法能夠實現在缺失數據場景下的樣本數據實時故障診斷,適用于大數據時代數據缺失常態化的場景,實際場景往往會因為通信中斷、采樣設備故障等原因發生數據的缺失。本文所提方法與與傳統過度擬合預測等方法相比,在數據丟失的場景下本文的方法具有明顯的優勢。此外,本文所提方法的診斷速度也能滿足要求。最后需要指出:本文所提出的方法也存在場景的局限性同,該方法僅適用于缺失數據的修復,但是不能辨識異常數據。變壓器內部過熱缺陷故障自適應診斷系統可在信號源裝置、故障指示器、診斷服務器 3 類硬件設備結構的作用下,針對變壓器內部的過熱原因進行準確分析,再通過變壓器負荷量計算的方式,實現對診斷信息存儲數據庫的平衡與穩定。實驗結果顯示,變壓器直阻均值量與電流攀升量數值的下降,能夠較好抑制變壓器設備內部的溫升變化行為,實現對電力消耗資源的合理保護。

5 結束語

本文根據數據驅動故障診斷機理,提出了一種頻繁發生數據丟失或者數據異常的場景下的原始樣本數據的實時的故障診斷方法。此環節中樣本數據質量是最為關鍵的元素。為此為提高數據樣本的質量,本文采用了相關數據修復方法,確保數據質量可靠。針對在線監測數據缺失問題,提出了一種基于缺失數據修復的在線故障診斷方法,所提出的方法在數據缺失場景下實現高準確率的故障在線診斷,適應當今大數據背景下數據異常頻發的情況。與傳統方法相比,本文所提出的方法在關鍵指標缺失和故障快速發展的情況下仍然具有較高的診斷準確率。

本文同時提出的新型變壓器內部過熱缺陷故障自適應診斷系統,在信號源裝置、故障指示器等多個硬件設備結構的支持下,對設備過熱原因進行準確分析,在聯合變壓器負荷量數值,實現診斷信息存儲數據庫軟件的實時連接。自適應診斷系統的應用,實現了對電流攀升量數值上升趨勢的較好抑制,能夠較好維持變壓器設備內部的平衡性溫度變化狀態。

參考文獻

[1] BEARD R V. Failure accommodation in linear systems through self-reorganization[R]. Report MVT-71-1, Man Vehicle Lab,1971.

[2] ALI A M, ZHANG Q. An innovations approach to fault diagnosis in linear time-varying descriptor systems[C].Control Conference. IEEE, 2014.

[3] 楊秋玉,阮江軍,黃道春.基于改進Hilbert-Huang變換和支持向量機的高壓斷路器觸頭超程狀態識別[J].電力自動化設備 ,2019,39(1):198-204.

[4] 劉琳.基于改進粒子群優化算法的微電網經濟調度研究[J].上海電氣技術,2020,13(2):5-9.

[5] 孫冰瑩,楊水麗,劉宗歧,等.國內外兆瓦級儲能調頻示范應用現狀分析與啟示[J].電力系統自動化,2017,41(11):8-16.

[6] 魏承志,陳晶,涂春鳴,等.基于儲能裝置與靜止無功發生器協同控制策略的微網電壓波動抑制方法[J].電網技術,2012,36(11):18-24.

[7] 張興科,魏朝陽,李征,等.包含高滲透率分布式電源的母線負荷區間預測[J].電網與清潔能源,2020,36(12):101-106.

[8] 黃維和,韓景寬,王玉生,等.我國能源安全戰略與對策探討[J].中國工程科學,2021(2):1-6.

(注:本文轉載自《電子產品世界》雜志2022年11月期)



評論


相關推薦

技術專區

關閉