基于DPCM算法的測井數據壓縮
摘要:由于現實中測井數據數據量大,數據傳輸實時性強,這就要求傳輸效率要盡可能地高。但是目前大多數油田仍采用直接傳輸采樣數據的方式。因此提出了一種基于DPCM算法的測井數據傳輸方式。針對編碼方式的特點,設計了編碼流程圖。對測井數據進行了相關的預處理,再進行編碼實現。經仿真實驗后發現,差值編碼能夠有效地去除數據之間的冗余,在保證編碼壓縮后的測井數據與原始測井數據誤差不超過5%的情況下,經壓縮后的測井數據量為原始測井數據量的1/2,因此測井數據的傳輸效率提高到了2倍。
關鍵詞:差分脈沖編碼調制;Matlab;測井數據;數據壓縮
0 引言
在隨鉆測井系統中,測井數據的實時傳輸是非常重要的環節。隨鉆測量對數據傳輸的實時性要求很高,目前最常用的信號上傳方式主要有鉆井液脈沖與電磁波這2種。鉆井液脈沖信號的傳輸方式主要利用了鉆井液脈沖信號將數據傳輸至地面,可靠性好,傳輸距離遠。而電磁波傳輸方式在傳輸過程中受到底層的影響大,傳輸衰減嚴重,一般主要用于較淺的地層中。在現代測井技術中,越來越精確的地層信息使測井數據量成倍地增加,但有限的傳輸帶寬卻限制了數據傳輸的效率。因此提高測井數據的傳輸效率已經是現在隨鉆測量技術發展的重點。
為了提高測井數據的傳輸效率,發達國家已經將數據壓縮技術運用在測井數據的傳輸中。例如,斯倫貝謝公司利用圖像壓縮技術已經成功地將井下井眼成像圖像壓縮50倍后傳輸至地面。這樣不僅解決了測井數據的傳輸效率問題,還兼顧實時性,使數據更快地傳輸至地面。與發達國家相比,我國的隨鉆測井整體技術還處于發展階段,并且研究方向主要集中在信號的信道編碼與信道建模等方面,對信息源的壓縮的研究相對來說比較少,因此提出一種有效的測井數據壓縮技術是非常有必要的。本文根據測井數據的相關性特點,提出了一種基于差值編碼(DPCM)的壓縮編碼傳輸方式,并給出了仿真結果。
1 DPCM編碼原理
1.1 DPCM基本原理
差值編碼(Differential Pulse Code Modulation,DPCM)又稱為預測編碼,是對信號抽樣的差值進行量化編碼的調制方式。DPCM是用已經過去的抽樣值來預測當前的抽樣值,對它們的差值進行編碼(見圖1)。由于所需編碼的數據中存在大量的冗余,使用這種編碼方法能有效地減少數據冗余,實現數據壓縮的目的。其中,s(n)為輸入的原始數據信號;s’(n)為輸出的解碼信號。
1.2 零極點預測器
DPCM編碼中最重要的是預測器,預測器的選擇直接影響誤碼率,本文選擇零極點預測器來預測當前的抽樣值。零極點預測器是由零點預測器與極點預測器組合得到的。
2 測井數據的預處理
在測井數據傳輸過程中,計算機是嚴格地按照各個采樣點的數據值進行計算傳輸的,因此測井數據的準確性是保證測井數據傳輸有意義的重要因素。但是由于受到井下惡劣環境的影響,即使采用嚴格的技術措施,測井數據曲線幅度難免會產生錯誤,因此有必要在進行編碼前對測井數據進行預處理。
2.1 剔除異常值
所謂異常值,就是在測量過程中,測量結果大大偏離正常范圍的數值。異常值的存在,擴大了測井數據的量化范圍,給編碼時的數據預測與量化帶來了困難。在實際編碼過程前,應首先剔除異常值。本文采用在統計學中的3δ準則來進行異常值的檢測與剔除。依據3δ準則,若采樣數據的值處于平均值的3倍標準差之外,則被稱為異常值。其標準差公式為。式中:
為x的平均值。采樣值中正常值為x±3δ內的數值,超過即為異常值。
評論