本站點使用cookies,繼續瀏覽表示您同意我們使用cookies。Cookies和隱私政策
中國石化石油物探技術研究院攜手華為,建立了更高效、更經濟的數據分析處理平台。
文/中國石化石油物探技術研究院高性能計算高級專家 王永波
隨著全球石油資源消耗的逐年攀升,石油和天然氣行業已經成為HPC(高性能計算)最大的應用和創新行業之一。如何使用HPC找到更多的油層,提供更精準的井位建議,成為引領物探技術研究的創新方向。
中國石化石油物探技術研究院(以下簡稱“物探院”)攜手華為,基于OceanStor海量存儲打造的高性能計算平台,開啟了數據找油新時代。
油氣勘探包括野外地震資料采集、地震資料處理及地震資料解釋3個環節。
在野外資料采集環節,主要采用人工地震的方法——人工放炮或使用震源車產生人工地震,通過收集從地下返回的地震波,形成野外觀察數據。
在地震資料的處理環節,需要通過HPC對觀測數據進行信號處理,形成能夠反映地下地質特征的數據體。
在地震資料解釋環節,通過技術人員對數據體進行分析研究,尋找油氣聚集區,並提供井位建議。地震資料解釋完後,地質專家可以根據生成的地質構造圖來確定哪個地方有油、儲量多少、是否值得開采、開采打井位置等信息。
油氣勘探就好比給地球做CT,采集的數據越多、處理得越精細,對地下地質結構的了解就越準確,找到油的可能性就越大。通過不斷優化HPC技術,在海量數據中更高效地發現油藏信息,是物探院及整個行業孜孜以求的目標。
油藏勘探的數據有如下特點︰
首先,地震資料采集的數據量非常大,單體原始數據一般為幾十TB,最大可達PB級。而且處理過程的中間步驟繁多,在數據處理過程中會產生大量的臨時文件和中間結果數據,因此需要為一個作業分配超過原始數據10倍的存儲空間。
其次,地震資料處理的流程多、I/O頻繁。地震資料處理的一個流程有幾十步,其中可能還有反復的迭代,涉及多達400個軟件模塊。作業在運行過程中,這些模塊需要頻繁地交換數據,給內置磁盤和外部存儲帶來了巨大的讀寫壓力。
第三,地震資料處理的計算量大且周期長。不僅涉及串行的作業,也涉及大量計算量大的並行作業,且一次計算任務需要數周不中斷地計算,對可靠性有極高的要求。
近年來,隨著采集精度的逐年提升,傳統數據處理系統的問題開始凸顯︰首先,分散的建設模式形成了多個數據煙囪,數據需要在不同的計算集群間重復拷貝,影響了整體數據的處理效率;其次,資源的隔離導致數據無法充分共享,資源利用率低;此外,I/O處理能力逐漸成為瓶頸,導致CPU等待時長持續攀高,無法充分發揮算力的優勢。
為了解決當前地震資料數據處理過程中存在的問題,物探院選擇了攜手華為,基于OceanStor海量存儲建設了融合共享的地震資料資源池,以打造出更高效、更經濟的數據分析處理平台。
存儲層對于地震資料處理非常關鍵,計算的速度遠遠高于磁盤的讀寫速率。對于物探院來說,整個地震資料處理過程中有35%以上的時間是在做數據的遷移和轉換,因此大帶寬、低時延的存儲層成為提升勘探效率的關鍵。而通過OceanStor海量存儲的大帶寬、低時延存儲能力,大幅降低了I/O等待時間,提高了計算集群CPU的並行處理效率,使CPU的利用率穩定在60%以上,最終縮短了數據分析時間16%以上。
采用基于去中心化架構的OceanStor海量存儲,實現了存儲資源的整合與共享,不僅將機櫃數降低了40%,整體TCO節省30%,並且可以匹配未來5~10年的數據擴展需求。
此外,OceanStor海量存儲采用的N+M彈性EC數據保護模式,允許M台存儲節點同時故障,且可以自動縮列,極大地增強了數據的可靠性,為地震的長周期處理提供了持續性保障。
目前,石油行業正面臨數字化浪潮帶來的大變革,油氣勘探領域是新興科技的試驗場與磨刀石。油氣地震勘探數據具有明顯的大數據特征,既有流式處理,也有非流式處理;既有結構化數據,也有半結構化和非結構化數據,非常適合作為石油行業與新技術融合的先行者。未來,大數據和AI技術將廣泛應用到能源勘探領域,進一步提升勘探的效率,通過數據的踫撞和算法的訓練,來提升對于油層、井位、儲量的預測,將油氣勘探帶入一個新時代。