芬蘭Kibron專(zhuān)注表面張力儀測量技術(shù),快速精準測量動(dòng)靜態(tài)表面張力

熱線(xiàn):021-66110810,66110819,66110690,13564362870 Email: [email protected]

合作客戶(hù)/

拜耳公司.jpg

拜耳公司

同濟大學(xué)

同濟大學(xué)

聯(lián)合大學(xué).jpg

聯(lián)合大學(xué)

寶潔公司

美國保潔

強生=

美國強生

瑞士羅氏

瑞士羅氏

當前位置首頁(yè) > 新聞中心

基于遺傳算法優(yōu)化提高界面張力的預測速度和精度

來(lái)源:北京科技大學(xué) 瀏覽 98 次 發(fā)布時(shí)間:2024-06-06

準確預測鹽水-氣體界面張力對于優(yōu)化儲層中氣體的分布和運移至關(guān)重要。這有助于減少氣體泄漏風(fēng)險、提高儲存容量,并保障地下氣體儲存的長(cháng)期穩定性,同時(shí)推動(dòng)清潔能源發(fā)展和減少碳排放。然而,目前預測界面張力的方法(如實(shí)驗法)存在耗時(shí)、費力、成本高以及難以表征多組分氣體共同影響的問(wèn)題。此外,在鹽水-多組分氣體(如H2,CH4,CO2等)界面張力方面,缺乏準確的數學(xué)表達式。


近年來(lái),機器學(xué)習算法顯示出了良好的預測潛力。在眾多機器學(xué)習方法中,自動(dòng)機器學(xué)習(AutoML)算法可處理具有多個(gè)因素的復雜預測任務(wù),適用于鹽水-多組分氣體界面張力的預測問(wèn)題。符號回歸(SR)可通過(guò)數據生成相應的數學(xué)表達式,從而為機器學(xué)習模型提供可解釋性。然而,這兩種方法在訓練和發(fā)現過(guò)程中非常耗時(shí),需要一種先進(jìn)的算法來(lái)提高效率。遺傳算法(GA)是一種生物啟發(fā)式算法,具有高效的全局搜索能力,可用于解決優(yōu)化問(wèn)題,從而提高模型開(kāi)發(fā)和應用的效率。


因此,本文提供了一中基于遺傳算法優(yōu)化的自動(dòng)機器學(xué)習和符號回歸模型(GA-AutoML-SR),以準確預測鹽水-氣體界面張力,并生成相應的數學(xué)表達式。

遺傳算法優(yōu)化的界面張力智能預測方法


采集原始數據,并對所述原始數據進(jìn)行歸一化,得到歸一化數據;


初始化自動(dòng)機器學(xué)習模型的候選模型集合,所述候選模型集合包括多個(gè)候選機器學(xué)習模型;


定義遺傳算法的參數;


從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型,作為個(gè)體;


基于所述歸一化數據,對每個(gè)所述個(gè)體的第一預測結果進(jìn)行性能評估,得到每個(gè)所述個(gè)體的選擇概率;

根據所述選擇概率,構建累積序列,并基于所述累積序列,確定被選個(gè)體;


設置所述被選個(gè)體的數量加1,并判斷所述被選個(gè)體的數量是否小于第二數量,若是,跳轉至從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型步驟;若否,對所述被選個(gè)體進(jìn)行變異,得到變異后個(gè)體;


基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體;


第一迭代次數加1,并判斷第一迭代次數是否小于第一迭代閾值,若是,跳轉至從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型步驟;若否,將當前所述后代個(gè)體作為預測模型;


基于所述原始數據,生成多組樣本數據,并對所述樣本數據進(jìn)行歸一化,得到歸一化樣本;


將所述歸一化樣本輸入所述預測模型,得到第二預測結果;


將所述第二預測結果和所述歸一化樣本作為補充數據集,合并所述補充數據集和所述歸一化數據,得到合并數據;


定義表達式算子;


基于符號回歸,根據所述表達式算子和所述合并數據,生成初始模型表達式;


利用遺傳算法搜索所述初始模型表達式的空間,確定候選表達式;


對所述候選表達式的適應度進(jìn)行性能評估,搜索得到最優(yōu)的模型表達式。


可選地,基于所述歸一化數據,對每個(gè)所述個(gè)體的第一預測結果進(jìn)行性能評估,得到每個(gè)所述個(gè)體的選擇概率,具體為:


將所述歸一化數據作為所述個(gè)體的輸入,得到所述個(gè)體的第一預測結果;


采用適應度函數對所述第一預測結果進(jìn)行性能評估,得到對應個(gè)體的適應度值;


可選地,根據所述選擇概率,構建累積序列,并基于所述累積序列,確定被選個(gè)體,具體為:


順序排列所有個(gè)體的選擇概率,形成第一集合;


將第一集合中的當前值與累積序列中對應位置的前一個(gè)值的和,作為累積序列的當前值;


選擇介于0到1之間的一個(gè)值,作為判定值;


將所述累積序列中與所述判定值的距離最近的數值,作為所述被選個(gè)體。


可選地,對所述被選個(gè)體進(jìn)行變異,得到變異后個(gè)體,具體為:改變所述個(gè)體的結構或參數。


可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:


分別從各個(gè)變異后個(gè)體中提取特征進(jìn)行組合,生成新的特征集,作為后代個(gè)體的特征表示,得到所述后代個(gè)體。


可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:


將各個(gè)變異后個(gè)體的參數進(jìn)行組合,得到新的參數,對所述新的參數進(jìn)行訓練,得到所述后代個(gè)體。


可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:


將一個(gè)變異后個(gè)體的分部,結合到另一個(gè)不同的變異后個(gè)體的決策邊界中,創(chuàng )建具有新結構個(gè)體,作為所述后代個(gè)體。


可選地,對所述候選表達式的適應度進(jìn)行性能評估,搜索得到最優(yōu)的模型表達式,具體為:


基于所述合并數據,對每個(gè)所述候選表達式的第三預測結果進(jìn)行性能評估,確定被選表達式集合;


對所述被選表達式集合中的所有被選表達式進(jìn)行變異,生成變異表達式;


基于所述變異表達式,進(jìn)行交叉,生成后代表達式;


最終得到具體模型表達式為:

基于遺傳算法優(yōu)化的自動(dòng)機器學(xué)習和符號回歸模型融合遺傳算法、自動(dòng)機器學(xué)習和符號回歸方法,進(jìn)行界面張力的預測,相較于傳統實(shí)驗測量方法,提高了界面張力的預測速度和精度,同時(shí)通過(guò)數學(xué)表達式提高了數據驅動(dòng)模型的可解釋性。