合作客戶(hù)/
拜耳公司 |
同濟大學(xué) |
聯(lián)合大學(xué) |
美國保潔 |
美國強生 |
瑞士羅氏 |
相關(guān)新聞Info
推薦新聞Info
-
> 界面張力儀測量方法與標準
> 探索界面張力梯度驅動(dòng)對流轉捩規律
> ?液層模型:微重力條件下界面張力梯度驅動(dòng)對流基本流動(dòng)規律【研究成果】
> 溫度對延展型表面活性劑界面張力的影響規律
> 超微量天平測定粗鉍中金、銀含量,精密度高、準確度好
> 大氣氣溶膠表面張力測量新方法
> LB膜分析儀應用:不同初始表面壓力條件對VhPLD的磷脂吸附親和力影響(二)
> LB膜分析儀應用:不同初始表面壓力條件對VhPLD的磷脂吸附親和力影響(一)
> 各類(lèi)塑料薄膜的表面張力特定范圍一覽
> 石莼、菠菜類(lèi)囊體膜LB膜的制備及在納米ZnO上的組裝和光電性質(zhì)
基于遺傳算法優(yōu)化提高界面張力的預測速度和精度
來(lái)源:北京科技大學(xué) 瀏覽 98 次 發(fā)布時(shí)間:2024-06-06
準確預測鹽水-氣體界面張力對于優(yōu)化儲層中氣體的分布和運移至關(guān)重要。這有助于減少氣體泄漏風(fēng)險、提高儲存容量,并保障地下氣體儲存的長(cháng)期穩定性,同時(shí)推動(dòng)清潔能源發(fā)展和減少碳排放。然而,目前預測界面張力的方法(如實(shí)驗法)存在耗時(shí)、費力、成本高以及難以表征多組分氣體共同影響的問(wèn)題。此外,在鹽水-多組分氣體(如H2,CH4,CO2等)界面張力方面,缺乏準確的數學(xué)表達式。
近年來(lái),機器學(xué)習算法顯示出了良好的預測潛力。在眾多機器學(xué)習方法中,自動(dòng)機器學(xué)習(AutoML)算法可處理具有多個(gè)因素的復雜預測任務(wù),適用于鹽水-多組分氣體界面張力的預測問(wèn)題。符號回歸(SR)可通過(guò)數據生成相應的數學(xué)表達式,從而為機器學(xué)習模型提供可解釋性。然而,這兩種方法在訓練和發(fā)現過(guò)程中非常耗時(shí),需要一種先進(jìn)的算法來(lái)提高效率。遺傳算法(GA)是一種生物啟發(fā)式算法,具有高效的全局搜索能力,可用于解決優(yōu)化問(wèn)題,從而提高模型開(kāi)發(fā)和應用的效率。
因此,本文提供了一中基于遺傳算法優(yōu)化的自動(dòng)機器學(xué)習和符號回歸模型(GA-AutoML-SR),以準確預測鹽水-氣體界面張力,并生成相應的數學(xué)表達式。
遺傳算法優(yōu)化的界面張力智能預測方法
采集原始數據,并對所述原始數據進(jìn)行歸一化,得到歸一化數據;
初始化自動(dòng)機器學(xué)習模型的候選模型集合,所述候選模型集合包括多個(gè)候選機器學(xué)習模型;
定義遺傳算法的參數;
從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型,作為個(gè)體;
基于所述歸一化數據,對每個(gè)所述個(gè)體的第一預測結果進(jìn)行性能評估,得到每個(gè)所述個(gè)體的選擇概率;
根據所述選擇概率,構建累積序列,并基于所述累積序列,確定被選個(gè)體;
設置所述被選個(gè)體的數量加1,并判斷所述被選個(gè)體的數量是否小于第二數量,若是,跳轉至從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型步驟;若否,對所述被選個(gè)體進(jìn)行變異,得到變異后個(gè)體;
基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體;
第一迭代次數加1,并判斷第一迭代次數是否小于第一迭代閾值,若是,跳轉至從所述候選模型集合中選擇第一數量的候選機器學(xué)習模型步驟;若否,將當前所述后代個(gè)體作為預測模型;
基于所述原始數據,生成多組樣本數據,并對所述樣本數據進(jìn)行歸一化,得到歸一化樣本;
將所述歸一化樣本輸入所述預測模型,得到第二預測結果;
將所述第二預測結果和所述歸一化樣本作為補充數據集,合并所述補充數據集和所述歸一化數據,得到合并數據;
定義表達式算子;
基于符號回歸,根據所述表達式算子和所述合并數據,生成初始模型表達式;
利用遺傳算法搜索所述初始模型表達式的空間,確定候選表達式;
對所述候選表達式的適應度進(jìn)行性能評估,搜索得到最優(yōu)的模型表達式。
可選地,基于所述歸一化數據,對每個(gè)所述個(gè)體的第一預測結果進(jìn)行性能評估,得到每個(gè)所述個(gè)體的選擇概率,具體為:
將所述歸一化數據作為所述個(gè)體的輸入,得到所述個(gè)體的第一預測結果;
采用適應度函數對所述第一預測結果進(jìn)行性能評估,得到對應個(gè)體的適應度值;
可選地,根據所述選擇概率,構建累積序列,并基于所述累積序列,確定被選個(gè)體,具體為:
順序排列所有個(gè)體的選擇概率,形成第一集合;
將第一集合中的當前值與累積序列中對應位置的前一個(gè)值的和,作為累積序列的當前值;
選擇介于0到1之間的一個(gè)值,作為判定值;
將所述累積序列中與所述判定值的距離最近的數值,作為所述被選個(gè)體。
可選地,對所述被選個(gè)體進(jìn)行變異,得到變異后個(gè)體,具體為:改變所述個(gè)體的結構或參數。
可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:
分別從各個(gè)變異后個(gè)體中提取特征進(jìn)行組合,生成新的特征集,作為后代個(gè)體的特征表示,得到所述后代個(gè)體。
可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:
將各個(gè)變異后個(gè)體的參數進(jìn)行組合,得到新的參數,對所述新的參數進(jìn)行訓練,得到所述后代個(gè)體。
可選地,基于所述變異后個(gè)體,進(jìn)行個(gè)體間交叉,生成后代個(gè)體,具體為:
將一個(gè)變異后個(gè)體的分部,結合到另一個(gè)不同的變異后個(gè)體的決策邊界中,創(chuàng )建具有新結構個(gè)體,作為所述后代個(gè)體。
可選地,對所述候選表達式的適應度進(jìn)行性能評估,搜索得到最優(yōu)的模型表達式,具體為:
基于所述合并數據,對每個(gè)所述候選表達式的第三預測結果進(jìn)行性能評估,確定被選表達式集合;
對所述被選表達式集合中的所有被選表達式進(jìn)行變異,生成變異表達式;
基于所述變異表達式,進(jìn)行交叉,生成后代表達式;
最終得到具體模型表達式為:
基于遺傳算法優(yōu)化的自動(dòng)機器學(xué)習和符號回歸模型融合遺傳算法、自動(dòng)機器學(xué)習和符號回歸方法,進(jìn)行界面張力的預測,相較于傳統實(shí)驗測量方法,提高了界面張力的預測速度和精度,同時(shí)通過(guò)數學(xué)表達式提高了數據驅動(dòng)模型的可解釋性。