Meta聯合發布OMol25數據集與UMA模型,AI助力全球化學創新
5 月 16 日消息,Meta AI 公司于 5 月 14 日發布博文,發布了全新化學數據集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。
OMol25 數據集:化學研究新利器
OMol25 是迄今為止規模最大的分子模擬數據集,由 Meta 與美國能源部勞倫斯伯克利國家實驗室(Berkeley Lab)聯合打造,該數據集包含超過 1 億個 3D 分子快照,基于密度泛函理論(DFT)計算而成。
DFT 是一種強大的工具,能精確模擬原子間相互作用,幫助科學家預測每個原子的受力及系統能量,從而揭示分子運動和化學反應的規律。
傳統的 DFT 計算需要巨大的計算資源,隨著分子規模增大,計算需求呈指數級增長,使用最先進的計算設備,也難以模擬現實世界中復雜的分子系統。
基于 DFT 數據訓練的機器學習原子間勢(MLIPs)能以快 1 萬倍的速度提供同等精度的預測,讓科學家能在普通計算系統上模擬大型原子系統。OMol25 作為化學多樣性最高的分子數據集,為訓練 MLIPs 提供了前所未有的數據支持。
UMA 模型:通用預測工具問世
Meta 公司還推出 UMA,是一個基于過去五年 Meta FAIR 公開數據集構建的通用原子間勢能模型群,覆蓋分子、材料、觸媒等化學領域,利用超過 50 億個原子組成的 3D 結構作為訓練數據。
UMA 分為 UMA-small 和 UMA-medium 兩種規模,采用“Mixture of Linear Experts”創新架構,其中 UMA-medium 模型擁有 14 億參數,但單結構計算僅用約 5000 萬參數,加快推理速度。
UMA 模型無需微調,僅通過預訓練即可應對多種化學任務,性能媲美甚至超越現有專用模型。研究表明,UMA 在分子特性預測、材料設計、觸媒開發、能量存儲及半導體制造等領域表現出色,高精度與快速計算能力為科學研究和工業應用開辟了新路徑,推動跨領域技術革新。
【來源: IT之家 】