当前位置:首页 > 站长资讯 > 正文内容

伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用

a811625538个月前 (05-29)站长资讯47

中国存储网消息,近日,伯克利实验室与 meta 合作发布了开放分子 25 (OMol25) 和通用原子模型 (UMA) 供公众使用。Open Molecules 是超过 1 亿个 3D 分子快照的 *** ,其特性是使用密度泛函理论 (DFT) 计算的。DFT 是一种非常强大(且计算成本高昂)的工具,用于模拟原子相互作用的精确细节,使科学家能够预测每个原子上的力和系统的能量,这反过来又决定了决定更大规模特性的分子运动和化学反应,例如电解质在电池中的反应或药物如何与受体结合以预防疾病。

OMol25 使用高性能量子化学程序包 ORCA(版本 6.0.1)构建,包含大型原子系统的模拟,到目前为止,没有大量计算资源的化学家无法获得这些模拟。以前的分子数据集要小得多,模拟只包括 20 到 30 个原子(每次计算)和有限的元素。OMol25 需要 60 亿个核心小时的计算时间来创建 10 倍大的数据集,包括许多不同元素之间的复杂交互。Meta 的基础 AI 研究 (FAIR) 团队利用公司庞大的全球计算资源 *** 来运行数百万次 DFT 模拟,利用世界上一部分人睡着而不浏览 Instagram 和 Facebook 时的空闲带宽。

此外,Meta 还分享了其通用原子模型 (UMA),这是一种基于机器学习数据的工具,用于模拟原子在各种材料和分子中的相互作用。与 Microsoft 的 Aurora 天气模型一样,UMA 也基于现有数据进行训练,这些数据包含超过 300 亿个原子,这些数据是 Meta 在过去五年中发布的所有数据集中包含的,包括那些同时具有分子和材料的数据集。

UMA 为研究人员提供了一个基础化学模型,该模型提供了更准确的预测并更好地了解了分子行为。它还可以作为下游用例和微调应用程序以及开发自己的模型的多功能基础。

美德纽带

使用传统 HPC 结果训练机器学习模型的一个示例,或者以 UMA 为例,机器学习原子间电位 (MLIP) 在数值 DFT 数据上进行训练,可以提供相同口径的预测,但比传统数值 *** 快 10000 倍。在标准计算系统上运行时,模拟大型原子系统的能力总是遥不可及的。MLIP 充当数值 DFT 的替代项,需要与传统 DFT 计算相同的输入:原子位置、原子序数以及自旋和电荷信息(可选)。

MLIP *** 的有用性取决于它可用于训练的数据的数量、质量和广度。OMol25 拥有 1 亿个 3D 分子快照,是用于训练的化学多样性最强的分子数据集,因此增强了 MLIP 模型。如发现的良性循环中所述,现有的传统 HPC(数值)数据用于训练 AI 模型,然后产生更多的“DFT”结果(使用快速 MLIP 模型),这些结果可能会反馈到循环中,以产生更大、更多样化的结果集。

OMol25 和 UMA 相结合,有可能使用基于数据的 AI 模型而不是直接计算来解锁分子和材料研究的新功能。Meta 将此视为开放科学发布的下一步,以加速原子级材料设计。他们还与劳伦斯利弗莫尔国家实验室 (Lawrence Livermore National Laboratory) 等合作伙伴合作,将这些数据集和模型扩展到聚合物等新类别的分子。

“我认为这将彻底改变人们进行化学原子模拟的方式,能够自信地说这真是太酷了,”项目联合负责人、伯克利实验室的化学家和研究科学家塞缪尔·布劳 (Samuel Blau) 说。他在团队中的同事来自六所大学、两家公司和两个国家实验室。

“我们非常高兴能与社区合作构建这个数据集,看看它将带我们去哪里创建新的 AI 模型,”Meta 基础 AI 研究 (FAIR) 实验室的研究总监 Larry Zitnick 说。

OMol25 和 UMA 代表了 AI 在发现的良性循环中加速的另一个例子。基于数据的科学和工程基础模型的持续开发将继续加速发现过程。论文和数据可在此处获得:

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://2345hao.cn/blog/index.php/post/241.html

分享给朋友:

“伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用” 的相关文章

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

  威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。   2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。   但这对投资者而言,可能并不是一件好事。   由于身在传统电力行业,科研步伐又...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

  历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。   作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

  全球最大的丙氨酸生产商华恒生物,即将亮相科创资本市场。   2021年4月7日,以合成生物技术为核心,主要从事氨基酸及其衍生物产品研发、生产、销售的华恒生物,于科创板开启了路演询价环节,距离正式亮相科创板仅剩一步之遥。      图/Wind   目前,华恒生物拥有接近50%的市场占有率...

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

  瑞华泰,一家打破“卡脖子”材料高端PI薄膜的企业,日前正在做科创资本市场的最后冲刺。   2021年4月14日,专注于高性能PI薄膜领域技术自主研发的制造商瑞华泰,已经开启路演及询价环节,距离正式科创板资本市场仅剩最后一步之遥。目前,公司已建立了完整的PI薄膜研发和产业化的核心技术体系,成功进...