使用多模态机器学习将金属有机框架合成与应用程序联系起来
收稿日期: 2024-11-25 录用日期:2025-06-3 在线发布日期:2025-07-01 (D) 检查更新
抽象
萨尔塔伊·塔克里姆·汗©和赛义德·穆罕默德·穆萨维 ©
每年,研究人员都会创造数十万种新材料,每种材料都具有独特的结构和特性。例如,仅在过去一年就报告了 5000 多种新的金属有机框架 (MOF)。虽然这些材料通常是为特定应用而合成的,但它们可能在完全不同的领域具有潜在用途。然而,将这些新材料与其最佳应用联系起来仍然是一个重大挑战。在这项研究中,我们展示了一种多模式方法,该方法使用合成 MOF 后立即获得的信息,特别是其粉末 X 射线衍射图 (PXRD) 和合成中使用的化学物质,来预测其潜在性质和用途。通过在 MOF 数据库可访问的晶体结构上对该模型进行自我监督预训练,我们的模型实现了对各种性质的准确预测,包括孔结构、化学依赖性和量子化学性质,即使数据可用。我们进一步评估了该方法在存在实验测量缺陷时的稳健性。利用这种方法,我们为 MOF 创建了从综合到应用的映射,从而深入了解不同应用的最佳材料类别。最后,通过使用推荐系统来增强该模型,我们为与最初报告的应用程序不同的应用程序确定了有前途的 MOF。我们以开源代码和 Web 应用程序的形式提供此工具,以加速新材料与其潜在工业应用的匹配。
通过选择金属和有机连接剂,我们有可能合成数百万种可能的金属有机框架 (MOF)
1
1
^(1) { }^{1} .鉴于这种高化学可调性,MOF 可以针对各种应用进行定制。在过去的二十年里,MOF 已被广泛探索用于从催化
2
2
^(2) { }^{2} 和气体分离
3
3
^(3) { }^{3} 至 传感和电子
4
4
^(4) { }^{4} 和超过 15,000 个多孔
5
,
6
5
,
6
^(5,6) { }^{5,6} 和
120
,
000
7
120
,
000
7
120,000^(7) 120,000^{7} 已经合成了无孔 MOF。在化学合成中集成自动化和人工智能 (AI)
8
−
10
8
−
10
^(8-10) { }^{8-10} ,我们可以预期新 MOF 的发现率将进一步增长。
尽管取得了重大进展,但将新合成的材料与其最佳应用联系起来仍然是一个挑战
11
11
^(11) { }^{11} .确定材料的性能需要大量的 表征和测试,通常需要专业知识、资源和基础设施,而合成材料的研究人员可能无法获得这些资源。这阻碍了新材料的全部潜力的实现。有几个材料示例被发现对最初预期应用以外的应用最有效。Al-PMOF,最初因其光催化特性而合成
12
12
^(12) { }^{12} ,多年后才发现在分离方面非常有效
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 来自湿烟气
13
13
^(13) { }^{13} .同样,SBMOF-1 最初是为
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 捕获
14
14
^(14) { }^{14} ,事实证明,它在区分氙气和氪气方面非常出色。在初始研究发表数年后,高通量计算筛选和机器学习研究实现了这些非凡的重新发现
11
,
13
,
15
−
17
11
,
13
,
15
−
17
^(11,13,15-17) { }^{11,13,15-17} .
图 1 |自监督多模态模型的工作流程。该模型将前驱体串和粉末 X 射线衍射 (PXRD) 光谱作为输入,分别通过变压器和卷积神经网络 (CNN) 嵌入它们。这些嵌入被连接起来并通过回归头进行微调。在此之前,通过晶体图卷积神经网络 (CGCNN) 使用未标记的晶体结构对模型进行预训练
25
25
^(25) { }^{25} .CGCNN 和我们的模型生成嵌入 (
Z
A
,
Z
B
Z
A
,
Z
B
Z_(A),Z_(B) \mathrm{Z}_{A}, \mathrm{Z}_{B} ),用于构造互相关矩阵。Barlow-Twin 的损失
(
(:} \left(\right. 损失
B
T
)
B
T
{:_(BT)) \left._{B T}\right) 最小化互相关矩阵和单位矩阵之间的差异
23
,
52
,
53
23
,
52
,
53
^(23,52,53) { }^{23,52,53} .对齐表示。然后,根据标记数据对预训练模型进行微调,以进行性能预测和金属有机框架 (MOF) 应用推荐。使用 iRASPA 可视化晶体结构
55
55
^(55) { }^{55} .
然而,此类方法需要精确的晶体结构信息,通常采用计算就绪的格式,这很难获得,并且通常不能在合成新的 MOF 后立即获得
5
,
18
,
19
5
,
18
,
19
^(5,18,19) { }^{5,18,19} .因此,开发仅使用合成时可用数据的方法可以大大加快材料与潜在应用的匹配。
在这项工作中,我们提出了一个多模态模型,该模型利用了 MOF 合成点容易获得的数据,特别是以光谱表示的粉末 X 射线衍射 (PXRD) 图谱,以及编码为文本字符串的化学前驱体(金属和接头)。为了提高模型的性能(尤其是在小型数据集上),我们利用数据库中现有的 MOF 结构(以晶体图表示),使用自我监督学习框架对模型进行预训练。这种预训练使模型能够在低数据范围内实现一系列化学、几何和量子化学性质预测的高精度。我们进一步评估了模型在实验结构或 PXRD 与完美晶体偏差条件下的稳健性。使用这种方法,我们创建了一个地图,将 MOF 综合与潜在应用联系起来,提供了一个框架,以最小的计算成本和复杂性为新合成的材料推荐最佳应用。最后,通过反向时间旅行研究,我们证明我们的方法可以识别适合于与创造者最初打算完全不同的应用的材料。
结果
多模态模型开发
要开发 MOF 特性的预测模型,必须对材料的化学性质和孔隙几何形状进行编码。虽然这些信息可以从 MOF 的晶体结构中提取,但在合成阶段通常无法获得晶体结构。MOF 的合成涉及选择前驱体,即金属和有机连接剂,并找到材料形成的最佳合成条件。用于确认 MOF 合成成功的主要表征技术是粉末 X 射线衍射 (PXRD) 图样。PXRD 图案提供了晶体中原子排列的抽象表示,包含有关材料全局几何结构的信息。以前的研究表明,PXRD 在捕获几何信息以进行与晶体系统 分类、晶格参数和原子位置相关的机器学习预测方面的有效性
20
−
22
20
−
22
^(20-22) { }^{20-22} .因此,在这项工作中,我们引入了一种多模态机器学习模型,该模型仅利用前体和 PXRD 数据作为 MOF 综合后立即可用的输入信息(图 1)。前驱体为材料的化学性质提供了有价值的见解,PXRD 对此进行了补充,提供了有关整体结构的信息。
MOF 的化学前体可以表示为字符串。在这项研究中,我们利用简化的分子输入行输入系统 (SMILES) 来表示有机接头,并附加其所用金属的类型。我们使用 transformer 来嵌入这个字符串,因为以前的研究表明 transformer 架构在属性预测中的有效性,特别是使用
MOF
23
,
24
MOF
23
,
24
MOF^(23,24) \mathrm{MOF}^{23,24} .此外,我们利用卷积神经网络 (CNN) 嵌入 PXRD 模式,该模式可以表示为一维频谱(详见“方法”部分)。
虽然前体提供了金属和有机连接体的化学信息,但它们无法捕捉金属-有机配位环境,而这对于预测量子化学和依赖化学的性质可能是必要的。为了让模型了解这些配位环境,我们实施了一种自监督预训练方法,利用现有的 MOF 晶体结构,无需任何标注数据。我们的自监督预训练结合了晶体图卷积神经网络(CGCNN)
25
25
^(25) { }^{25} 表示与我们的模型。CGCNN 能够对局部化学环境进行有效的嵌入,并且在预测 MOF 的量子力学性质方面取得了成功
18
,
19
18
,
19
^(18,19) { }^{18,19} 。通过使用 CGCNN 对模型进行预训练,嵌入空间学习到了与局部环境中的电负性和共价半径等性质相关的有意义表示。
最后,我们利用预训练模型,它只接受 PXRD 和前驱体,并使用标记数据对其进行微调以预测所需的属性。在预测了材料特性后,我们使用选择标准将其推荐给各种应用。方法开发的详细信息可在 SI 和方法部分找到。
我们首先证明,我们的多模态模型有效地预测了各种 MOF 特性,为将 MOF 综合与应用程序联系起来奠定了基础。为了进行评估,我们将
图 2 |对各种属性预测任务的性能进行建模。我们的模型(粉末X射线衍射(PXRD)和前驱体)与基于描述符的机器学习(ML)模型相比的回归结果。
26
26
^(26) { }^{26} ,一种接受 MOFid 的基于 transformer 的模型 (MOFormer)
23
,
24
23
,
24
^(23,24) { }^{23,24} 和晶体图卷积神经网络(CGCNN,接受晶体的 3D 结构)
25
25
^(25) { }^{25} 跨各种几何 (
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} 可交付容量 - DC、密度、HP 时的 Xe 吸收 - 高压、
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} 在 HP 处的吸收率,可利用表面积 - ASA),化学依赖性 (
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 低压吸收 - LP)和量子化学(带隙)性质。b 消融研究展示了多模式对各种特性的影响。结果以平均 Spearman 秩相关系数 (SRCC) 报告,误差线显示三个随机拆分的标准差。此处显示的结果适用于 CoRE-2019 的结构
5
,
26
5
,
26
^(5,26) { }^{5,26} (
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} LP 的吸收,
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} HP、ASA、密度、
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} DC)、QMOF
18
,
19
18
,
19
^(18,19) { }^{18,19} (带隙)和
hMOF
26
,
29
hMOF
26
,
29
hMOF^(26,29) \mathrm{hMOF}^{26,29}
我们的多模态模型在三类属性中表现出强大的性能。图 2 通过斯皮尔曼等级相关系数(SRCC)量化了模型在材料排序方面的有效性,并通过平均绝对误差(MAE)准确预测了其属性。值得注意的是,其准确性与先前研究中利用晶体结构数据的机器学习模型相当。具体来说,我们将模型与三种最先进的机器学习模型进行了基准测试:1)基于描述符的机器学习,使用几何和化学描述符(例如,表面积、孔体积和修正自相关(RACs);详见补充信息),2)晶体图卷积神经网络(CGCNN),使用晶体图表示材料,3)MOFormer,一种以 MOF 的文本表示(MOFid)作为输入的模型。
虽然 MOFormer 使用字符串表示法,但这种编码需要晶体结构信息(例如,MOF 拓扑结构和金属簇细节),因此依赖于结构处理。值得注意的是,我们的模型在所有属性类型上表现与基于晶体结构的模型相当。特别是在几何属性方面,如可达表面积(ASA),我们的模型优于 CGCNN 和 MOFormer。基于描述符的机器学习模型在表面积和密度方面取得了完美的分数,因为这些属性直接作为输入提供,因此我们在图 2 中未包含它们。对于依赖几何的属性,如
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} 和 Xe 的高压吸附,我们的模型的准确性与基于描述符的方法相当。最后,对于依赖化学和量子化学的属性,我们的模型表现与基于晶体结构的模型相当(图 2)。
在我们处理小标记数据集的情况下,自我监督的预训练工作流可以提高模型性能,其中预训练利用大量未标记的数据来学习可在有限的标记样本上微调的可泛化表示。在我们的研究中,我们针对大型 MOF 数据库中的晶体结构使用 PXRD 和前驱体对多模态模型进行预训练。我们在 SI 中表明,这种方法提高了模型在小型数据集(如 ARABG)上的性能,并使该方法适用于大量 数据不可用的情况。但是,应该注意的是,当预训练模型在大型 MOF 数据库(如 CoRE-MOF、BW20K、QMOF 和 hMOF)上进行微调时,模型性能的改进可以忽略不计。
将我们的多模态模型与仅依赖化学前体的模型以及仅依赖 PXRD 的模型进行性能比较,具有重要的启示意义。该消融研究的结果显示在图 2 的右侧面板中。结果表明,仅接受化学前体的模型无法充分捕捉 MOF 的整体结构,在依赖几何的属性和纯几何属性上得分特别低。另一方面,仅接受 PXRD 的模型能够很好地捕捉 MOF 的整体结构,但无法捕捉局部环境,在依赖化学的属性和量子化学属性(如 LP 处的
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 吸附量和带隙)上得分较低。这证实了 PXRD 对于提供 MOF 几何结构的关键信息至关重要,而前体有助于捕捉局部环境的信息。仅利用 MOF 合成时可获得的信息,在所有三类属性上实现高准确度,凸显了多模态在属性预测任务中的重要性。 没有单一的模态能够完全涵盖 MOFs 中化学和几何的复杂性;因此,整合 PXRD 和前体字符串有助于准确预测材料性质。
为了进一步评估模型的泛化能力,我们考察了其在不同晶体系统中的表现。对我们数据集多样性的分析表明,模型性能在所有晶体系统中并不均匀,且取决于用于训练的数据库以及 MOF 的具体晶体系统。此前已有研究报告了晶体系统多样性对模型泛化能力影响的类似观察
26
26
^(26) { }^{26} 。我们发现,在更复杂的晶体系统(如三斜晶系)上训练,能够更好地泛化到对称性较低的情况。相反,在高度对称的系统(如立方晶系)上训练,则导致泛化能力较差。这表明晶体系统的多样性应成为数据库开发、模型评估以及机器学习模型训练时的一个考虑因素。关于此分析的更多细节可见补充信息。
鉴于我们的模型在属性预测方面的高准确性,我们可以扩展其功能以构建一个将 MOF 综合与应用程序联系起来的推荐系统。我们注意到,虽然基于描述符的模型在属性预测方面提供了略好的性能,但它们需要以计算就绪的形式(例如,溶剂去除和处理部分占用)预处理的晶体结构,这可能具有挑战性。相比之下,我们的方法利用了 PXRD 和前驱体信息,这些信息在合成时很容易获得,使我们能够为依赖于化学和几何的属性和应用提供准确的建议,而无需进行大量的结构预处理。
稳健性评估
因此,我们将评估重点放在一个依赖几何的性质上:预测高压下甲烷储存应用中的甲烷吸附量
26
26
^(26) { }^{26} .
MOF 的实验晶体结构通常缺少氢原子,且可能包含溶剂分子、部分占据位点或无序原子。为了将这些结构用于计算化学计算和性质评估,需要进行一定的调整。例如,为了在 CoRE-2019 数据集中创建适用于气体吸附计算的格式,所有溶剂均被移除。在用于量子计算的 QMOF 数据库中,添加了氢原子,并去除了未结合的溶剂。因此,从这些修改后的结构计算得到的 PXRD 图谱与 CSD 中提供的有所不同。图 3 展示了一个对应图,说明使用从 CoRE-2019 和 CSD 计算的 PXRD 时模型预测的差异,重点展示了三种情况的特定 MOF:缺失氢原子以及存在结合/未结合溶剂。我们观察到,缺失氢原子不会影响 PXRD,且模型对这些变化非常稳健。 这是因为 PXRD 的散射能力与原子中电子的数量成正比,而氢(
Z
=
1
Z
=
1
Z=1 Z=1 )原子在散射和结构因子中起的作用极小(详见方法部分)。此外,虽然该模型在处理有界溶剂方面通常表现出稳健性,但计算准备数据与 CSD 数据的预测结果之间可能存在差异。例如,MOF LELROL 显著偏离了平衡
32
32
^(32) { }^{32} 。然而,我们观察到整体预测表现稳健,因为 MOF 在
CH
4
CH
4
CH_(4) \mathrm{CH}_{4} 吸附量方面的排名得到了良好捕捉(SRCC 为 0.73),且相对误差低于
13
%
13
%
13% 13 \% 。这表明该模型在晶体结构变化存在的情况下依然表现出稳健的性能。
到目前为止,该模型的性能一直使用仿真的 PXRD 进行评估。在实践中,在评估 MOF 粉末的结晶度时,实验 PXRD 可能包含来自仪器的噪声、温度变化和结晶度差的低质量样品。为了评估我们的模型对这些缺陷的鲁棒性,我们比较了使用模拟和实验 PXRD 时的甲烷储存建议。该评估对五种材料进行,其实验和模拟 PXRD 如图 4 所示。一般来说,除了一种情况外,我们观察到模拟和实验 PXRD 之间的一致建议。在这种不一致的情况下,模拟和实验 PXRD 之间的差异很明显;与模拟的 PXRD 相比,实验 PXRD 表现出明显的噪声和多个显著的峰。补充信息中可以找到其他比较,以及不同噪声级别的模型评估。总体而言,我们的评估表明,在 PXRD 中存在噪声和缺陷的情况下,该模型在很大程度上保持了稳健性。这使实验人员能够使用他们测得的 PXRD 来预测它们的特性。
应用程序推荐图
我们多模态模型在预测 MOF 各种性能方面的高性能,实现了其合成与潜在应用之间的直接联系。我们构建了一个推荐系统,根据预测的材料性能,将 MOF 分类为特定应用的有前景候选材料。本研究探讨的应用包括气体存储(如甲烷、氙气和氢气)和碳捕获,包括直接空气捕获(DAC)。这些应用的指标来源于文献中报道的工业案例(详见补充信息)
33
−
37
33
−
37
^(33-37) { }^{33-37} 。我们的结果显示能够准确区分这些应用的有前景 MOF(详见补充信息)。为了减少假阴性——即遗漏有前景候选材料的情况,我们将模型配置为在推荐时更为乐观。
对于大规模应用预测,例如评估 CoRE-2019、hMOF 和 QMOF 数据库中的所有材料,它是
图 3 |评估模型对晶体结构缺陷的稳健性。(a) 中的奇偶图显示了从可计算的晶体结构 (CoRE-2019) 计算的粉末 X 射线衍射 (PXRD) 图样时模型输出之间的比较
5
5
^(5) { }^{5} 以及来自剑桥结构数据库 (CSD) 的实验晶体结构
7
7
^(7) { }^{7} .奇偶校验图显示了一组选定的金属有机框架 (MOF) 示例,这些框架具有氢原子(蓝色)、存在有界溶剂的 MOF(绿色)和具有无界溶剂的 MOF(黄色),其余 MOF 显示为灰色,因为它们不是突出显示的示例。在右侧面板上,我们展示了这三个 类别中的 MOF 示例,左列是 CoRE-2019,右列是 CSD 结构。b 展示 MOF(CSD 参考代码:WAHMEY)
56
56
^(56) { }^{56} (金属类型:Fe、Au、linker:
C
6
H
4
N
2
C
6
H
4
N
2
C_(6)H_(4)N_(2) \mathrm{C}_{6} \mathrm{H}_{4} \mathrm{~N}_{2} ) 缺失氢原子,
c
c
c \mathbf{c} 展示 MOF(CSD 参考代码:NALYEG)
57
57
^(57) { }^{57} (金属类型:U,连接者:
C
9
H
6
O
6
C
9
H
6
O
6
C_(9)H_(6)O_(6) \mathrm{C}_{9} \mathrm{H}_{6} \mathrm{O}_{6} ) 与无界溶剂,其形式为
C
3
H
7
NO
C
3
H
7
NO
C_(3)H_(7)NO \mathrm{C}_{3} \mathrm{H}_{7} \mathrm{NO} ,
d
d
d \mathbf{d} 展示 MOF(CSD 参考代码:VEFLUP)
58
58
^(58) { }^{58} (金属类型:Co,连接子:
C
12
H
8
O
4
C
12
H
8
O
4
C_(12)H_(8)O_(4) \mathrm{C}_{12} \mathrm{H}_{8} \mathrm{O}_{4} ) 以
C
3
H
7
NO
C
3
H
7
NO
C_(3)H_(7)NO \mathrm{C}_{3} \mathrm{H}_{7} \mathrm{NO} .使用 VESTA 可视化晶体结构
59
59
^(59) { }^{59}
图 5 所示的地图提供了对 MOF 在各种应用中的可设计性的见解。特定应用领域的地区之间重叠表明,多功能 MOF 的潜力可以用于多种用途,同时阐明与设计这些 MOF 最相关的特性。例如,许多被标记为有前途用于甲烷储存的 MOF 也被推荐用于氙和氢储存,这表明材料和应用之间的关系。此外,该图还表明,对于特定应用,可能存在性能最佳的不同 MOF 系列。例如,有几种不同的团簇在碳捕获方面显示出有希望的性能,平衡了孔结构与特定的化学相互作用。
讨论
我们的研究为将新发现的材料与其潜在应用相匹配提供了一条途径。这是通过开发一个多模态模型来实现的,该模型只需要 MOF 合成时可用的数据,即 PXRD 和化学前驱体,从而能够准确预测 MOF 的各种几何依赖性、化学依赖性和量子化学性质。如此广泛的特性的这种显著准确性强调了在材料特性预测中利用多模态的重要性,因为不同的模态增强了模型预测更广泛特性的能力,这是单一模态无法实现的。
我们方法的一个实际动机是识别新发现的 MOF 的应用,这些应用可能与设计时的预期用途有显著不同。为了展示这一能力,我们进行了一个时间旅行实验,使用 2017 年前存入 CSD 数据库的 CoRE-2019 条目训练我们的模型,测试集则包含 2017 年后存入的条目。这种方法评估了我们的模型是否能够为未来合成的 MOF 推荐应用。我们的推荐系统识别出 18 个有前景的碳捕获候选材料,基于分子模拟数据,其准确率高达 18 个中 16 个。值得注意的是,这些材料中有 15 个最初设计用于除
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 捕获之外的其他应用。图 6 展示了其中一些 MOF 及其基于相应文献的预期合成应用。其余 MOF 的结果请参见补充信息。
鉴于我们的模型能够仅基于 PXRD 图谱和前驱体推荐应用,实验人员可以利用我们的网页应用在进行结晶度评估以获取 PXRD 数据后立即获得推荐结果
39
39
^(39) { }^{39} 。通过整合来自化学过程建模和生命周期评估的先进关键绩效指标
40
40
^(40) { }^{40} 以及机器人平台
41
41
^(41) { }^{41} ,该方法将加速可持续应用材料的发现。
连接体(L)用于:
CAU
−
28
CAU
−
28
CAU-28 \mathrm{CAU}-28 (
M
:
Zr
,
L
:
C
6
H
4
O
5
M
:
Zr
,
L
:
C
6
H
4
O
5
M:Zr,L:C_(6)H_(4)O_(5) \mathrm{M}: \mathrm{Zr}, \mathrm{L}: \mathrm{C}_{6} \mathrm{H}_{4} \mathrm{O}_{5} ),
Yb
−
UiO
−
66
Yb
−
UiO
−
66
Yb-UiO-66 \mathrm{Yb}-\mathrm{UiO}-66 (
M
:
Yb
,
L
:
C
8
H
6
O
4
M
:
Yb
,
L
:
C
8
H
6
O
4
M:Yb,L:C_(8)H_(6)O_(4) \mathrm{M}: \mathrm{Yb}, \mathrm{L}: \mathrm{C}_{8} \mathrm{H}_{6} \mathrm{O}_{4} ),Zn -(Ade)(TBAPy)(M:Zn,L:
C
5
H
5
N
5
,
C
44
H
26
O
8
C
5
H
5
N
5
,
C
44
H
26
O
8
C_(5)H_(5)N_(5),C_(44)H_(26)O_(8) \mathrm{C}_{5} \mathrm{H}_{5} \mathrm{~N}_{5}, \mathrm{C}_{44} \mathrm{H}_{26} \mathrm{O}_{8} ),
Zn
2
Zn
2
Zn_(2) \mathrm{Zn}_{2} -(TBAPy)(M:Zn,L:
C
44
H
26
O
8
C
44
H
26
O
8
C_(44)H_(26)O_(8) \mathrm{C}_{44} \mathrm{H}_{26} \mathrm{O}_{8} )配位水分子且具有扭曲的结构框架
60
−
62
60
−
62
^(60-62) { }^{60-62} 。晶体结构使用 VESTA 可视化
59
59
^(59) { }^{59} ,原子颜色编码为:N(蓝色)、O(红色)、H(白色)、C(棕色)、Zr(绿色)、Yb(浅蓝色)、Zn(灰色)。
和 hMOF 数据库
5
,
18
,
19
,
26
,
29
5
,
18
,
19
,
26
,
29
^(5,18,19,26,29) { }^{5,18,19,26,29} 。右侧面板显示相同嵌入空间,按特定理化性质着色:晶体密度(右上)、孔径(右中)和保罗电负性(右下)。源数据作为源数据文件提供。
方法
利用来自各数据库(CoRE2019、BW2OK、ARABG、QMOF、hMOF)的晶体结构
5
,
18
,
19
,
28
,
29
5
,
18
,
19
,
28
,
29
^(5,18,19,28,29) { }^{5,18,19,28,29}
42
42
^(42) { }^{42}
42
,
43
42
,
43
^(42,43) { }^{42,43}
当收集 PXRD 数据时,通常会有不同数量的数据点。进行机器学习时,输入数据需要长度一致。为了构建一个一维强度数组,可以通过插值来填补缺失的数据点。需要注意的是,实验 PXRD 通常由于仪器等各种原因,具有宽而平滑的峰。在尝试模拟这种行为时,对一维数组进行了高斯变换。一维 PXRD 向量的总期望大小为 9000,期望的峰宽由
σ
=
0.1
σ
=
0.1
sigma=0.1 \sigma=0.1 控制。有关 PXRD 图谱预处理和变换的配置、参数及算法的详细信息,请参见补充信息。
金属节点和有机连接体的 SMILES 之前已在多个数据库中给出
5
,
18
,
19
,
28
,
29
5
,
18
,
19
,
28
,
29
^(5,18,19,28,29) { }^{5,18,19,28,29} 。化学前体的构造格式为:[金属类型].[有机连接体]。该格式被输入并由我们模型的 transformer 通道进行分词处理。
模型构建
借鉴 MOFormer 的灵感,构建了一个基于 Transformer 的编码器和分词器。前体被输入到 SMILES 分词器中(因为从前体中输入的唯一部分是无机和有机构建块),在前体字符串的开头和结尾分别添加了[CLS]和[SEP]标签。由于前体字符串长度不一,每个字符串都用[PAD]进行填充,使其固定为 512 个字符长度。对标记进行位置编码,以提供每个标记的绝对和相对位置信息,嵌入维度为 512。Transformer 基于自注意力机制构建。编码器层由多头注意力层组成,每个编码器包含注意力层,随后是多层感知机(MLP)层。在每个注意力层中,输入序列被分解为三个向量:查询(Q)、键(K)和值(V),对应的可学习权重分别是。 注意力输出定义为:
A
=
softmax
(
Q
K
⊤
d
k
)
V
A
=
softmax
Q
K
⊤
d
k
V
A=softmax((QK^(TT))/(sqrt(d_(k))))V \boldsymbol{A}=\operatorname{softmax}\left(\frac{\boldsymbol{Q} \boldsymbol{K}^{\top}}{\sqrt{d_{k}}}\right) \boldsymbol{V}
基于此,模型能够关注输入前体的不同部分。词汇表中的总标记数为 4021,平行头的数量为 8,编码器层数为 6。使用了 0.1 的丢弃率。返回的嵌入形状为(
N
,
512
,
512
N
,
512
,
512
N,512,512 \mathrm{N}, 512,512 ),其中 N 是批量大小(微调时选择 32)。Chitturi 等人发表了他们构建的 1D-
预期应用
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 0.15 巴下的吸附量(摩尔/千克)
埃克苏胡克
热稳定性
4.66
加尔卢伊
夜光材料
3.53
拉克佐夫
氟化物吸附
5.70
南杜德
二氧化碳吸附
3.68
纳吉
催化剂
6.29
Intended Application CO_(2) Uptake at 0.15 bar (mol/kg)
EXUHUC Thermal Stability 4.66
GARLUJ https://cdn.mathpix.com/cropped/2025_07_08_a0ea1e0c7cb035555a93g-08.jpg?height=140&width=150&top_left_y=356&top_left_x=292 Luminescent Material 3.53
LAQZOV https://cdn.mathpix.com/cropped/2025_07_08_a0ea1e0c7cb035555a93g-08.jpg?height=132&width=163&top_left_y=498&top_left_x=297 Fluoride Adsorption 5.70
NAMDUD https://cdn.mathpix.com/cropped/2025_07_08_a0ea1e0c7cb035555a93g-08.jpg?height=163&width=161&top_left_y=629&top_left_x=297 Carbon Dioxide Adsorption 3.68
NAWKII https://cdn.mathpix.com/cropped/2025_07_08_a0ea1e0c7cb035555a93g-08.jpg?height=139&width=153&top_left_y=794&top_left_x=299 Catalyst 6.29 | | | Intended Application | $\mathrm{CO}_{2}$ Uptake at 0.15 bar (mol/kg) |
| :--- | :--- | :--- | :--- |
| | EXUHUC | Thermal Stability | 4.66 |
| GARLUJ |  | Luminescent Material | 3.53 |
| LAQZOV |  | Fluoride Adsorption | 5.70 |
| NAMDUD |  | Carbon Dioxide Adsorption | 3.68 |
| NAWKII |  | Catalyst | 6.29 |
图 6 | 一个连接金属有机框架(MOFs)及其潜在应用的“时间旅行”实验。金属有机框架(MOFs)被确定为在
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 捕获方面有前景(基于其预测的计算
CO
2
CO
2
CO_(2) \mathrm{CO}_{2} 在 0.15 巴下的吸附量)以及其原始文章中报道的预期应用。这些 MOFs 按其剑桥结构数据库(CSD)参考代码从上到下依次为 EXUHUC(金属类型:Mn,连接体:
C
11
H
8
O
4
N
2
)
63
C
11
H
8
O
4
N
2
63
C_(11)H_(8)O_(4)N_(2))^(63) \left.\mathrm{C}_{11} \mathrm{H}_{8} \mathrm{O}_{4} \mathrm{~N}_{2}\right)^{63} )、GARLUJ(金属类型:Eu,连接体:
C
15
H
13
NO
4
)
64
C
15
H
13
NO
4
64
C_(15)H_(13)NO_(4))^(64) \left.\mathrm{C}_{15} \mathrm{H}_{13} \mathrm{NO}_{4}\right)^{64} )、LAQZOV(金属类型:Ce,连接体:
C
21
H
14
O
6
C
21
H
14
O
6
C_(21)H_(14)O_(6) \mathrm{C}_{21} \mathrm{H}_{14} \mathrm{O}_{6} )
65
65
^(65) { }^{65} 、NAMDUD(金属类型:Mn,连接体:
C
27
H
18
O
6
C
27
H
18
O
6
C_(27)H_(18)O_(6) \mathrm{C}_{27} \mathrm{H}_{18} \mathrm{O}_{6} )
66
66
^(66) { }^{66} 和 NAWKII(金属类型:Mg,连接体:
C
12
H
8
O
4
)
67
C
12
H
8
O
4
67
C_(12)H_(8)O_(4))^(67) \left.\mathrm{C}_{12} \mathrm{H}_{8} \mathrm{O}_{4}\right)^{67} )。
接受 PXRD 图谱作为输入以预测晶体对称性分类的 CNN。以此为灵感,构建了一个包含十个卷积块的 1DCNN,每个卷积块后面跟有最大池化层和 ReLU 激活函数。在第十个卷积块之后,返回形状为( )的 CNN 嵌入。将变换器和 CNN 的两个嵌入进行张量拼接,返回拼接后的嵌入大小为( )。该拼接张量被输入到一个投影器中,投影器使用线性和 softplus 激活函数,将张量投影为形状为(N, 512)。该嵌入用于与晶体图卷积神经网络(CGCNN)进行自监督预训练。在执行回归时,投影后的嵌入被输入到一个回归头,该回归头由线性和 ReLU 全连接层组成,以返回 M 个标签,其中 M 为用户希望返回的任意属性数量。对于属性预测结果,M 设置为 1(一次预测一个标签)。 PyTorch 2.3 已被用于模型的构建
46
,
47
46
,
47
^(46,47) { }^{46,47} .
在模型评估、数据可视化和分析中,我们使用了 Pandas
48
48
^(48) { }^{48} 、Matplotlib
49
49
^(49) { }^{49} 、NumPy
50
50
^(50) { }^{50} 和 Scikit-learn
51
51
^(51) { }^{51} 。
自我监督学习
输入后,构建了一个自监督学习(SSL)流程,其中表示学习在晶体图卷积神经网络(CGCNN)与我们的模型
23
,
52
23
,
52
^(23,52) { }^{23,52} 之间进行。CGCNN 接受 MOF 的三维结构,并返回包含结构本身、化学组成及局部环境信息的嵌入向量。虽然几何性质依赖于结构信息,且由于 PXRD 输入已易于预测,但依赖化学性质的属性则较难预测,因为输入未能让模型明确理解 MOF 的金属/有机化学。这促使我们针对 CGCNN 嵌入向量进行自监督学习。嵌入向量从 CGCNN 和我们的模型的投影器中提取,嵌入大小均为 512。基于这两个嵌入向量,可以构建一个形状为
(
512
,
512
)
(
512
,
512
)
(512,512) (512,512) 的互相关矩阵。其定义如下:
C
i
j
≜
∑
b
z
b
,
i
A
z
b
,
j
B
(
∑
b
z
b
,
i
A
)
(
∑
b
z
b
,
j
B
)
C
i
j
≜
∑
b
z
b
,
i
A
z
b
,
j
B
∑
b
z
b
,
i
A
∑
b
z
b
,
j
B
C_(ij)≜(sum_(b)z_(b,i)^(A)z_(b,j)^(B))/((sqrt(sum_(b)z_(b,i)^(A)))(sqrt(sum_(b)z_(b,j)^(B)))) C_{i j} \triangleq \frac{\sum_{b} z_{b, i}^{\mathrm{A}} z_{b, j}^{\mathrm{B}}}{\left(\sqrt{\sum_{b} z_{b, i}^{\mathrm{A}}}\right)\left(\sqrt{\sum_{b} z_{b, j}^{\mathrm{B}}}\right)}
其中 b 是批次样本,
i
,
j
i
,
j
i,j \mathrm{i}, \mathrm{j} 是向量维度的索引,
z
A
,
z
B
z
A
,
z
B
z^(A),z^(B) z^{A}, z^{B} 分别是我们模型和 CGCNN 的嵌入表示。为了实现表示学习,交叉相关矩阵应接近单位矩阵。因此,用于量化这一点的损失函数(Barlow-Twin 损失)可以定义为:
L
BT
≜
∑
i
(
1
−
C
i
i
)
2
+
λ
∑
i
∑
j
≠
i
C
i
j
2
L
BT
≜
∑
i
1
−
C
i
i
2
+
λ
∑
i
∑
j
≠
i
C
i
j
2
L_(BT)≜sum_(i)(1-C_(ii))^(2)+lambdasum_(i)sum_(j!=i)C_(ij)^(2) L_{\mathrm{BT}} \triangleq \sum_{i}\left(1-C_{i i}\right)^{2}+\lambda \sum_{i} \sum_{j \neq i} C_{i j}^{2}
其中
λ
λ
lambda \lambda 是正则化项,用于描述损失函数第一部分和第二部分之间的权衡,
53
53
^(53) { }^{53} 。批量大小为 64,正则化项为 0.0051。此外,CGCNN 和我们模型的学习率均为 0.00005,训练 100 个 epoch。
有关使用的 MOF 数据库、模型架构/超参数、相关属性分布、CoRE-2019 过滤过程、模型性能统计数据、推荐系统详细信息(阈值、掩蔽学习)、MOF 应用程序发现部分中讨论的“时间旅行”模型、CoRE2019 多样性评估、实验 PXRD 的模型稳健性及其在共价有机框架 (COF) 上的稳健性的信息可以在补充信息部分找到。 数据效率信息也可以在补充信息中找到。
报告摘要
有关研究设计的更多信息,请参阅本文链接的 Nature Portfolio Reporting Summary。
数据可用性
代码可用性
引用
周, H.-C., Long, J. R. & Yaghi, O. M. 金属有机框架简介.化学评论 112, 673-674 (2012)。
Pascanu, V., González Miera, G., Inge, A. K. & Martín-Matute, B. 金属有机框架作为有机合成的催化剂:一个批判性的观点。J. Am. Chem. Soc. 141, 7223-7234 (2019)。
Zhao, X., Wang, Y., Li, D.-S., Bu, X. & Feng, P. 用于分离的金属有机框架。Adv. Mater.30, 1705189 (2018).
张 L.-T., 周, Y. & Han, S.-T.金属有机框架在电子传感器中的作用。安格。化学 133, 15320-15340 (2021)。
Chung, Y. G. 等人。计算就绪的实验性金属有机框架数据库的进展、更新和分析:CoRE MOF 2019。J. Chem. Eng. Data 64, 5985-5998 (2019)。
Chung, Y. G. 等人。计算就绪的实验性金属有机框架:一种实现纳米多孔晶体高通量筛选的工具。化学材料。26, 6185-6192 (2014).
Moghadam, PZ 等人。剑桥结构数据库子集的开发:过去、现在和未来的金属有机框架集合。化学材料。29, 2618-2625 (2017).
Moosavi, SM 等人。在金属有机框架的合成中捕捉化学直觉。Nat. Commun.10, 539 (2019).
Tom, G. 等人。化学和材料科学的自动驾驶实验室。化学修订版 124, 9633-9732 (2024)。
Back, S. 等人。与 Al. Digital Discov 一起加速化学科学。3, 23-33 (2024).
Ongari, D., Talirz, L. & Smit, B. 太多的材料和太多的应用:一个等待计算解决方案的实验问题。ACS Cent. Sci. 6, 1890-1900 (2020)。
Fateeva, A. 等人。一种水稳定的卟啉基金属有机框架,对可见光光催化具有活性。安格。化学 Ger. Ed. 124, 7558 (2012)。
博伊德,PG 等人。用于湿烟气 CO2 捕获的金属有机框架的数据驱动设计。自然 576, 253-256 (2019)。
钱 J.-J.等人。修饰 SBMOF-1 中的切换 Xe/Kr 吸附选择性:一项理论研究。RSC Adv. 10, 17195-17204 (2020)。
Moosavi, S. M., Jablonka, K. M. & Smit, B.机器学习在材料理解和设计中的作用。J. Am. Chem. Soc. 142, 20273-20287 (2020)。
Banerjee, D. 等人。金属有机框架,具有最佳选择性氙吸附和分离。Nat. Commun.7, 1-7 (2016).
Moghadam, PZ 等人。计算机辅助发现具有优异摄氧率的金属有机框架。Nat. Commun.9, 1378 (2018).
Rosen, A. S. 等人。机器学习金属有机框架的量子化学性质,以加速材料发现。问题 4,1578-1597 (2021)。
Rosen, A. S. 等人。金属有机框架电子特性的高通量预测:理论挑战、图神经网络和数据探索。npj 计算材料。8, 1-10 (2022).
Oviedo, F. 等人。使用数据增强和深度神经网络对小型 X 射线衍射数据集进行快速且可解释的分类。npj 计算材料。5, 60 (2019).
Utimula, K. 等人。应用于粉末 X 射线衍射图谱的机器学习聚类技术,以区分 ThMn12 型合金的成分。Adv. Theory Simul.3, 2000039 (2020).
Suzuki, Y. 等人。使用可解释的机器学习方法从 X 射线衍射图谱中进行对称性预测和知识发现。科学代表 10, 21790 (2020)。
Cao, Z., Magar, R., Wang, Y. & Barati Farimani, A. Moformer:用于金属有机框架性能预测的自监督变压器模型。J. Am. Chem. Soc. 145, 2958-2967 (2023)。
Bucior, BJ 等人。金属有机框架的鉴定方案,可实现快速搜索和化学信息学分析。Cryst. Growth Des. 19, 6682-6697 (2019)。
Xie, T. & Grossman, J. C. 用于准确和可解释的材料特性预测的晶体图卷积神经网络。Phys. Rev. Lett. 120, 145301 (2018)。
Moosavi, SM 等人。了解金属有机框架生态系统的多样性。Nat. Commun.11, 4068 (2020).
Bobbitt, NS et al. MOFX-DB:纳米多孔材料计算吸附数据的在线数据库。J. Chem. Eng. Data 68, 483-498 (2023)。
博伊德,P. G. & Woo,T. K.一种从图论构建任何网络拓扑的假设纳米多孔材料的广义方法。CrystEngComm 18, 3777-3792 (2016 年)。
Wilmer, CE 等人。假设金属有机框架的大规模筛选。Nat. Chem. 4, 83-89 (2012)。
Kang, Y., Park, H., Smit, B. & Kim, J.用于金属有机框架中通用迁移学习的多模态预训练转换器。Nat. Mach. Intell.5, 309-318 (2023).
Burner, J. 等人。用于预测金属有机框架的低压 CO2 吸附特性的高性能深度学习回归模型。J. Phys. Chem. C. 124, 27996-28005 (2020)。
Boldog, I. 等人。一种基于四唑酸盐和膦酸盐的罕见 alb-4, 8-Cmce 金属配位网络,官能化 1, 3, 5, 7-四苯基金刚烷。CrystEngComm 15, 1235-1243 (2013 年)。
Mahajan, S. & Lahtinen, M. 金属有机框架(MOFs)在不同压力下捕获方面的最新进展。环境化学工程杂志,10,108930(2022)。
Ursueguía, D., Díaz, E. & Ordóñez, S. 金属有机框架(MOFs)作为甲烷吸附剂:从储存到稀释的煤矿流浓缩。Sci. Total Environ.790, 148211 (2021).
周, W. 多孔金属有机框架中的甲烷储存:当前记录和未来前景。Chem. Rec. 10, 200-204 (2010)。
Ahmed, A. 等人。通过筛选近五十万个金属有机框架实现了卓越的氢储存。Nat. Commun.10, 1568 (2019).
Zhang, X., Jablonka, KM & Smit, B. 基于深度学习的金属有机框架 (MOF) 推荐系统。数字 Discov。3, 1410-1420 (2024).
李,B.,温,H.-M.,周,W. & Chen,B. 用于气体储存和分离的多孔金属有机框架:什么、如何以及为什么?J. Phys. Chem. Lett. 5, 3468-3479 (2014)。
Khan, S. T. & Moosavi, S. M. XRayPro:通过多模态模型机器学习将金属有机框架合成与应用连接起来。 https://xraypro.streamlit.app/ (2024)。
Charalambous, C. 等人。加速基于吸附剂的碳捕获的整体平台。自然 632, 89-94 (2024)
Lunt, AM 等人。实验室的模块化、多机器人集成:固态化学的自主工作流程。化学科学 15, 2456-2463 (2024)。
Ong, SP 等人。Python 材料基因组学 (pymatgen):用于材料分析的强大开源 Python 库。计算材料。科学 68, 314-319 (2013)。
Graef, M. D. & McHenry, M. E. 材料结构:晶体学、衍射和对称性简介。(剑桥大学出版社,2007 年)。
Vaswani, A. 你只需要注意。在神经信息处理系统的进展 (NIPS, 2017)。
Chitturi, S. R. 等人。根据 X 射线粉末衍射图谱自动预测晶格参数。J. 应用晶体学家。54, 1799-1810 (2021).
Paszke, A. 等人。PyTorch 中的自动微分。NIPS 2017 Autodiff 研讨会 (2017)。
Paszke, A. 等人。PyTorch:一种命令式风格的高性能深度学习库。CoRR, https://arxiv.org/abs/1912 .01703(2019 年)。
pandas 开发团队,T. pandas-dev/pandas:Pandas,https:// doi.org/10.5281/zenodo .3509134(2020 年)
Hunter, JD Matplotlib:2D 图形环境。计算。科学工程 9, 90-95 (2007)。
Harris, C. R. 等人。使用 NumPy 进行数组编程。自然 585, 357-362 (2020)。
Pedregosa, F. 等. Scikit-learn:Python 中的机器学习。CoRR, https://arxiv.org/abs/1201.0490 (2012)
Magar, R., Wang, Y. & Barati Farimani, A. 晶体孪生:用于晶体材料性能预测的自我监督学习。npj 计算材料。8, 231 (2022).
Zbontar, J., Jing, L., Misra, I., LeCun, Y. & Deny, S. Barlow双胞胎:通过减少冗余进行自我监督学习。Int. Conf. Mach. 学习。139, 12310-12320 (2021).
Khan, S. T. & Moosavi, S. M. 利用多模态机器学习将金属有机框架合成与应用连接起来。XRayPro, https://doi.org/10.5281/zenodo . 15330841(2025 年)。
Dubbeldam, D., Calero, S. & Vlugt, TJ iRASPA:面向材料科学家的GPU加速可视化软件。Mol. Simul.44, 653-676 (2018).
Galet, A., Muñoz, M. C., Martínez, V. & Real, J. A. 自旋交叉网络中具有嗜酸相互作用的超分子异构性。化学公报。20, 2268-2269 (2004)
Volkringer, C. 等人。金属有机框架型四价三铀酸盐的 1D 通道开放网络。无机。化学 50, 11865-11867 (2011)。
Xu
,
H
.
&
Xu
,
Z
Xu
,
H
.
&
Xu
,
Z
Xu,H.&Xu,Z \mathrm{Xu}, \mathrm{H} . \& \mathrm{Xu}, \mathrm{Z} 。一种由 2,6-萘二甲酸盐和二价钴组成的微孔配位聚合物,表现出可逆的结构和功能转变。微孔介孔材料,157,33-36(2012)。
Momma, K. & Izumi, F. VESTA:用于电子和结构分析的三维可视化系统。应用晶体学家。41, 653-658 (2008).
Dreischarf, A. C., Lammert, M., Stock, N. & Reinsch, H. Zr-CAU-28的绿色合成:基于2,5-呋喃二羧酸的第一种Zr-MOF的结构和性能。无机。化学 56, 2270-2277 (2017)。
Donnarumma, PR 等人。获取 UiO-66 稀土类似物的合成方法。化学公报。57, 6121-6124 (2021).
Pougin, MJ 等人。芘基金属有机框架中的吸附:孔隙结构和拓扑的作用。ACS 应用材料。接口 16, 36586-36598 (2024)。
Wang, C., Jiao, Y. & Li, G.一个带有羟基苯基咪唑二羧酸配体的三维锰 (II) 有机框架。无机。纳米梅特。化学 47, 298-301 (2017)。
Wang, X. 等人。镧系金属有机框架的高效白光发射和 UV-可见光/NIR 发光传感。Cryst. Growth Des. 17, 2178-2185 (2017)。
马, A. 等人两种基于镧系元素的金属有机框架,用于高效吸附和去除水中的氟离子。CrystEngComm 19, 2172-2177 (2017)。
Meng, Q.-H., Liu, J.-L., Long, X., Zhang, S. & Quan, Y.一种基于 [Mn4Cl] 7+ 簇的多孔 the-type 金属有机框架,用于选择性气体吸附。无机。化学公报。79, 46-49 (2017).
Gangu, K. K., Maddila, S., Mukkamala, S. B. & Jonnalagadda, S. B. 新的Mg (II)-金属-有机框架的合成、结构和性质及其作为催化剂在4 H-吡喃生产中的实力。Ind. Eng. Chem. Res. 56, 2917-2924 (2017)。
确认
作者衷心感谢加拿大自然科学与工程研究委员会、多伦多大学加速联盟通过加拿大第一研究卓越基金(资助号为 CFREF-2022-00042)和加拿大国家研究委员会(资助号为 CFREF-2022-00042)和加拿大国家研究委员会(根据清洁燃料材料挑战计划资助号为 MCF-146)提供的财政支持。我们要感谢 Ashlee Howarth 博士小组(康考迪亚大学)的 Hudson Bicalho 和 Micaela Richezzi 博士为我们提供图 4 中材料的实验 PXRD。
作者贡献
概念化:S.T.K. & S.M.M.;数据管理:S.T.K.;形式分析:S.T.K.;资金获取:S.M.M.;调查:S.T.K. & S.M.M.;方法论:S.T.K. & S.M.M.;项目管理:S.M.M.;软件:S.T.K.;监督:S.M.M.;验证:S.T.K.;可视化:S.T.K.;写作 - 审查和编辑:S.T.K. & S.M.M.
利益争夺
作者声明没有利益冲突。
补充信息 在线版本包含可从 https://doi.org/10.1038/s41467-025-60796-0 获取的补充材料。
信件和材料请求应发送至 Seyed Mohamad Moosavi。
同行评审信息 Nature Communications 感谢 Jennifer Chayes、Theo Pierre Jaffrelot Inizan 和其他匿名审稿人对这项工作的同行评审做出的贡献。同行评审文件可用。
出版商注 Springer Nature 对已发布地图中的管辖权主张和机构隶属关系保持中立。
开放获取本文根据 Creative Commons Attribution 4.0 International License 获得许可,该许可允许以任何媒体或格式使用、共享、改编、分发和复制,前提是您对原作者和来源给予适当的信任,提供指向 Creative Commons 许可的链接,并说明是否进行了更改。本文中的图像或其他第三方材料包含在文章的知识共享许可中,除非在材料的致谢行中另有说明。如果材料未包含在文章的 Creative Commons 许可中,并且您的预期用途未被法律法规允许或超出允许的用途,您将需要直接从版权所有者处获得许可。要查看此许可证的副本,请访问 http://creativecommons.org/ licenses/by/4.0/ 的 © 作者 2025