融合多信息的图卷积实体对齐方法

知识图谱是一种通过图结构表示实体及其关系的语义网络,用于存储和组织丰富的知识信息[1]。实体对齐[2](entity alignment,EA)是知识图谱融合中的关键任务,其主要目标是识别并匹配在不同知识图谱中表示相同概念或实体的元素,从而构建不同知识图谱之间的连接。早期的实体对齐方法大多集中于基于字符串匹配的方法、基于规则的方法以及基于语义相似度的方法等[3]。

近年来,基于表示学习的实体对齐模型技术应运而生。这类技术旨在捕获实体之间的语义关联关系,提高对齐的准确性和鲁棒性。基于翻译的实体对齐方法的核心思想是将实体和关系嵌入为向量,通过向量加法或转换来实现映射,TransE[4]是一种经典的知识图谱嵌入方法,因其在实体对齐任务中的优越表现,得到了广泛应用。基于TransE的思想,许多更具高效性和精度的实体对齐模型相继被提出,例如,MTransE[5]、IPTransE[6]、JAPE[7]、BootEA[8]和MultiKE[9]等。图卷积网络(graph convolutional network,GCN)通过聚合邻域信息来提升表示能力的特性,使其成为实体对齐任务中的重要工具。GCN-Align[10]首次将图卷积应用于实体对齐任务,相比于传统方法,GCN-Align具有更强的表达能力和泛化能力,能够有效应对异构数据集以及实体演化等复杂问题。AliNet[11]通过引入自适应注意力机制,进一步提升了实体对齐的性能。RDGCN[12]和RNM[13]通过引入预训练的词向量来初始化模型,从而将实体名称的语义信息有效地融入实体表示中。高速图卷积网络能够更有效地传递信息、缓解梯度消失问题,HGCN[14]通过高速门机制,在每个图卷积网络层中学习不同程度的信息传递和过滤,以平衡来自中心实体和邻域聚合的信息。

目前,大多数实体对齐方法侧重图结构信息,忽略了文本信息的潜在价值。因此,本文提出了一种融合多信息的图卷积实体对齐方法(multiple information for graph convolutional network entity alignment,MIGCNEA),旨在解决知识图谱的异质性问题,并充分利用图结构和文本信息的互补性。本研究的主要贡献如下:①构建了基于改进PageRank算法的三元组筛选模块,通过计算知识图谱及其关系对偶图的重要性,筛选过滤无效三元组,缓解不同知识图谱结构性差异。②利用高速图卷积网络学习实体和属性的嵌入表示,进而利用实体属性信息学习关系信息,并通过关系迭代更新实体信息,缓解知识图谱异质性问题,提高了方法的表达能力和泛化能力。③提出了一种基于微调BERT的PBAB(pairwise BERT attention Bi-LSTM)方法,整合实体文本描述信息,并将基于图的模块和基于文本的模块进行加权融合,综合利用文本信息和图结构信息,以提高实体对齐的准确性和泛化能力。

1 问题定义

知识图谱视为3个基本部分组成的结构:实体集E、关系集R以及三元组集合T,即KG=(E,R,T)。在这个结构中,实体集E包含了图谱中的所有实体,关系集R则定义了实体之间可能的各种关系。

假设有两个知识图谱KG1=(E1,R1,T1)和KG2=(E2,R2,T2),其中KG1和KG2包含各自的一组实体集合E1和E2,并描述了两者之间的关系和属性。实体对齐问题的核心任务,是识别这两个知识图谱中所描述的同一实体在不同图谱中的对应节点。实体对齐问题旨在找到一个映射函数,如式(1)所示。

式中:f为映射函数,将KG1中的实体映射到KG2中的对应实体。

2 MIGCNEA方法

本文提出了融合多信息的图卷积实体对齐方法,如图1所示。该方法主要包含3个模块,分别是三元组筛选模块、图结构信息表示模块以及文本信息表示模块。

2.1 三元组筛选模块

知识图谱的结构特征以三元组形式表示,不同图谱间三元组数量差异可能影响实体对齐任务。为解决这一问题,本文提出了一种三元组筛选模块,通过对三元组重要性评分,去除无效三元组,从而提高实体对齐的准确性和效率。

在知识图谱中,PageRank算法[15]可以用来评估图谱中实体的重要性。通过迭代计算每个实体的重要性得分,考虑到实体之间的链接关系,从而识别知识图谱中的关键实体。其计算公式为

式中:a为计算PageRank的节点;Ti为引用节点,d为阻尼系数,表示节点被引用的概率,一般取0.85;L(Ti)为节点Ti的出链。

在图结构中,节点的重要性与其连接数不总成正比。特征向量中心度算法通过考虑节点的连接质量和重要性,识别出在网络中具有更高影响力的节点,超越了仅依赖连接数的度数。在PageRank算法的基础上,融合特征值中心性算法,设Ci为特征中心性,对齐加权Ci=μiλi,用权重系数μi来调整特征值中心性,更好地区分链路网络中节点的重要性,计算如式(3)所示。

PageRank算法本质上是基于图的中心性度量方法,通过节点的“入链”数量和权重评估节点重要性。改进PageRank结合特征值中心性等加权机制,精准地评估节点重要性,特别是核心实体。此外,筛选模块通过加权机制处理异构信息,避免评估失真,确保知识图谱对齐和融合过程中的精度。三元组筛选模块主要包括三部分:关系对偶图、PageRank值计算和得分函数计算,模块结构如图2所示。

首先,构建以关系为点的关系对偶图。在一个图中,节点表示实体,边表示实体之间的关系;而在关系对偶图中,节点表示关系,边表示关系之间的连接。然后,通过公式(3)计算实体和关系的PageRank值。最后,通过三元组评分公式(4)计算三元组得分,筛选三元组,基于三元组评分设置阈值δ,保留score(h,r,t)>δ的三元组。

该模块通过引入改进的PageRank算法和特征中心值策略,有效提高了三元组的筛选精度,增强了知识图谱的整体质量。通过这一方法,能够更好地处理图中的异质性问题,从而提升知识图谱的可靠性和实用性。

2.2 图结构信息表示模块

本节提出的高速图卷积网络信息表示模块,包括实体、属性和关系嵌入,利用迭代更新机制优化嵌入,充分利用知识图谱中的结构信息。通过深度学习和多层次更新,逐步精炼实体和关系的表示,增强了知识图谱在实体对齐任务中的表达能力。

图卷积网络是一种用于处理图数据的深度学习模型,基于邻居节点的信息传播来更新每个节点的表示,类似于在图上进行卷积操作。通过多层的GCN堆叠,可以逐步聚合更远的节点信息,并且学习到更高级的表示。对于每一层GCN的输入H(l),输出可以表示为

式中:

为邻接矩阵A与单位矩阵I的和;

是对应于

的度矩阵,对每个节点的邻居信息进行归一化。权重矩阵Wl∈Rdl×dl+1表示第l层与第l+1层之间的线性变换,而σ则是ReLU激活函数,用来引入非线性特性,使得模型能够更好地学习复杂的图结构。

Highway GCN结合了高速公路网络的门控机制,控制信息流动以学习深层次表示。它在每层更新中调节邻居节点特征与原始特征的传递比例。本文采用带高速公路网络的双层GCN进行信息嵌入,使用转换门和保留门分别控制信息流入和绕过当前层。

式中:T为转换门,其主要任务是控制当前层信息的转换与更新,决定了从上一层传递的信息应当如何进行变化或调整;C为携带门,其定义为C=1-T,负责保留上一层的信息流动,并通过C来控制哪些信息需要被传递到当前层。

知识图谱中除了包含实体信息外,还包含许多属性信息,属性信息可以作为辅助信息,帮助提高实体对齐的准确性。同样,本文使用Highway GCN学习实体的属性嵌入。属性嵌入的图卷积计算过程如式(7)、式(8)所示。

式中:

表示第l层属性嵌入的输入;

表示第l层GCN属性嵌入的输出;

为第l层的属性权值矩阵。

在实际的知识图谱中,每个实体通常具有多个属性,而不同的属性对实体的影响程度也有所不同。图注意力网络(graph attention network,GAT)是一种能够有效处理图结构数据的模型,具有自动关注不同节点和属性重要性的能力,允许节点在信息传递过程中根据邻居节点的重要性动态地分配注意力权重,从而更有效地聚合邻居节点的信息。本文采用属性更新模块更新属性权重。该模块赋予属性初始权重,并在传播过程中利用GAT更新属性权重。其传播过程如图3所示。

GAT每个节点特征的注意力值计算如式(9)、式(10)、式(11)所示。

式中:W为特征权重矩阵;j∈Ni表示遍历i相邻的所有节点j;aij为注意力相关系数;σ为非线性激活函数LeakyReLU;h′i表示顶点i的新特征。

在结构嵌入和属性嵌入后,采用向量融合的方法融合了实体嵌入He和属性嵌入Ha。设concat(·)表示向量融合;α表示权重参数,he(·)和ha(·)分别表示实体嵌入和属性嵌入的特征向量;fe和fa表示维度;β表示平衡参数,结构信息和属性信息的聚合如式(12)所示,相似度距离计算如式(13)、式(14)所示。

边界损失函数如公式(15)所示。

在知识图谱中,信息通过三元组(h,r,t)表示。通过实体对齐,可以学习和迁移关系信息,提升关系对齐的准确性。本文通过学习实体信息来优化关系信息,并利用关系信息迭代更新实体信息。同时,为进一步探索基于三元组的关系信息,本文引入了一个正则化器进行优化。

式中:T1∪T2表示两个知识图谱中的三元组的并集;W则表示学习模型中的参数。

通过多次迭代更新实体间的关系传播,优化实体的嵌入表示。关系嵌入向量与实体交互调整实体嵌入,捕捉语义和结构信息。关系迭代更新精细化嵌入表示,提高跨图谱对齐准确性,并增强模型在多任务中的性能。为了在同一框架中同时优化实体和关系的嵌入表示,本文提出了一种联合学习方法,通过设计一个综合目标函数来共同训练实体嵌入和关系嵌入。该目标函数如公式(17)所示。

式中:Le表示实体对齐损失,衡量实体嵌入在不同知识图谱之间的一致性和准确性;λ为一个超参数,作用是平衡两个损失项的相对重要性,通过适当调整λ,可以确保模型在对齐精度和泛化能力之间达到良好的平衡。

2.3 文本信息表示模块

本文提出的PBAB方法,基于微调的预训练语言模型、融合注意力机制和Bi-LSTM模型,有效捕捉文本细粒度语义差异。该方法深入理解实体及其与周围词语的关系,提升实体对齐准确性,尤其在实体高相似度且文本信息丰富时表现优异。

目前许多知识图谱实体对齐的研究主要集中在图结构的嵌入上,而忽略了文本信息的嵌入,文本信息可以为实体对齐提供宝贵的辅助。近年来,双向编码器表示(BERT)[16]通过基于语言建模的大规模预训练,在自然语言处理各领域取得了显著进展。在多语言环境中,BERT的核心思想是将来自不同语言的单词或句子映射到统一的语义空间中。基于此,本文提出PBAB方法,如图4所示。组合方法PBAB的网络框图由PairwiseBERT层、Attention层和BiLSTM层组成。

(1)PairwiseBERT层:该方法利用预训练的BERT模型,将实体描述转换为高质量文本嵌入,捕捉语法和语义特征。其双向上下文建模和自注意力机制使其在多语言环境中表现优异,具有更好的适应性和扩展性。通过微调BERT,提升实体对齐准确性,特别在多语言环境下具有更好的适应性和扩展性。

(2)Attention层:Attention机制通过动态加权词语,灵活捕捉文本关联信息,提升语义理解能力。它处理上下文依赖性,使词在不同情境下重要性不同,并有效应对长程依赖。Soft Attention通过加权平均调整信息重要性,广泛应用于深度学习模型中,增强长程依赖捕捉,提升性能。

(3)Bi-LSTM层:LSTM是一种特殊的RNN,能够学习长期依赖关系。LSTM通过引入门机制(输入门、遗忘门和输出门)来克服传统RNN在处理长序列时的梯度消失和梯度爆炸问题。Bi-LSTM层对实体描述的文本嵌入序列进行建模,以获取更丰富的语义表示。通过双向的设计,Bi-LSTM能够同时考虑文本序列的过去和未来信息,提高了方法对文本序列的理解能力。

2.4 聚合模块

知识图谱实体对齐聚合模块通过识别、对齐和聚合不同来源的实体信息,提升图谱的准确性和全面性,消除数据孤岛,实现知识共享与重用。本文将PBAB学习到的文本嵌入记为HB,图嵌入记为HG,将两个模块通过加权连接聚合,聚合函数如式(18)所示。

式中:HG表示由方法学习的图嵌入;HB为由方法学习的文本嵌入;γ为平衡图嵌入和文本嵌入的平衡因子。

3 实验结果与分析

3.1 数据集和实验环境

为评估MIGCNEA实体对齐方法的性能,本文使用DBPedia数据集下的不同语言版本构建的实体对齐数据集DBP15K,如表1所示。该数据集包含 3个子版本的数据集:DBP15K-ZH-EN(中文-英语)、DBP15K-JA-EN(日语-英语)和DBP15K-FR-EN(法语-英语)。

本文提出的MIGCNEA方法采用深度学习框架TensorFlow构建并在12 vCPU Intel(R) Xeon(R) Platinum 8352V CPU @ 2.10GHz和RTX 4090(24 GB) GPU上训练。本方法是基于图神经网络的实体对齐方法,每批次训练样本的大小为20,节点嵌入维数为300,Highway GCN层数为2,训练轮次为60,学习率为0.001,正则化参数采用L2正则,γ值为0.9。按照惯例,将数据集的30%作为训练数据,剩下的70%用作测试数据,观察在设置不同数据集情况下,60轮训练迭代过程中MIGCNEA方法损失函数的收敛情况。

为了深入探讨MIGCNEA方法的收敛速度,本文对其在3个公共数据集上的实验轮数进行了细致的对比分析,并系统地比较了损失率的变化情况,如图5所示。实验结果表明,MIGCNEA方法在60轮内将损失率降至最低,展示了其高效性和快速适应数据特征的能力。前50轮中,方法通过参数调整学习到关键特征,损失率显著下降,最终在第60轮达到最低,验证了其良好的拟合效果和通用性。

3.2 评价指标

本文采用Hits@k和MRR作为实体对齐效果的评价指标。其中,Hits@k表示在模型生成的候选列表中,有多少比例的正确实体或关系排在前k个位,其计算如式(19)所示。Hits@k越高,表示模型对齐的效果越好。按照惯例,本文k取值1和10。

式中:Ⅱ(·)为indicator函数,满足条件时为1,反之为0。

MRR指平均倒数排名,通过计算正确实体或关系的倒数排名的平均值评估补全模型的性能,其计算如式(20)所示,MRR越高,结果越优。

3.3 对比实验

为验证MIGCNEA方法与其他方法在同等条件下的优越性,设置对比实验,对比方法包括基于嵌入的模型:MTransE[5],JAPE[7],BootEA[8],ESEA[17]以及基于神经网络的模型:GCN-Align[10],AliNet[11],RDGCN[12],HGCN[14],MHGCN[18],AWUN[19],RNM[13],AR-Align[20],RAGA[21],如表2所示。

3.4 实验结果

由表2可知,其在实体对齐任务中显著优于13种基线方法。在Hits@1指标上始终超过90%,在Hits@10上均高于99%,且MRR高于95%。与RAGA方法相比,MIGCNEA在3个数据集上的提升分别为6.26%,0.71%和4.01%(Hits@1),以及5.19%,1.56%和1.61%(Hits@10)。这些结果表明,MIGCNEA通过有效的三元组筛选模块和嵌入模块,成功缓解了知识图谱的异质性问题。

与传统的知识图谱实体和关系嵌入方法相比,迭代更新机制通过多次修正实体和关系的嵌入,能够捕捉节点间的长程依赖和复杂语义关联。每次迭代优化实体与关系表示,提升了对复杂关系的处理能力。结合文本信息进一步丰富了实体的语义理解,利用预训练的文本嵌入转化为向量并与图结构数据结合,增强了实体的语义表示能力,从而提高了实体对齐的精度和区分度。

为了更清晰地了解方法在不同评价指标下的表现,如图6所示,分析各数据集中Hits@1和Hits@10的变化情况。结果表明,Hits@1指标的提升幅度略高于Hits@10,表明本文提出的方法在潜在实体集合中更加有效地识别出正确实体,从而显著提高了实体对齐任务的命中率。实验结果进一步验证了本方法在实体对齐任务中的有效性,强调了其对知识图谱构建的积极贡献。

3.5 消融实验

为了评估MIGCNEA方法的性能,本文进行了一系列消融实验,并将结果整理在表3中。本文针对三个关键方面进行了分析:①MIGCNEA(-PR)移除了三元组筛选模块;②MIGCNEA(-R)移除了关系嵌入;③MIGCNEA(-B)移除了PBAB方法。

从表3可见,移除PBAB框架后,MIGCNEA性能显著下降,验证了该模块的重要性。同时,移除三元组筛选模块和关系嵌入后,结果表明三元组筛选模块提高了实体对齐的准确性。结构信息表示模块通过图结构的迭代更新机制优化实体和关系表示。PBAB模块将实体对齐转化为文本匹配任务,利用词语位置和上下文信息生成精准嵌入,帮助捕捉细粒度语义信息,提升实体对齐任务的表现。

MIGCNEA方法通过三元组筛选模块提高实体对齐准确率,该模块采用改进的PageRank算法筛选低质量或冗余的三元组,优化图结构并减少噪声。结合PageRank和特征加权中心性,评估三元组质量并调整过滤策略,进一步优化对齐。图结构信息表示模块通过嵌入信息学习实体关系,并通过迭代优化更新实体表示,使其语义匹配一致。文本表示模块使用PBAB方法,将实体对齐转化为文本匹配,生成精准嵌入,帮助捕捉细粒度语义,提升对齐效果。

为了深入研究图结构信息与文本信息权重比对方法准确性的影响,本文通过实验研究了图结构信息与文本信息权重比对实体对齐准确性的影响。实验设置了多个γ值(图结构信息权重),并逐步调整其值以观察实体对齐效果。实验结果表明,随着γ值增大,Hits@1和Hits@10的值逐渐上升,说明增加图结构信息与文本信息的权重比有助于提高实体对齐精度。特别地,当γ值为0.9时,Hits@1和Hits@10达到最优,证明该权重配置有效提升了方法性能。

实验结果表明,图结构信息与文本信息的加权融合显著影响方法性能。图结构通过明确的实体连接捕捉基本语义关系,适合关系紧密的实体对齐任务,尤其在结构化语义中表现优越。然而,图结构无法完全处理复杂语境,文本信息则补充了这一不足,增强了模型对上下文的理解。当图结构信息占主导时,方法更注重实体关系,优化了对齐效果。

4 结论

本文提出了一种MIGCNEA方法,用于跨语言知识图谱实体对齐任务。该方法首先通过改进的PageRank算法评估三元组的重要性,筛选出无效三元组,从而缓解不同知识图谱之间的结构差异。为了提高关系嵌入质量,在图结构信息表示模块采用两层Highway GCN进行编码,实现实体和属性嵌入,然后利用实体和属性信息学习嵌入关系信息,并迭代更新实体和关系信息。在文本信息表示模块,利用PBAB方法嵌入文本信息,将图结构信息与文本信息加权融合,更好地利用多方面信息实现知识图谱实体对齐。实验结果表明,该方法在公共数据集上表现出了较好的效果,验证了MIGCNEA方法的有效性。

[1] 李卫军,顾建来,张新勇,等.基于关系学习的小样本知识图谱补全模型[J].郑州大学学报(工学版),2024,45(4): 53-61.LI W J,GU J L,ZHANG X Y,et al.Relation learning completion model for few-shot knowledge graphs[J].Journal of Zhengzhou University (Engineering Science),2024,45(4): 53-61.

[2] FANOURAKIS N,EFTHYMIOU V,KOTZINOS D,et al.Knowledge graph embedding methods for entity alignment: experimental review[J].Data Mining and Knowledge Discovery,2023,37(5): 2070-2137.

[3] 庄严,李国良,冯建华.知识库实体对齐技术综述[J].计算机研究与发展,2016,53(1): 165-192.ZHUANG Y,LI G L,FENG J H.A survey on entity alignment of knowledge base[J].Journal of Computer Research and Development,2016,53(1): 165-192.

[4] BORDES A,USUNIER N,GARCIA-DURAN A,et al.Translating embeddings for modeling multi-relational data[C]∥NIPS′13: Proceedings of the 26th International Conference on Neural Information Processing Systems-Volume 2,Advances in Neural Information Processing Systems.New York:ACM,2013: 2787-2795.

[5] CHEN M H,TIAN Y T,YANG M H,et al.Multilingual knowledge graph embeddings for cross-lingual knowledge alignment[EB/OL].(2017-05-017)[2025-03-04].https:∥arxiv.org/abs/1611.03954v3.

[6] ZHU H,XIE R B,LIU Z Y,et al.Iterative entity alignment via joint knowledge embeddings[C]∥Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI-2017).Melbourne: International Joint Conferences on Artificial Intelligence,2017:1-7.

[7] SUN Z Q,HU W,LI C K.Cross-lingual entity alignment via joint attribute-preserving embedding[M]∥The Semantic Web-ISWC 2017.Cham: Springer International Publishing,2017: 628-644.

[8] SUN Z,HU W,ZHANG Q,et al.Bootstrapping entity alignment with knowledge graph embedding[C]∥27th International Joint Conference on Artificial Intelligence and 23rd European Conference on Artificial Intelligence: IJCAI-ECAI 2018.Melbourne: International Joint Conferences on Artificial Intelligence,2018:1-7.

[9] ZHANG Q H,SUN Z Q,HU W,et al.Multi-view knowledge graph embedding for entity alignment[EB/OL].(2019-06-06)[2025-03-12].https:∥arxiv.org/abs/1906.02390v1.

[10] WANG Z C,LV Q S,LAN X H,et al.Cross-lingual knowledge graph alignment via graph convolutional networks[C]∥Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing.Brussels:ACL,2018: 349-357.

[11] SUN Z Q,WANG C M,HU W,et al.Knowledge graph alignment network with gated multi-hop neighborhood aggregation[J].Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(1): 222-229.

[12] WU Y T,LIU X,FENG Y S,et al.Relation-aware entity alignment for heterogeneous knowledge graphs[EB/OL].(2019-08-22)[2025-03-12].https:∥arxiv.org/abs/1908.08210v1.

[13] ZHU Y,LIU H Z,WU Z H,et al.Relation-aware neighborhood matching model for entity alignment[J].Proceedings of the AAAI Conference on Artificial Intelligence,2021,35(5): 4749-4756.

[14] WU Y T,LIU X,FENG Y S,et al.Jointly learning entity and relation representations for entity alignment[EB/OL].(2019-09-20)[2025-03-12].https:∥arxiv.org/abs/1909.09317v1.

[15] BIANCHINI M,GORI M,SCARSELLI F.Inside PageRank[J].ACM Transactions on Internet Technology,2005,5(1): 92-128.

[16] DEVLIN J,CHANG M W,LEE K,et al.BERT: pre-training of deep bidirectional transformers for language understanding[EB/OL].(2019-05-24)[2025-03-12].https:∥arxiv.org/abs/1810.04805v2.

[17] JIANG T T,BU C Y,ZHU Y,et al.Combining embedding-based and symbol-based methods for entity alignment[J].Pattern Recognition,2022,124: 108433.

[18] GAO J L,LIU X Y,CHEN Y B,et al.MHGCN: multiview highway graph convolutional network for cross-lingual entity alignment[J].Tsinghua Science and Technology,2022,27(4): 719-728.

[19] SU Z H,XU T,DAI Y G,et al.Cross-lingual entity alignment method based on attribute weight updating network[J].Journal of Northwestern Polytechnical University,2024,42(1): 157-164.

[20] LIANG Y,CAI W S,YANG M H,et al.An unsupervised multi-view contrastive learning framework with attention-based reranking strategy for entity alignment[J].Neural Networks,2024,179: 106583.

[21] ZHU R B,MA M,WANG P.RAGA: relation-aware graph attention networks for global entity alignment[M]∥Advances in Knowledge Discovery and Data Mining.Cham: Springer International Publishing,2021: 501-513.