一种基于相似性预测的事件相关图构造方法技术

技术编号：41379542 阅读：7 留言：0更新日期：2024-05-20 10:22

本发明专利技术提供了一种基于相似性预测的事件相关图构造方法。本发明专利技术基于相似性预测任务背景，针对现有的常见概念关系图根据目标文本中的概念序列学习这些概念之间的时间信息可能会给相似性学习带来噪音的问题，设计了事件关系图表示方法，减少了噪声的干扰，从而进一步提升者相似性建模任务的精度。相似性预测在很多应用领域都有广泛的应用，包括搜索引擎、广告推荐、社交媒体分析等。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术基于相似性预测任务背景，针对现有的常见概念关系图根据目标文本中的概念序列学习这些概念之间的时间信息可能会给相似性学习带来噪音的问题，设计了事件关系图表示方法，减少了噪声的干扰，从而进一步提升者相似性建模任务的精度。相似性预测在很多应用领域都有广泛的应用，包括搜索引擎、广告推荐、社交媒体分析等。

技术介绍

1、相似性建模，当前采用的主流方法主要是基于深度学习(dl)的方法。这种技术通过整合目标文本中的数据信息，生成一个代表性的嵌入向量，用于衡量样本间的相似度。因此，构建出样本的准确且可靠的数据表示对于创建高效的相似度评价系统至关重要。当使用电子病历作为目标文本为时，目标文本中包含的众多概念往往是并列存在，如果仅仅依赖于这些概念的序列来学习它们之间的时间关系，可能会引入不必要的干扰信息。从实际操作的视角来看，目标文本中并列的概念往往代表了同一时间发生的事件，它们之间并不存在时间上的先后依赖。

2、研究人员经常从目标文本中提取相关的元素，并利用这些元素作为节点，依据它们之间存在的实际联系构建边，形成了一个知识图谱。接着，通过综合每个节点及其邻居节点的信息，能够增强特征表示，从而提升对样本相似度判断的精确度。然而，当前的方法有时会错误地将这些概念的出现顺序解读为时间上的依赖关系，这种误解可能会对样本相似性的准确预测造成干扰。

3、为了解决上述提到的问题，深入研究了目标文本的数据特点，提出一种有效降低时间噪声的方法。首先，依据预设的事件类别，从目标文本中抽取出各种事件。每一项事件都包括若干事件元素及一个核

技术实现思路

1、本专利技术基于相似性预测任务背景，提出了一种事件相关图表示法。本专利技术的实现共包括5个步骤：构建元素关系图，构建事件相关图，基于元素的特征聚合，基于事件的特征聚合，相似性预测。下面将对每个步骤进行详细讲解。

2、1.构建元素关系图

3、(1)元素关系图的基本构成

4、元素关系图是从目标文本中提取的，它显示了事件和事件元素之间的关系。令g1＝(v1,e1)表示事件的元素关系图，其中v1是元素节点和事件节点的集合，e1是节点间边的集合。

5、元素节点和事件节点的集合v1。根据目标文本的信息特征，定义事件节点和元素节点。在一个元素关系图中，有且仅有一个事件节点，有一个或多个元素节点。

6、节点间边的集合e1。事件节点和元素节点的关系仅有一种关系——isa关系。例如，边(ak,isa,vj)指的是元素节点ak是事件vj的一种元素。元素关系图由一个事件节点、几个元素节点以及它们之间的isa关系组成。

7、(2)元素关系图的构建方法

8、构建元素关系图共包括以下3个步骤：

9、①获得点集v1：利用事件提取(ee)技术来提取目标文本中的事件，获得点集v1。

10、②更新v1中的元素：如果一个事件元素有一个相邻的否定词语，则该元素会通过将否定词语和自身连接起来的方式进行更新。

11、③构造边集e1：建立每个元素节点与其对应事件节点之间的关系isa。

12、2.构建事件相关图

13、(1)事件相关图的基本构成

14、事件相关图是基于元素图构建的，它将不同类型的事件连接起来。与前人常用的实体关联图相比，事件相关图表示法以事件为基础对样本数据进行建模，有效减少了大量并列概念之间不存在的时间依赖关系所带来的噪声干扰。

15、令g2＝(v2,e2)表示样本的事件关系图，其中v2和e2分别是事件节点集和事件节点间的边集。

16、事件节点的集合v2。从已构建好的元素相关图中，提取对应的事件节点，可得到集合v2。

17、事件节点的关系的集合e2。事件节点的关系包括hasa关系和潜在时间关系。边(vi,hasa,vj)表示事件vi与事件vj有某种联系。

18、(2)事件相关图构建方法。

19、构建事件关系图共包括以下4个步骤：

20、①事件节点集v2，通过从已构建的元素关系图中提取事件节点来获得。

21、②计算两个事件之间的元素节点间相关强度。使用语料库级显著点式互信息(cpmi)是计算节点间相关强度的经典方法。记和分别为vi和vi中不同事件元素的表示形式，i和j分别是v2中不同事件的下标，m和n分别代表vi和vj中的第m个和第n个元素。具体如下所示：

22、

23、

24、

25、其中，f(,)和p(,)分别表示跨度受限节点对的频数和频率，f()和p()分别表示节点的频数和频率。v＝|vi|，表示vi所属的元素关系图的元素个数。跨度受限节点对的期望值为为两者以给定偏差被观察到的概率的上界，可使用hoeffding不等式计算得到。

26、③通过计算成对事件的事件元素间相关强度的平均值来获得事件节点间的关联得分，如(4)所示：

27、

28、其中，hasa表示事件对(vi,vj)的关联得分。每个事件，根据hasa分数，选取前t个最相关的事件(在我们的模型中，t＝4)，添加边(vi,hasa,vj)。据此得到边集e＝{(vi,hasa,vj),...(vn,hasa,vj)}。

29、④在事件相关图添加事件节点之间潜在的时间关系，这使得事件相关图包含更多有价值的信息。这些关系是抽象的，根据目标文本中提到的顺序来添加。

30、3.基于元素的特征聚合

31、基于元素的特征聚合旨在聚合每个元素关系图，以获得包含丰富特征信息的事件节点表示。为了充分利用事件元素生成包含丰富样本信息的事件表示，采用图卷积网络(gcn)和图注意力网络(gat)对于所有的医疗元素关系图g1进行基于元素的特征聚合。具体来说，gcn的一个层的形式是：

32、

33、其中，p0＝g1是gcn第一层的输入，relu()是非线性激活函数。为考虑自身信息的邻接矩阵,其中m为邻接矩阵，i为单位矩阵。d表示每个表征的维数。ok是第k层的权重矩阵。

34、一层gcn得到更新p1＝{p1,...,pl}，l是表征的总数。并使用p1作为作为gat的输入。gat的计算过程如(6)-(8)所示：

35、sij＝(wqpi)twkpj, (6)

36、

37、p′i＝σ(∑j∈{1,...l}βijwvpi), (8)

38、其中，wq,wk,wk分别表示自注意力机制中的查询矩阵、键矩阵和值矩本文档来自技高网...

【技术保护点】

1.一种基于相似性预测的事件相关图构造方法，其特征在于，包括以下步骤：

【技术特征摘要】

1.一种基于相似性预测的事件相关图构...

【专利技术属性】
技术研发人员：李建强，李振，竹志超，丁兴建，赵青，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人