This specification provides an event detection model, method, device, computing device and storage medium, in which event detection methods include: calling an event detection model for calculating the similarity of two event text input; calculating the similarity between input text and multiple event template text in the event template library through the event detection model, and obtaining the input text. The most similar event template text and the corresponding event type, in which the event template library is generated according to the event type and the event sample corresponding to the event type. The event template library contains the event sample used as the event template text, and each event template text has the corresponding event type.
【技术实现步骤摘要】
事件检测模型、方法、装置、计算设备及存储介质
本说明书涉及事件检测
,特别涉及一种生成事件检测模型的方法和装置、事件检测方法和装置、计算设备及计算机可读存储介质。
技术介绍
现有技术中事件检测(EventDetection,ED)应用场景非常广泛,其目标是识别出输入文本中我们关心的关键事件,用于进一步的分析。比如在金融风控领域,我们可以通过检测”公司股权转让事件”来分析公司经营情况和策略。目前的事件检测技术用户体验较差。
技术实现思路
有鉴于此,本说明书实施例提供了一种生成事件检测模型的方法和装置、事件检测方法和装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件文本的相似度的。根据本说明书实施例的第二方面,提供了一种事件检测方法,包括:调用所述事件检测模型;通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型;输出与所述输入文本相似度最高的事件模版文本及对应的事件类型。根据本说明书实施例的第三方面,提供了一种生成事件检测模型 ...
【技术保护点】
1.一种生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记,若所述事件样本组中的两个事件样本为同一事件类型,所述事件样本组的匹配标记被记为第一标记值;若所述事件样本组中的两个事件样本为不同事件类型,所述事件样本组的匹配标记被记为第二标记值,所述第二标记值与所述第一标记值不同;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件的相似度的。
【技术特征摘要】
1.一种生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记,若所述事件样本组中的两个事件样本为同一事件类型,所述事件样本组的匹配标记被记为第一标记值;若所述事件样本组中的两个事件样本为不同事件类型,所述事件样本组的匹配标记被记为第二标记值,所述第二标记值与所述第一标记值不同;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件的相似度的。2.根据权利要求1所述的方法,其中所述事件样本组通过将各所述事件类型对应的事件样本进行两两组合得到。3.根据权利要求1所述的方法,其中所述事件检测模型通过具有注意力机制的深度神经网络生成。4.一种事件检测方法,包括:调用权利要求1-3任一项所述的事件检测模型;通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型;输出与所述输入文本相似度最高的事件模版文本及对应的事件类型。5.根据权利要求4所述的方法,还包括:向所述事件模板库中添加自定义事件类型及对应的事件模版文本。6.根据权利要求4所述的方法,其中所述多个事件模版文本为所述事件模版库中事件模版文本的全量。7.根据权利要求4所述的方法,其中当所述事件模版库中事件模版文本的数量超过设定值时,将所述输入文本包含的至少一个关键词作为触发词,从所述事件模版库中选取包含所述触发词的事件模版文本得到所述多个事件模版文本。8.根据权利要求4所述的方法,其中当所述事件模版库中事件模版文本的数量超过设定值时,根据语句相似度过滤方法,从所述事件模版库中选取与所述输入文本语义最相似的前n个事件模版文本得到所述多个事件模版文本,n为自然数。9.根据权利要求4所述的方法,其中所述通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度步骤包括:通过分词方式将输入文本q和事件模版文本t分别转化成由词向量构成的向量形式;对于q中的词x对应的词向量Wqx,采用t对应的所有词向量进行注意力机制计算,得到注意力向量Wqx_att;对于t中的词y对应的词向量Wty,采用q对应的所有词向量进行注意力机制计算,得到注意力向量Wty_att;对q中的词x,将其对应的词向量Wqx和注意力向量Wqx_att进行拼接得到x对应的拼接向量,以及对t中的词y,将其对应的词向量Wty和注意力向量Wty_att进行拼接得到y对应的拼接向量;将q中所有词对应的拼接向量进行对应维度加和得到输入文本向量,将t中所有词对应的拼接向量进行对应维度加和得到事件模版文本向量,并将所述输入文本向量和所述事件模版文本向量进行拼接,得到联接向量;通过提取所述联接向量的特征计算相似度。10.根据权利要求9所述的方法,其中对于q中的词x对应的词向量Wqx,采用t对应的所有词向量计算注意力向量Wqx_att的公式为:其中,函数Z(Wqx,t)计算得到注意力向量Wqx_att,m为t中词的数量,sk为权值。11.根据权利要求9所述的方法,其中在所述通过分词方式将输入文本q和事件模版文本t分别转化成由词向量构成的向量形式步骤之后、所述对于q中的词x对应的词向量Wqx,采用t对应的所有词向量进行注意力机制计算,得到注意力向量Wqx_att之前还包括:将q对应的词向量形式的长度和q对应的词向量形式的长度分别调整至预设标准长度。12.根据权利要求4所述的方法,其中在所述通过所述事件检测模型计算输入文本与事件模版库中多个事件...
【专利技术属性】
技术研发人员:陈若田,温祖杰,张家兴,郭奔宇,周芸,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。