事件检测模型、方法、装置、计算设备及存储介质制造方法及图纸

技术编号:20119137 阅读:43 留言:0更新日期:2019-01-16 12:18
本说明书提供一种事件检测模型、方法、装置、计算设备及存储介质,其中事件检测方法包括:调用用来计算输入的两个事件文本的相似度的事件检测模型;通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,得到与所述输入文本最相似的事件模版文本及对应的事件类型,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型。

Event Detection Model, Method, Device, Computing Equipment and Storage Media

This specification provides an event detection model, method, device, computing device and storage medium, in which event detection methods include: calling an event detection model for calculating the similarity of two event text input; calculating the similarity between input text and multiple event template text in the event template library through the event detection model, and obtaining the input text. The most similar event template text and the corresponding event type, in which the event template library is generated according to the event type and the event sample corresponding to the event type. The event template library contains the event sample used as the event template text, and each event template text has the corresponding event type.

【技术实现步骤摘要】
事件检测模型、方法、装置、计算设备及存储介质
本说明书涉及事件检测
,特别涉及一种生成事件检测模型的方法和装置、事件检测方法和装置、计算设备及计算机可读存储介质。
技术介绍
现有技术中事件检测(EventDetection,ED)应用场景非常广泛,其目标是识别出输入文本中我们关心的关键事件,用于进一步的分析。比如在金融风控领域,我们可以通过检测”公司股权转让事件”来分析公司经营情况和策略。目前的事件检测技术用户体验较差。
技术实现思路
有鉴于此,本说明书实施例提供了一种生成事件检测模型的方法和装置、事件检测方法和装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件文本的相似度的。根据本说明书实施例的第二方面,提供了一种事件检测方法,包括:调用所述事件检测模型;通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型;输出与所述输入文本相似度最高的事件模版文本及对应的事件类型。根据本说明书实施例的第三方面,提供了一种生成事件检测模型的装置,包括:训练样本生成器,被配置为根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记,若所述事件样本组中的两个事件样本为同一事件类型,所述事件样本组的匹配标记被记为第一标记值;若所述事件样本组中的两个事件样本为不同事件类型,所述事件样本组的匹配标记被记为第二标记值,所述第二标记值与所述第一标记值不同;模型生成器,被配置为通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件文本的相似度的。根据本说明书实施例的第四方面,提供了一种事件检测装置,包括:模型调用器,被配置为调用所述事件检测模型;相似度计算器,被配置为通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型;输出器,被配置为输出与所述输入文本相似度最高的事件模版文本及对应的事件类型。根据本说明书实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述的生成事件检测模型的方法的步骤。根据本说明书实施例的第六方面,提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述的事件检测方法的步骤。根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述生成事件检测模型的方法的步骤。根据本说明书实施例的第八方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述事件检测方法的步骤。本说明书的实施例提供了一种事件检测方案,通过将已标注事件类型的原始事件样本集中的事件样本两两组合生成训练样本集,基于少量已标注事件类型的事件样本可以生成大量的训练样本(例如,原始事件样本集中有N(N为自然数)个事件样本,通过两两组合最多可以产生N*(N-1)组训练样本,这样,对于许多新兴场景或处于业务初期的使用场景,在可用于事件识别模型训练的样本量非常小(样本搜集困难或成本较高)时,可以基于小量的已知事件类型的样本快速生成大量的训练样本,进而利用生成大量的训练样本对模型进行训练,从而提高了所训练模型对事件检测的准确率。附图说明图1是示出了根据本说明书一实施例提供的事件检测方法的系统架构图;图2是示出了根据本说明书一实施例提供的生成事件检测模型的方法的示意性流程图;图3是示出了根据本说明书一实施例提供的事件检测方法的示意性流程图;图4是示出了本说明书实施例提供的事件检测模型的建模和应用示意性流程图;图5是示出了本说明书一实施例提供的事件检测系统的模块图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。在本说明书中,提供了一种生成事件检测模型的方法和装置、事件检测方法和装置、计算设备及计算机可读存储介质,在下面的实施例中逐一进行详细说明。参见图1,本说明书一个或多个实施例提供的事件检测方法的系统架构图,包括网络102、数据库104、用户设备106和计算设备100。所述计算设备100包括但不限于存储器110、处理器112、通信接口114以及总线116。所述网络102分别与所述用户设备106完成相互间的通信,所述网络102与计算设备100通过通信接口114完成相互间的通信,所述数据库104与计算设备100通过通信接口114完成相互间的通信。所述处理器112、所述通信接口114和存储器110通过总线116完成相互间的通信。所述用户设备106,被配置为提供样本数据。网络102,被配置为为用户设备106提供传送样本数据的通道。数据库104,被配置为存储样本数据。通信接口114,被配置为接收网络102和/或数据库104中的样本数据,然后将所述样本数据通过总线116存储至存储器110。通信接口114使得计算设备100能够经由一个或多个网络通信。这些网络的示例包括局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。网络接口可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。存储器110,被配置为存储通信接口114通过总线116发送的样本数据以及存储在存储器110上并可在处理器112上运行的计算机指令。计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。处理器112,被配置为获取存储在存储器110的样本数据后,执行存储在存储器110上的计算机指令,实现事件检测方法的相关步骤。其中,处理器112可以执行图2所示方法中的步骤。图2是本文档来自技高网...

【技术保护点】
1.一种生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记,若所述事件样本组中的两个事件样本为同一事件类型,所述事件样本组的匹配标记被记为第一标记值;若所述事件样本组中的两个事件样本为不同事件类型,所述事件样本组的匹配标记被记为第二标记值,所述第二标记值与所述第一标记值不同;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件的相似度的。

【技术特征摘要】
1.一种生成事件检测模型的方法,包括:根据事件类型及所述事件类型对应的事件样本生成训练样本集,其中,所述训练样本集包含多个事件样本组,每个所述事件样本组包含两个事件样本,每个所述事件样本组对应一个事件类型匹配标记,若所述事件样本组中的两个事件样本为同一事件类型,所述事件样本组的匹配标记被记为第一标记值;若所述事件样本组中的两个事件样本为不同事件类型,所述事件样本组的匹配标记被记为第二标记值,所述第二标记值与所述第一标记值不同;通过所述训练样本集对事件检测模型进行训练,得到所述事件检测模型,所述事件检测模型用来计算输入的两个事件的相似度的。2.根据权利要求1所述的方法,其中所述事件样本组通过将各所述事件类型对应的事件样本进行两两组合得到。3.根据权利要求1所述的方法,其中所述事件检测模型通过具有注意力机制的深度神经网络生成。4.一种事件检测方法,包括:调用权利要求1-3任一项所述的事件检测模型;通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度,其中,所述事件模版库根据事件类型及所述事件类型对应的事件样本生成,所述事件模版库包含用作所述事件模版文本的事件样本,每个所述事件模版文本具有对应的事件类型;输出与所述输入文本相似度最高的事件模版文本及对应的事件类型。5.根据权利要求4所述的方法,还包括:向所述事件模板库中添加自定义事件类型及对应的事件模版文本。6.根据权利要求4所述的方法,其中所述多个事件模版文本为所述事件模版库中事件模版文本的全量。7.根据权利要求4所述的方法,其中当所述事件模版库中事件模版文本的数量超过设定值时,将所述输入文本包含的至少一个关键词作为触发词,从所述事件模版库中选取包含所述触发词的事件模版文本得到所述多个事件模版文本。8.根据权利要求4所述的方法,其中当所述事件模版库中事件模版文本的数量超过设定值时,根据语句相似度过滤方法,从所述事件模版库中选取与所述输入文本语义最相似的前n个事件模版文本得到所述多个事件模版文本,n为自然数。9.根据权利要求4所述的方法,其中所述通过所述事件检测模型计算输入文本与事件模版库中多个事件模版文本之间的相似度步骤包括:通过分词方式将输入文本q和事件模版文本t分别转化成由词向量构成的向量形式;对于q中的词x对应的词向量Wqx,采用t对应的所有词向量进行注意力机制计算,得到注意力向量Wqx_att;对于t中的词y对应的词向量Wty,采用q对应的所有词向量进行注意力机制计算,得到注意力向量Wty_att;对q中的词x,将其对应的词向量Wqx和注意力向量Wqx_att进行拼接得到x对应的拼接向量,以及对t中的词y,将其对应的词向量Wty和注意力向量Wty_att进行拼接得到y对应的拼接向量;将q中所有词对应的拼接向量进行对应维度加和得到输入文本向量,将t中所有词对应的拼接向量进行对应维度加和得到事件模版文本向量,并将所述输入文本向量和所述事件模版文本向量进行拼接,得到联接向量;通过提取所述联接向量的特征计算相似度。10.根据权利要求9所述的方法,其中对于q中的词x对应的词向量Wqx,采用t对应的所有词向量计算注意力向量Wqx_att的公式为:其中,函数Z(Wqx,t)计算得到注意力向量Wqx_att,m为t中词的数量,sk为权值。11.根据权利要求9所述的方法,其中在所述通过分词方式将输入文本q和事件模版文本t分别转化成由词向量构成的向量形式步骤之后、所述对于q中的词x对应的词向量Wqx,采用t对应的所有词向量进行注意力机制计算,得到注意力向量Wqx_att之前还包括:将q对应的词向量形式的长度和q对应的词向量形式的长度分别调整至预设标准长度。12.根据权利要求4所述的方法,其中在所述通过所述事件检测模型计算输入文本与事件模版库中多个事件...

【专利技术属性】
技术研发人员:陈若田温祖杰张家兴郭奔宇周芸
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1