【技术实现步骤摘要】
事件检索方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术,特别涉及事件检索方法、装置、计算机设备及存储介质。
技术介绍
在有些场景下,会需要进行事件检索,如根据用户提供的或文本中出现的事件描述,从事件库中检索出对应的事件(相同事件),以方便进行文本理解或信息推荐等。事件是一种特殊的实体,它客观存在,但又不同于普通的实体,更加复杂,描述也更加多样,两个相同事件的事件描述可能有很大区别,而两个不同事件的事件描述又可能非常相似。鉴于上述问题,如何根据事件描述来进行事件检索,目前还没有一种较好的实现方式。
技术实现思路
有鉴于此,本专利技术提供了事件检索方法、装置、计算机设备及存储介质。具体技术方案如下:一种事件检索方法,包括:训练得到用于识别两个事件描述是否对应同一事件的识别模型;基于所述识别模型形成事件向量抽取服务,所述事件向量表示所述识别模型对于事件描述的理解;根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。根 ...
【技术保护点】
1.一种事件检索方法,其特征在于,包括:训练得到用于识别两个事件描述是否对应同一事件的识别模型;基于所述识别模型形成事件向量抽取服务,所述事件向量表示所述识别模型对于事件描述的理解;根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。
【技术特征摘要】
1.一种事件检索方法,其特征在于,包括:训练得到用于识别两个事件描述是否对应同一事件的识别模型;基于所述识别模型形成事件向量抽取服务,所述事件向量表示所述识别模型对于事件描述的理解;根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。2.根据权利要求1所述的方法,其特征在于,所述训练得到用于识别两个事件描述是否对应同一事件的识别模型包括:构建作为训练样本的正样本和负样本,其中,所述正样本中包含对应于同一事件的两个事件描述,所述负样本中包含对应于不同事件的两个事件描述;根据所述正样本和所述负样本训练得到所述识别模型。3.根据权利要求2所述的方法,其特征在于,所述构建作为训练样本的正样本和负样本包括:从指定数据源抽取事件描述;根据抽取出的事件描述构建所述正样本和所述负样本。4.根据权利要求1所述的方法,其特征在于,所述识别模型包括:基于转换器双向编码器特征BERT的微调fine-tune模型。5.根据权利要求4所述的方法,其特征在于,所述事件向量抽取服务包括:当向所述识别模型输入一个事件描述时,抽取所述识别模型中所述事件描述的最后一层句子分隔符[SEP]向量,作为所述事件描述对应的事件向量。6.根据权利要求1所述的方法,其特征在于,所述根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件包括:基于近似最近邻ANN工具,确定出所述事件库中的事件的事件描述对应的事件向量中、与所述待检索的事件描述对应的事件向量相匹配的事件向量,将相匹配的事件向量对应的事件作为与所述待检索的事件描述相匹配的事件。7.一种事件检索装置,其特征在于,包括:模型训练单元、服务生成单元以及事件检索单元;所述模型训练单元,用于训练得到用于识别两个事件描述是否对应...
【专利技术属性】
技术研发人员:陈玉光,韩翠云,潘禄,刘远圳,施茜,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。