一种事件识别的方法、模型训练的方法、设备及存储介质技术

技术编号:22055279 阅读:40 留言:0更新日期:2019-09-07 15:15
本申请公开了一种事件识别的方法,包括:获取用于识别目标事件所属类型的目标语句;基于事件识别模型处理目标语句,以得到目标事件的类型,其中,事件识别模型用于通过目标语句中的触发词和触发词的上下文词语确定目标事件的类型,触发词用于指示目标事件的备选类型,备选类型包括目标事件的类型;输出目标事件的类型。本申请技术方案由于在事件识别过程中结合触发词和触发词的上下文词语进行识别,采用这种词分类的方法进行事件识别,不仅可以提高识别效率,而且结合上下文词语进行识别,可以提高事件识别的准确度。

An Event Recognition Method, Model Training Method, Equipment and Storage Media

【技术实现步骤摘要】
一种事件识别的方法、模型训练的方法、设备及存储介质
本申请涉及语音处理
,具体涉及一种事件识别的方法、事件识别模型训练的方法、设备及计算机可读存储介质。
技术介绍
在网络发达的今天,人们对于新闻阅读的需求早已从传统纸媒转移到了网络媒体。在大型网络媒体门户如腾讯、网易、新浪上发布的新闻,都具有发布总量大、更新频率高、阅读用户人数多、读者分布广等特点。对于单个用户而言,都希望能读到自己感兴趣的新闻事件。对此,各个网络媒体门户运营商也各出奇招,例如:通过用户的浏览记录来做后续的新闻推荐。无论是哪种方式的推荐,都需要后台设备先识别新闻事件的内容才能推荐给相应的用户,当前的新闻事件识别方式主要是通过模式匹配的方式进行识别,模式匹配的识别方式就是给定一段内容,然后从大量数据中去找与该一段内容相同的内容,由此可见,模式匹配的识别方式可移植性差,在每分钟都有可能产生海量新闻事件的情况下,事件识别的效率低下。
技术实现思路
本申请实施例提供一种事件识别的方法,可以高效准确的识别出各种类型的事件。本申请实施例还提供了相应事件识别模型训练的方法、设备及计算机可读存储介质。本申请实施例第一方面提供一种事件本文档来自技高网...

【技术保护点】
1.一种事件识别的方法,其特征在于,包括:获取用于识别目标事件所属类型的目标语句;基于事件识别模型处理所述目标语句,以得到所述目标事件的类型,其中,所述事件识别模型用于通过所述目标语句中的触发词和所述触发词的上下文词语确定所述目标事件的类型,所述触发词用于指示所述目标事件的备选类型,所述备选类型包括所述目标事件的类型;输出所述目标事件的类型。

【技术特征摘要】
1.一种事件识别的方法,其特征在于,包括:获取用于识别目标事件所属类型的目标语句;基于事件识别模型处理所述目标语句,以得到所述目标事件的类型,其中,所述事件识别模型用于通过所述目标语句中的触发词和所述触发词的上下文词语确定所述目标事件的类型,所述触发词用于指示所述目标事件的备选类型,所述备选类型包括所述目标事件的类型;输出所述目标事件的类型。2.根据权利要求1所述的方法,其特征在于,所述基于事件识别模型处理所述目标语句,以得到所述目标事件的类型,包括:对所述目标语句进行预处理,以得到所述目标语句中的每个词语;对所述每个词语进行向量转换处理,以得到所述每个词语的输入层向量;根据所述每个词语的输入层向量,确定所述目标事件的类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个词语的输入层向量,确定所述目标事件的类型,包括:将所述每个词语的输入层向量转换为隐藏层向量,所述每个词语包括第一词语,所述第一词语为所述每个词语中的任一词语;将所述第一词语作为触发词时,根据每个第二词语的隐藏层向量、所述第一词语的隐藏层向量以及任意一个第二词语的隐藏层向量,确定所述任意一个第二词语的关注度权重,所述第二词语为除所述第一词语之外的词语;根据每个第二词语的输入层向量和所述每个第二词语的关注度权重确定所述第一词语的上下文向量;根据所述第一词语的上下文向量和所述第一词语的输入层向量,确定所述目标事件的类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一词语的上下文向量和所述第一词语的输入层向量,确定所述目标事件的类型,包括:根据所述第一词语的上下文向量、所述第一词语的输入层向量与所述事件识别模型的参数,确定所述第一词语为所述触发词时,所述目标事件属于每个备选类型的置信度;根据所述目标事件属于所述每个备选类型的置信度,确定所述目标事件的类型。5.根据权利要求2-4任一所述的方法,其特征在于,所述对所述目标语句进行预处理,以得到所述目标语句中的每个词语,包括:识别出所述目标语句中的命名实体,所述命名实体为所述目标事件中的参与对象;对所述命名实体进行匿名化处理;将匿名化处理后的所述目标语句划分为词序列,以得到所述目标语句中的每个词语。6.根据权利要求1所述的方法,其特征在于,所述基于事件识别模型处理所述目标语句,以得到所述目标事件的类型,包括:对所述目标语句进行预处理,以得到所述目标语句中的每个词语;确定所述目标语句中属于触发词的第一词语;根据所述第一词语所对应的备选类型,以及第二词语确定所述目标事件的类型,所述第二词语为所述第一词语的上下文词语。7.一种事件识别模型训练的方法,其特征在于,包括:获取用于模型训练的样本集合,所述样本集合中包括多个样本事件各自对应的样本语句和所述多个样本事件各自的类型,每个样本语句中包括触发词和所述触发词的上下文词语;根据所述每个样本语句训练第一事件识别模型,以得到第二事件识别模型,所述第二事件识别模型用于通过目标语句中的触发词和所述目标语句中的触发词的上下文词语确定目标事件的类型,所述目标语句为用于识别目标事件所属类型的语句。8.根据权利要求7所述的方法,其特征在于,所述根据所述每个样本语句训练第一事件识别模型,以得到第二事件识别模型,包括:对第一样本语句进行预处理,以得到所述第...

【专利技术属性】
技术研发人员:刘树林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1