关键词的命中确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39313414 阅读:8 留言:0更新日期:2023-11-12 15:58
本申请公开了一种基于关键词的命中确定方法、装置、电子设备及存储介质该方法包括:获取待检测段落,并对所述待检测段落进行分词处理得到多个关键词;确定所述多个关键词各自对应的词性,并基于所述多个关键词各自对应的词性在所述多个关键词中确定定位关键词;根据所述定位关键词在待检测文本中进行查找,确定所述定位关键词在所述待检测文本中的位置;根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息。本申请通过确定定位关键词并通过定位关键词在待检测文本中的位置来确定命中信息,提高命中信息的确定范围,使得命中信息更加准确和全面。使得命中信息更加准确和全面。使得命中信息更加准确和全面。

【技术实现步骤摘要】
关键词的命中确定方法、装置、电子设备及存储介质


[0001]本申请涉及文字信息处理
,更具体地,涉及一种关键词的命中确定方法、装置、电子设备及存储介质。

技术介绍

[0002]随着科学及信息化技术的发展,每年出现大量的文本数据,为了能够更好地从这些大量的文本数据中获取到有用信息,可通过关键词查找的方法来确定是否有关注的关键词。而目前的关键词查找方法由于关键词设置不合理等问题导致关键词的查找不够准确,如何提高关键词在待检测文本中的命中准确率成为亟待解决的问题。

技术实现思路

[0003]鉴于上述问题,本申请实施例提出了一种关键词的命中确定方法、装置、电子设备及存储介质,以改善上述问题。
[0004]第一方面,本申请实施例提供了一种关键词的命中确定方法,所述方法包括:获取待检测段落,并对所述待检测段落进行分词处理得到多个关键词;确定所述多个关键词各自对应的词性,并基于所述多个关键词各自对应的词性在所述多个关键词中确定定位关键词;根据所述定位关键词在待检测文本中进行查找,确定所述定位关键词在所述待检测文本中的位置;根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息。
[0005]第二方面,本申请实施例提供了一种关键词的命中确定装置,所述装置包括:待检测段落获取模块,用于获取待检测段落,并对所述待检测段落进行分词处理得到多个关键词;定位关键词确定模块,用于确定所述多个关键词各自对应的词性,并基于所述多个关键词各自对应的词性在所述多个关键词中确定定位关键词;位置确定模块,用于根据所述定位关键词在待检测文本中进行查找,确定所述定位关键词在所述待检测文本中的位置;命中信息确定模块,用于根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息。
[0006]在一些实施例中,目标置信度确定模块包括:预设置信度获取子模块,用于获取所述至少两种传感数据各自对应的预设置信度;目标置信度确定子模块,用于基于所述车辆所处的当前环境对所述至少两种传感数据各自对应的预设置信度进行调整,获得所述至少两种传感数据各自对应的目标置信度。
[0007]在一些实施例中,所述命中信息确定模块包括:关键词长度确定子模块,用于确定所述多个关键词对应的关键词长度;查找距离确定子模块,用于根据所述关键词长度和预设容错距离确定查找距离;命中信息确定子模块,用于根据所述位置和所述查找距离,在所述待检测文本中确定与所述多个关键词对应的命中信息。
[0008]在一些实施例中,所述命中信息确定子模块包括:候选文本确定单元,用于根据所述位置和所述查找距离,在所述待检测文本中确定与所述查找距离对应的候选文本;相似
度确定单元,用于确定所述多个关键词和所述候选文本的相似度;第一命中信息确定单元,用于若所述相似度大于或等于相似度阈值,则生成第一命中信息,所述第一命中信息用于指示在所述待检测文本中命中的所述关键词的位置;第二命中信息确定单元,用于若所述相似度小于所述相似度阈值,则生成第二命中信息,所述第二命中信息用于指示在所述待检测文本中没有命中的关键词。
[0009]在一些实施例中,所述相似度确定单元包括:多个参考词确定子单元,用于在所述候选文本中确定与所述多个关键词具有相同词性的多个参考词;判断子单元,用于在预设词典中确定所述多个参考词与各自对应的所述关键词是否为近义词;相似度确定子单元,用于若所述多个参考词与各自对应的所述关键词为近义词,则计算所述多个关键词与所述多个参考词的相似度,并将所述相似度作为所述多个关键词和所述候选文本的相似度。
[0010]在一些实施例中,所述候选文本确定单元包括:内容确定子单元,用于根据所述位置和所述查找距离,在所述待检测文本中确定所述定位关键词之前的所述查找距离内的内容和所述定位关键词之后的所述查找距离内的内容;候选文本确定子单元,用于将所述定位关键词之前的所述查找距离内的内容和所述定位关键词之后的所述查找距离内的内容确定为所述候选文本,
[0011]在一些实施例中,所述定位关键词确定模块包括:词性确定子模块,用于确定所述多个关键词各自对应的词性;比较子模块,用于按照所述多个关键词的排列顺序,将所述多个关键词各自对应的词性依次与预设词性进行比较;定位关键词确定子模块,用于从所述多个关键词中确定对应的词性与所述预设词性相同的关键词,并将对应的词性与预设词性相同的关键词确定为所述定位关键词。
[0012]在一些实施例中,所述定位关键词为所述多个关键词中第一个对应的词性与所述预设词性相同的关键词。
[0013]第三方面,本申请实施例提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述的关键词的命中确定方法。
[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述的关键词的命中确定方法。
[0015]在本申请的方案中,先对待检测段落进行分词处理,以此来确定待检测段落中的多个关键词,然后确定多个关键词各自对应的词性,进而能够基于多个关键词各自对应的词性在多个关键词中确定定位关键词,以此能够根据定位关键词在待检测文本中进行查找来确定定位关键词在待检测文本中的位置,最后根据定位关键词在待检测文本中的位置在待检测文本确定多个关键词的命中信息。本申请能够通过多待检测段落进行分词来将待检测段落拆分为多个词汇来避免关键词设置不合理导致命中信息的确定不够准确的问题,并且通过确定定位关键词并通过定位关键词在待检测文本中的位置来确定命中信息,提高命中信息的确定范围,使得命中信息更加准确和全面。
[0016]应当理解的是,以上的一般描述和后文细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0017]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是根据本申请一实施例示出的关键词的命中确定方法的流程示意图。
[0019]图2是根据本申请另一实施例示出的关键词的命中确定方法的流程示意图。
[0020]图3是根据本申请一实施例示出的步骤260的具体步骤流程示意图。
[0021]图4是根据本申请一实施例示出的在待检测文本中确定候选文本的示意图。
[0022]图5是根据本申请一实施例示出的步骤320的具体步骤流程示意图。
[0023]图6是根据本申请又一实施例示出的关键词的命中确定方法的流程示意图。
[0024]图7是根据本申请一实施例示出的关键词的命中确定装置的框图。
[0025]图8是根据本申请一实施例示出的电子设备的硬件结构图。
[0026]通过上述附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关键词的命中确定方法,其特征在于,所述方法包括:获取待检测段落,并对所述待检测段落进行分词处理得到多个关键词;确定所述多个关键词各自对应的词性,并基于所述多个关键词各自对应的词性在所述多个关键词中确定定位关键词;根据所述定位关键词在待检测文本中进行查找,确定所述定位关键词在所述待检测文本中的位置;根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述位置和所述多个关键词,在所述待检测文本中确定与所述多个关键词对应的命中信息,包括:确定所述多个关键词对应的关键词长度;根据所述关键词长度和预设容错距离确定查找距离;根据所述位置和所述查找距离,在所述待检测文本中确定与所述多个关键词对应的命中信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述位置和所述查找距离,在待检测文本中确定与所述多个关键词对应的命中信息,包括:根据所述位置和所述查找距离,在所述待检测文本中确定与所述查找距离对应的候选文本;确定所述多个关键词和所述候选文本的相似度;若所述相似度大于或等于相似度阈值,则生成第一命中信息,所述第一命中信息用于指示在所述待检测文本中命中的所述关键词的位置;若所述相似度小于所述相似度阈值,则生成第二命中信息,所述第二命中信息用于指示在所述待检测文本中没有命中的关键词。4.根据权利要求3所述的方法,其特征在于,所述确定所述多个关键词和所述候选文本的相似度,包括:在所述候选文本中确定与所述多个关键词具有相同词性的多个参考词;在预设词典中确定所述多个参考词与各自对应的所述关键词是否为近义词;若所述多个参考词与各自对应的所述关键词为近义词,则计算所述多个关键词与所述多个参考词的相似度,并将所述相似度作为所述多个关键词和所述候选文本的相似度。5.根据权利要求3所述的方法,其特征在于,所述根据所述位置和所述查找距离,在待检...

【专利技术属性】
技术研发人员:彭子娇张伟彬陈东鹏李亚桐
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1