一种生成定义词条的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:34327469 阅读:69 留言:0更新日期:2022-07-31 01:25
本申请提供了一种生成定义词条的方法、装置、电子设备和存储介质,其中,该方法包括:一种生成定义词条的方法,所述方法包括:从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;从数据库中筛选出用于解释所述待查询实体的描述文本;基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果。本申请实施例通过上述方法,能够提高词条生成效率。能够提高词条生成效率。能够提高词条生成效率。

【技术实现步骤摘要】
一种生成定义词条的方法、装置、电子设备和存储介质


[0001]本申请涉及数据查询
,具体而言,涉及一种生成定义词条的方法、装置、电子设备和存储介质。

技术介绍

[0002]词条是对各种概念、事物、现象及最新发现等概念的概括性解释,可以帮助人们对某一词汇进行快速理解。用户在不了解某个词汇或者某个短语时,通常是直接在查询框中输入待查询内容,得到跟该待查询内容相关的解释和定义。
[0003]专利技术人在研究中发现,现有技术通常是针对用户询问的每个词汇、文本、问题,都需要由人工构建和编辑,构建精度取决于编辑人的知识储备、构建时间和更新时间取决于人工是否看到该问题,若没有人看到,或是看到之后不想回答,则该待查询内容会长时间无法得到回复,因此词条生成效率较低。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种生成定义词条的方法、装置、电子设备和存储介质,以提高词条的生成效率。
[0005]第一方面,本申请实施例提供了一种生成定义词条的方法,所述方法包括:
[0006]从用户输入的待查询内容中提取待查询本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种生成定义词条的方法,其特征在于,所述方法包括:从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;所述描述词基于所述待查询实体指向查询结果;从数据库中筛选出用于解释所述待查询实体的描述文本;基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;所述第一属性表征所述待查询实体的特征,所述第二属性表征所述待查询实体与第一实体之间关联关系;所述限定作用是对所述描述词进行语义分析之后得到的;根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果;所述属性为所述第一属性,或者所述第二属性。2.根据权利要求1所述的方法,其特征在于,从数据库中筛选出用于解释所述待查询实体的描述文本,包括:根据所述数据库中预先存储的所述待查询实体与目标词汇的对应关系,从所述数据库中确定包含所述目标词汇的目标文本;针对每个所述目标词汇,根据所述目标词汇在所述目标文本中的出现频率、所述目标词汇对应的第二实体在所述目标文本中的特征,计算所述目标文本与所述待查询实体之间的相关度数值;若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本。3.根据权利要求2所述的方法,其特征在于,从所述数据库中确定包含所述目标词汇的目标文本,包括:从所述数据库中确定包含所述目标词汇的至少一个目标段落;通过预先训练好的识别模型识别所述目标段落中是否存在目标内容;所述目标内容用于:解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系;将包含所述目标内容的文本确定为所述目标文本。4.根据权利要求2所述的方法,其特征在于,在若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本之前,所述方法还包括:针对每个目标文本,获取发表所述目标文本的平台的权威等级、所述目标文本的被引用次数;根据所述权威等级和所述被引用次数,确定所述目标文本的质量数值;根据所述质量数值,调整所述相关度数值。5.根据权利要求1所述的方法,其特征在于,在从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词之后,所述方法还包括:从所述数据库中查找是否存在所述待查询实体的原始定义词条;若存在所述原始定义词条,且所述原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔大于预设数值,则获取用于生成所述原始定...

【专利技术属性】
技术研发人员:杨万征蔡超
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1