用于获取相似文本的方法、装置及电子装置制造方法及图纸

技术编号:39178056 阅读:8 留言:0更新日期:2023-10-27 08:25
本申请公开了一种用于获取相似文本的方法、装置及电子装置,涉及智慧家庭技术领域,该方法包括:首先基于用户输入的输入文本,对知识文本集合中的每个知识文本,均确定出其与输入文本之间的文本相似度和特征词相似度,并最终根据文本相似度和特征词相似度确定出目标知识文本。这样,在进行目标知识文本的筛选过程中,同时考虑了语句整体的文本相似度以及提取出的特征词的相似度,相比于仅考虑文本相似度或者仅考虑特征词相似度的方法,能够确定出与用于语义更匹配的文本,提升了相似文本筛选的准确性。的准确性。的准确性。

【技术实现步骤摘要】
用于获取相似文本的方法、装置及电子装置


[0001]本申请涉及智慧家庭领域,具体而言,涉及一种用于获取相似文本的方法、装置及电子装置。

技术介绍

[0002]知识问答系统是基于用户输入的自然语言问句,通过知识检索(语义检索)的方式,自动给出针对用户问题的答案,目前广泛应用于各个领域,例如智能家居领域。知识问答系统的效果很大程度依赖于知识检索结果的准确性。
[0003]知识检索(语义检索)是通过理解搜索者或者用户查询中的文本语言来理解其搜索的意图,并通过逻辑处理返回用户查找的个性化、多元结果信息。现有的知识检索方法,可以对输入请求的文本进行相似检索,返回用户所需的答案
[0004]在实现本申请实施例的过程中,发现相关技术中至少存在如下问题:
[0005]现有的知识检索方法往往存在准确性不高的问题,尤其是检索返回的前几条数据不能够精确匹配用户所提出的问题。
[0006]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0007]为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
[0008]本申请实施例提供了一种用于获取相似文本的方法、装置及电子装置,以提高检索结果与问题的匹配程度,进而提高检索结果准确性。
[0009]在一些实施例中,所述方法包括:、确定知识文本集合中的每个知识文本与输入文本之间的文本相似度;其中,输入文本为用户输入的查询对应的文本;确定输入文本包含的特征词与每个知识文本中包含的特征词之间的特征词相似度;根据文本相似度和特征词相似度,从知识文本集合中确定出满足预设要求的目标知识文本。
[0010]可选地,确定知识文本集合中的每个知识文本与输入文本之间的文本相似度,包括:确定每个知识文本与输入文本之间的原始相似度;根据预设词语集合,确定每个知识文本与输入文本之间的关键文本相似度;其中,关键文本相似度用于表征每个知识文本与输入文本去除预设词语集合后的相似度;根据原始相似度和关键文本相似度,确定知识文本集合中的每个知识文本与输入文本之间的文本相似度。
[0011]可选地,预设词语集合为预设停顿词集合;根据预设词语集合,确定每个知识文本与输入文本之间的关键文本相似度,包括:从所有知识文本和输入文本中去除预设停顿词集合;计算去除预设停顿词集合后的知识文本和输入文本之间的关键文本相似度。
[0012]可选地,确定输入文本包含的特征词与每个知识文本中包含的特征词之间的特征
词相似度,包括:根据预设词性,从输入文本和每个知识文本中提取出特征词集合;计算特征词集合中所有特征词之间的特征词相似度。
[0013]可选地,根据预设词性,从输入文本和每个知识文本中提取出特征词集合,包括:提取输入文本中的名词和/或动词,得到第一特征词集合;提取每个知识文本中的名词和/或动词,得到每个知识文本对应的第二特征词集合;将第一特征词集合和第二特征词集合构成的合集确定为特征词集合。
[0014]可选地,根据文本相似度和特征词相似度,从知识文本集合中确定出满足预设要求的目标知识文本,包括:根据特征词相似度与预设阈值的关系,确定特征词相似度对应的词系数和文本相似度对应的文本系数;其中,词系数和文本系数的和等于1;基于文本相似度、特征词相似度、词系数和文本系数,确定知识文本集合中的每个知识文本的相似度值;基于相似度值,确定出满足预设要求的目标知识文本。
[0015]可选地,根据特征词相似度与预设阈值的关系,确定特征词相似度对应的词系数,包括:在特征词相似度大于预设阈值的情况下,将第一权重值确定为词系数;否则,将第二权重值确定为词系数;其中,第一权重值小于第二权重值。
[0016]可选地,确定知识文本集合中的每个知识文本与输入文本之间的文本相似度之前,还包括:利用知识检索工具获取与用户输入的输入文本对应的初始知识集合;从初始知识集合中确定出相似度高于预定条件的知识文本集合。
[0017]在一些实施例中,所述装置包括:第一确定模块,被配置为确定知识文本集合中的每个知识文本与输入文本之间的文本相似度;其中,输入文本为用户输入的查询对应的文本;第二确定模块,被配置为确定输入文本包含的特征词与每个知识文本中包含的特征词之间的特征词相似度;目标文本确定模块,被配置为根据文本相似度和特征词相似度,从知识文本集合中确定出满足预设要求的目标知识文本。
[0018]本申请实施例提供的用于获取相似文本的方法、装置及电子装置,可以实现以下技术效果:
[0019]本申请实施例提供的上述方法,首先基于用户输入的输入文本,对知识文本集合中的每个知识文本,均确定出其与输入文本之间的文本相似度和特征词相似度,并最终根据文本相似度和特征词相似度确定出目标知识文本。这样,在进行目标知识文本的筛选过程中,同时考虑了语句整体的文本相似度以及提取出的特征词的相似度,相比于仅考虑文本相似度或者仅考虑特征词相似度的方法,能够确定出与用于语义更匹配的文本,提升了相似文本筛选的准确性。
[0020]以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
[0021]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0022]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为根据本申请实施例的一种用于获取相似文本的方法的硬件环境示意图;
[0024]图2为本申请实施例提供的一种用于获取相似文本的方法的流程图;
[0025]图3为本申请实施例提供的另一种用于获取相似文本的方法的流程图;
[0026]图4为本申请实施例提供的又一种用于获取相似文本的方法的流程图;
[0027]图5为本申请实施例提供的再一种用于获取相似文本的方法的流程图;
[0028]图6为本申请实施例提供的一种实际应用场景中用于获取相似文本的方法的流程图;
[0029]图7为本申请实施例提供的一种用于获取相似文本的装置的结构示意图;
[0030]图8为本申请实施例提供的一种电子装置的结构示意图。
具体实施方式
[0031]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于获取相似文本的方法,其特征在于,包括:确定知识文本集合中的每个知识文本与输入文本之间的文本相似度;其中,输入文本为用户输入的查询对应的文本;确定输入文本包含的特征词与每个知识文本中包含的特征词之间的特征词相似度;根据文本相似度和特征词相似度,从知识文本集合中确定出满足预设要求的目标知识文本。2.根据权利要求1所述的方法,其特征在于,确定知识文本集合中的每个知识文本与输入文本之间的文本相似度,包括:确定每个知识文本与输入文本之间的原始相似度;根据预设词语集合,确定每个知识文本与输入文本之间的关键文本相似度;其中,关键文本相似度用于表征每个知识文本与输入文本去除预设词语集合后的相似度;根据原始相似度和关键文本相似度,确定知识文本集合中的每个知识文本与输入文本之间的文本相似度。3.根据权利要求2所述的方法,其特征在于,预设词语集合为预设停顿词集合;根据预设词语集合,确定每个知识文本与输入文本之间的关键文本相似度,包括:从所有知识文本和输入文本中去除预设停顿词集合;计算去除预设停顿词集合后的知识文本和输入文本之间的关键文本相似度。4.根据权利要求1所述的方法,其特征在于,确定输入文本包含的特征词与每个知识文本中包含的特征词之间的特征词相似度,包括:根据预设词性,从输入文本和每个知识文本中提取出特征词集合;计算特征词集合中所有特征词之间的特征词相似度。5.根据权利要求4所述的方法,其特征在于,根据预设词性,从输入文本和每个知识文本中提取出特征词集合,包括:提取输入文本中的名词和/或动词,得到第一特征词集合;提取每个知识文本中的名词和/或动词,得到每个知识文本对应的第二特征词集合;将第一特征词集合和第二特征词集合构成的合集确定为特征词集合。6.根据权利要求1

5任...

【专利技术属性】
技术研发人员:周少龙刘朝振
申请(专利权)人:海尔优家智能科技北京有限公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1