System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种槽位信息校正方法、装置、设备及介质制造方法及图纸_技高网

一种槽位信息校正方法、装置、设备及介质制造方法及图纸

技术编号:40954306 阅读:5 留言:0更新日期:2024-04-18 20:30
本申请涉及自然语言处理技术领域,尤其涉及一种槽位信息校正方法、装置、设备及介质。在本申请实施例中,电子设备基于垂直领域外部知识源,构建槽位索引知识库,该槽位索引知识库中保存有每个槽位信息对应的槽位类型、槽位内容原名、槽位内容别名、槽位内容原名拼音和槽位内容别名拼音,电子设备进行槽位信息校正时,可以确定该槽位信息对应的三元组,并根据该三元组在该槽位索引知识库中查找与该三元组中的至少两项匹配的第一候选槽位信息,采用该第一候选槽位信息对应的第一目标槽位内容对该槽位信息的目标槽位内容进行校正,槽位信息校正的速度快、准确率高、可迁移性强,本申请实施例的槽位信息校正方法具有可靠性、鲁棒性和可泛化性。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种槽位信息校正方法、装置、设备及介质


技术介绍

1、随着智能问答系统和搜索引擎的发展,智能问答的应用越来越广泛,对问答领域而言,由于需要对问题文本进行意图理解和实体抽取,确定问题文本中包含的槽位信息,并根据槽位信息确定对应的回复文本。但是,如果问题文本中出现错别字,将会直接影响到对问题文本中槽位的识别以及后续任务的处理,因此文本纠错的目的在于保证电子设备更好地理解问题文本的意图,并且保证电子设备更加准确的提取问题文本中包含的槽位信息。

2、但是,目前行业内文本纠错工具的准确率较低,并且难以应用于垂直领域问答系统中对问题文本的槽位信息进行校正。


技术实现思路

1、本申请提供了一种槽位信息校正方法,用以解决现有技术中难以对问题文本中的槽位信息进行校正的问题。

2、第一方面,本申请实施例提供了一种槽位信息校正方法,所述方法包括:

3、确定待校正的槽位信息的三元组,其中,三元组包括目标槽位类型、目标槽位内容以及目标槽位内容拼音;

4、若根据该三元组,在槽位索引知识库中查找到与该三元组中的至少两项匹配的第一候选槽位信息,则获取所述槽位索引知识库中保存的所述第一候选槽位信息对应的第一目标槽位内容原名;

5、采用所述第一目标槽位内容原名对所述目标槽位内容进行校正。

6、第二方面,本申请实施例还提供了一种槽位信息校正装置,所述装置包括:

7、处理模块,用于确定待校正的槽位信息的三元组,其中,三元组包括目标槽位类型、目标槽位内容以及目标槽位内容拼音;

8、校正模块,用于若根据该三元组,在槽位索引知识库中查找到与该三元组中的至少两项匹配的第一候选槽位信息,则获取所述槽位索引知识库中保存的所述第一候选槽位信息对应的第一目标槽位内容原名;采用所述第一目标槽位内容原名对所述目标槽位内容进行校正。

9、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述槽位信息校正方法的步骤。

10、第四方面,本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述槽位信息校正方法的步骤。

11、在本申请实施例中,电子设备确定待校正的槽位信息的三元组,其中,三元组包括目标槽位类型、目标槽位内容以及目标槽位内容拼音;若根据该三元组,在槽位索引知识库中查找到与该三元组中的至少两项匹配的第一候选槽位信息,则获取该槽位索引知识库中保存的该第一候选槽位信息对应的第一目标槽位内容原名;采用该第一目标槽位内容原名对该目标槽位内容进行校正。在本申请实施例中,电子设备基于垂直领域外部知识源,构建槽位索引知识库,该槽位索引知识库中保存有每个槽位信息对应的槽位类型、槽位内容原名、槽位内容别名、槽位内容原名拼音和槽位内容别名拼音,电子设备在对待校正的槽位信息进行校正时,可以确定该槽位信息对应的三元组,并根据该三元组在该槽位索引知识库中查找与该三元组中的至少两项匹配的第一候选槽位信息,采用该第一候选槽位信息对应的第一目标槽位内容对该槽位信息的目标槽位内容进行校正,槽位信息校正的速度快、准确率高、可迁移性强,本申请实施例的槽位信息校正方法具有可靠性、鲁棒性和可泛化性。

本文档来自技高网...

【技术保护点】

1.一种槽位信息校正方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,若未在所述槽位索引知识库中查找到所述第一候选槽位信息,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据预先保存的混淆音表,确定所述每个候选槽位内容别名中对应的字符对为混淆音的第一槽位内容别名包括:

4.根据权利要求2所述的方法,其特征在于,若所述每个候选槽位内容别名中不存在对应的字符对为混淆音的第一槽位内容别名,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,若所述每个候选槽位内容别名中不存在对应的字符对为同形字的第二槽位内容别名,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述第一向量化矩阵的确定过程包括:

7.根据权利要求5所述的方法,其特征在于,所述确定所述第一向量化矩阵与每个第二向量化矩阵的相似度包括:

8.一种槽位信息校正装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7任一所述槽位信息校正方法的步骤。

10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述槽位信息校正方法的步骤。

...

【技术特征摘要】

1.一种槽位信息校正方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,若未在所述槽位索引知识库中查找到所述第一候选槽位信息,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据预先保存的混淆音表,确定所述每个候选槽位内容别名中对应的字符对为混淆音的第一槽位内容别名包括:

4.根据权利要求2所述的方法,其特征在于,若所述每个候选槽位内容别名中不存在对应的字符对为混淆音的第一槽位内容别名,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,若所述每个候选槽位内容别名中不存在对应的字符对为同形字的第二槽位内容别名,...

【专利技术属性】
技术研发人员:刘秀美刘微孟卫明袁岩冯卫森杨斌张传伟
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1