System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 自然语言中口语化时间词语转换方法、装置、设备及介质制造方法及图纸_技高网

自然语言中口语化时间词语转换方法、装置、设备及介质制造方法及图纸

技术编号:40921352 阅读:4 留言:0更新日期:2024-04-18 14:46
本申请涉及自然语言处理技术领域,尤其涉及自然语言中口语化时间词语转换方法、装置、设备及介质。在本申请实施例中,根据时间粒度表中保存的每个时间粒度与口语化时间的对应关系,确定输入文本中包含的口语化时间对应的每个目标时间粒度及对应的目标取值范围;根据目标时间粒度对应的目标取值范围,确定输入文本对应的预设格式的目标时间范围,对输入文本中包含的口语化的时间进行标准化处理,提高输入文本标准化效果,并采用目标时间范围对输入文本进行更新,使得后续将更新后的输入文本用于与智能问答系统\非结构化文本数据分析和挖掘等领域中,进行后续数据库查询,提高查询结果的准确率,本申请实施例具有可靠性、鲁棒性和可泛化性。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及自然语言中口语化时间词语转换方法、装置、设备及介质


技术介绍

1、随着智能问答系统和搜索引擎的发展,用户与电子设备的交互体验得到越来越高的重视,输入文本也越来越口语化,如上一周、前三天、过去二十年等口语化的时间也大量的出现在输入文本中。

2、现有的智能问答系统、搜索引擎等电子设备对于输入文本通常采用常规的处理方式,例如分词、语义分析以及排序等处理方式,对于输入文本中出现的口语化的时间只能进行字面匹配而无法深入理解,甚至会将口语化的时间(例如:3天前、上个礼拜以及下个月中旬)分解成不同的词块,从输入文本中提取完整的时间,进而导致查询结果不符合预期,查询结果误差大。


技术实现思路

1、本申请提供了自然语言中口语化时间词语转换方法、装置、设备及介质,用以解决现有技术中当输入文本中出现口语化的时间字段时,无法从输入文本中获取完整的时间,进而导致查询结果不符合预期,查询结果误差大的问题。

2、第一方面,本申请实施例提供了一种自然语言中口语化时间词语转换方法,所述方法包括:

3、根据时间粒度表中保存的每个时间粒度与口语化时间的对应关系,确定输入文本中包含的口语化时间对应的每个目标时间粒度以及所述每个目标时间粒度对应的目标取值范围;

4、根据所述目标时间粒度对应的目标取值范围,确定所述输入文本对应的预设格式的目标时间范围,并采用所述目标时间范围对所述输入文本进行更新,使得后续根据更新后的输入文本进行回复。

<p>5、第二方面,本申请实施例还提供了一种自然语言中口语化时间词语转换装置,所述装置包括:

6、处理模块,用于根据时间粒度表中保存的每个时间粒度与口语化时间的对应关系,确定输入文本中包含的口语化时间对应的每个目标时间粒度以及所述每个目标时间粒度对应的目标取值范围;根据所述目标时间粒度对应的目标取值范围,确定所述输入文本对应的预设格式的目标时间范围;

7、更新模块,用于采用所述目标时间范围对所述输入文本进行更新,使得后续根据更新后的输入文本进行回复。

8、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述自然语言中口语化时间词语转换方法的步骤。

9、第四方面,本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述自然语言中口语化时间词语转换方法的步骤。

10、在本申请实施例中,电子设备根据时间粒度表中保存的每个时间粒度与口语化时间的对应关系,确定输入文本中包含的口语化时间对应的每个目标时间粒度以及所述每个目标时间粒度对应的目标取值范围;根据所述目标时间粒度对应的目标取值范围,确定所述输入文本对应的预设格式的目标时间范围,并采用所述目标时间范围对所述输入文本进行更新,使得后续根据更新后的输入文本进行回复。在本申请实施例中,电子设备通过确定输入文本中包含的口语化时间对应的每个目标时间粒度以及每个时间粒度对应的目标取值范围,对输入文本中包含的口语化的时间进行标准化处理,并根据目标时间粒度对应的目标取值范围输出预设格式的时间范围,提高输入文本标准化效果,使输出的文本可以用于与智能问答系统、非结构化文本数据分析和挖掘等领域中,进行后续数据库查询等,提高查询结果的准确率,本申请实施例具有可靠性、鲁棒性和可泛化性。

本文档来自技高网
...

【技术保护点】

1.一种自然语言中口语化时间词语转换方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标时间粒度对应的目标取值范围,确定所述输入文本对应的预设格式的目标时间范围包括:

3.根据权利要求2所述的方法,其特征在于,若存在缺失的其他时间粒度,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述时间粒度补齐方法、所述目标时间粒度以及当前时间,对所述缺失的其他时间粒度进行补齐,确定所述其他时间粒度对应的其他取值范围包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述时间粒度补齐方法、所述目标时间粒度以及当前时间,对所述缺失的其他时间粒度进行补齐,确定所述其他时间粒度对应的其他取值范围包括:

6.一种自然语言中口语化时间词语转换装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述处理模块,具体用于根据所述目标时间粒度以及所述预设的时间格式,判断所述口语化时间是否存在缺失的其他时间粒度;若不存在,则获取每个目标取值范围的第一起始值,并根据预设的时间粒度组合顺序,将对应目标时间粒度的每个第一起始值进行组合,得到所述目标时间范围的起始时间;获取每个目标取值范围的每个第一结束值,并根据预设的时间粒度组合顺序,将对应的目标时间粒度每个第一结束值进行组合,得到所述目标时间范围的结束时间。

8.根据权利要求7所述的装置,其特征在于,所述处理模块,还用于获取预先配置的时间粒度补齐方法;根据所述时间粒度补齐方法、所述目标时间粒度以及当前时间,对所述缺失的其他时间粒度进行补齐,确定所述其他时间粒度对应的其他取值范围;获取每个目标取值范围的每个第一起始值和所述其他取值范围的第二起始值,并根据预设的时间粒度组合顺序,将对应目标时间粒度的每个第一起始值和对应所述其他时间粒度的第二起始值进行组合,得到所述目标时间范围的起始时间;获取每个目标取值范围的每个第一结束值和所述其他取值范围的第二结束值,并根据预设的时间粒度组合顺序,将对应目标时间粒度的所述每个第一结束值和对应所述其他时间粒度的第二结束值进行组合,得到所述目标时间范围的结束时间。

9.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5任一所述自然语言中口语化时间词语转换方法的步骤。

10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述自然语言中口语化时间词语转换方法的步骤。

...

【技术特征摘要】

1.一种自然语言中口语化时间词语转换方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标时间粒度对应的目标取值范围,确定所述输入文本对应的预设格式的目标时间范围包括:

3.根据权利要求2所述的方法,其特征在于,若存在缺失的其他时间粒度,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述时间粒度补齐方法、所述目标时间粒度以及当前时间,对所述缺失的其他时间粒度进行补齐,确定所述其他时间粒度对应的其他取值范围包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述时间粒度补齐方法、所述目标时间粒度以及当前时间,对所述缺失的其他时间粒度进行补齐,确定所述其他时间粒度对应的其他取值范围包括:

6.一种自然语言中口语化时间词语转换装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述处理模块,具体用于根据所述目标时间粒度以及所述预设的时间格式,判断所述口语化时间是否存在缺失的其他时间粒度;若不存在,则获取每个目标取值范围的第一起始值,并根据预设的时间粒度组合顺序,将对应目标时间粒度的每个第一起始值进行组合,得到所述目标时间范围的起始时间;获取每个目标取值范围的每个...

【专利技术属性】
技术研发人员:刘秀美刘微孟卫明袁岩冯卫森杨斌葛赛赛
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1