一种自然语言文本的处理方法、装置、设备及存储介质制造方法及图纸

技术编号:31711055 阅读:25 留言:0更新日期:2022-01-01 11:14
本公开提供了一种自然语言文本的处理方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及自然语言处理技术领域。具体实现方案为:获取待处理的目标语句文本后,对目标语句文本进行分词,得到对应目标固定词槽和候选自由词槽,目标固定词槽基于预设词典确定,后基于预设的各标准句式的语法规则,对目标固定词槽及候选自由词槽进行句式匹配,得到包含目标固定词槽及目标自由词槽的目标句式,用各目标自由词槽对应的自由词语代替目标自由词槽,得到包含各自由词语的目标句式。本公开实施例中,通过设置自由词槽,可以对变化的词语进行处理,从而可以识别出用户更多的指令,提高用户体验,且无需提前配置大量非固定词语,节省内存占用。节省内存占用。节省内存占用。

【技术实现步骤摘要】
一种自然语言文本的处理方法、装置、设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及自然语言处理技术中的一种自然语言文本的处理方法、装置、设备及存储介质。

技术介绍

[0002]自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言理解(NLU)是自然语言处理技术中的一个重要方面,自然语言理解过程中,需要对自然语言文本进行处理,以获得文本的意图。

技术实现思路

[0003]本公开提供了一种能够对变化的词语进行处理的自然语言文本的处理方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种自然语言文本的处理方法,包括:
[0005]获得待处理的目标语句文本;
[0006]对所述目标语句文本进行分词处理,得到所述目标语句文本对应的目标固定词槽和候选自由词槽;其中,所述目标固定词槽基于预设的词典确定;
[0007]基于预设的各个标准句式的语法规则,对所述目标固定词槽和候选自由词槽进行句式匹配,得到包含目标固定词槽和目标自由词槽的目标句式;
[0008本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自然语言文本的处理方法,包括:获得待处理的目标语句文本;对所述目标语句文本进行分词处理,得到所述目标语句文本对应的目标固定词槽和候选自由词槽;其中,所述目标固定词槽基于预设的词典确定;基于预设的各个标准句式的语法规则,对所述目标固定词槽和候选自由词槽进行句式匹配,得到包含目标固定词槽和目标自由词槽的目标句式;用所述目标语句文本中各个目标自由词槽对应的各个自由词语,替代目标句式中的各个目标自由词槽,得到包含所述各个自由词语的目标句式。2.根据权利要求1所述的方法,其中,所述对所述目标语句文本进行分词处理,得到所述目标语句文本对应的目标固定词槽和候选自由词槽的步骤,包括:基于预设词典,对所述目标语句文本进行固定词槽分词,得到所述目标语句文本对应的目标固定词槽;将经过固定词槽分词未分出来的词与预设各个自由词槽的文本规则进行匹配,得到匹配成功的语句文本及对应的候选自由词槽;将所述匹配成功的语句文本,替换为候选自由词槽,得到包括所述目标固定词槽和候选自由词槽的多个分词结果;所述基于预设的各个标准句式的语法规则,对所述目标固定词槽和候选自由词槽进行句式匹配,得到包含目标固定词槽和目标自由词槽的目标句式的步骤,包括:基于预设的各个标准句式的语法规则,对所述多个分词结果进行匹配,得到包含目标固定词槽和目标自由词槽的目标句式。3.根据权利要求2所述的方法,其中,所述自由词槽的文本规则为文本的字符串表达式;所述将经过固定词槽分词未分出来的词与预设各个自由词槽的文本规则进行匹配,得到匹配成功的语句文本及对应的候选自由词槽的步骤,包括:将目标语句文本与词典中每个自由词槽的字符串表达式进行正则匹配,得到匹配成功的语句文本及对应的候选自由词槽。4.根据权利要求3所述的方法,其中,所述预设的各个标准句式的语法规则中,包含每个标准句式的各个固定词槽和各个自由词槽在句式中的前后顺序;所述基于预设的各个标准句式的语法规则,对所述多个分词结果进行匹配,得到包含目标固定词槽和目标自由词槽的目标句式的步骤,包括:基于各个标准句式的语法规则中,各个固定词槽和各个自由词槽在句式中的前后顺序,对所述多个分词结果进行正则匹配,得到包含目标固定词槽和目标自由词槽的目标句式。5.根据权利要求1~4任一项所述的方法,该方法还包括:基于预设的各个标准句式的意图信息,对所述包含所述各个自由词语的目标句式进行意图识别,得到所述目标语句文本的意图。6.一种自然语言文本的处理装置,包括:
目标语句文本获取模块,用于获得待处理的目标语句文本;分词模块,用于对所述目标语句文本进行分词处理...

【专利技术属性】
技术研发人员:葛永亮
申请(专利权)人:阿波罗智联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1