System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 命令词识别方法、装置、设备及存储介质制造方法及图纸_技高网

命令词识别方法、装置、设备及存储介质制造方法及图纸

技术编号:41215151 阅读:2 留言:0更新日期:2024-05-09 23:37
本发明专利技术涉及文本处理技术领域,提供一种命令词识别方法、装置、设备及存储介质,该方法包括:获取待识别的命令词文本;提取所述命令词文本的词槽信息和词性信息;根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作。通过词槽信息和词性信息,基于词性识别命令词对应的业务操作,实现了对候选词语与命令词识别的业务隔离,在命令词识别时,无需列举词槽的所有候选词语,只需要声明命令词的词性即可,将对命令词的识别上升到业务层面,在候选词语发生变化时,对命令词的识别不受影响,降低了命令词识别在开放场景下应用的局限性,提高了命令词识别在候选词多变的场景中应用的灵活性。

【技术实现步骤摘要】

本专利技术涉及文本处理,尤其涉及一种命令词识别方法、装置、设备及存储介质


技术介绍

1、在命令词识别技术中,常见方式是通过语义规则文件(bnf)定义指令规则以及一个个的词槽,每个词槽中定义可选的词语。比如定义一个“打开电视”的规则,将“打开”(open)和“电视”(tv)分为2个词槽,“open”词槽的可选词语包括“打开”、“开一下”等,“tv”词槽的可选词语包括“电视”、“电视机”等。在执行命令词识别时,判断输入文本中是否同时包含“open”和“tv”两个词槽中的词语;如果是,则认为命中该指令,否则则没有命中该指令。

2、该方式需要用户先列举出每个词槽的可选词语,只能应用在少量的固定词语组合的场景下,比如家电的语音控制,或者车载的语音指令中。对于更加开放的场景,比如“打电话给某个人”,由于人名的可选值较多,并且,用户可能随时增加新联系人或者删除已有的联系人,所以,无法提前枚举所有联系人,对命令词的识别存在较多的局限性。也即,现有的命令词识别方式,在开放的业务场景中的应用具有局限性,在业务多变的场景中的应用不灵活。


技术实现思路

1、本专利技术提供一种命令词识别方法、装置、设备及存储介质,用以解决现有的命令词识别方式在开放的业务场景中的应用具有局限性,在业务多变的场景中的应用不灵活的缺陷。

2、本专利技术提供一种命令词识别方法,包括:

3、获取待识别的命令词文本;

4、提取所述命令词文本的词槽信息和词性信息;

5、根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作。

6、根据本专利技术提供的命令词识别方法,所述根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作,包括:

7、根据所述词槽信息,确定所述命令词文本对应的匹配规则;

8、根据所述匹配规则和所述词性信息对所述命令词文本进行规则匹配,并根据匹配结果识别所述命令词文本中的命令词对应的业务操作。

9、根据本专利技术提供的命令词识别方法,所述根据所述词槽信息,确定所述命令词文本对应的匹配规则,包括:

10、根据所述词槽信息,确定所述命令词文本是否包含正则匹配词槽和词性匹配词槽;

11、根据所述正则匹配词槽和/或所述词性匹配词槽,确定所述命令词文本对应的匹配规则。

12、根据本专利技术提供的命令词识别方法,所述根据所述匹配规则和所述词性信息对所述命令词文本进行规则匹配,并根据匹配结果识别所述命令词文本中的命令词对应的业务操作,包括:

13、基于预设的词槽候选词,对所述命令词文本进行精确匹配,得到精确匹配结果,并获取所述命令词文本中精确匹配失败的第一文本;

14、若所述匹配规则包含正则匹配,则对所述第一文本进行正则匹配,得到正则匹配结果,并获取所述第一文本中正则匹配失败的第二文本;

15、对所述第二文本进行分词处理,并根据所述词性信息对分词处理后的第二文本进行词性匹配,得到词性匹配结果;

16、根据所述精确匹配结果、所述正则匹配结果和所述词性匹配结果,确定所述命令词文本对应的命令词规则;

17、若所述匹配规则不包含正则匹配,对所述第一文本进行分词处理,并根据所述词性信息对分词处理后的第二文本进行词性匹配,得到词性匹配结果;

18、根据所述精确匹配结果和所述词性匹配结果,确定所述命令词文本对应的命令词规则;

19、根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作。

20、根据本专利技术提供的命令词识别方法,所述根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作,包括:

21、根据所述命令词规则确定所述命令词文本对应的业务应用;

22、获取所述业务应用中与所述词性信息对应的词性匹配的候选文本;

23、将分词处理后的第一文本或分词处理后的第二文本与所述候选文本进行匹配,确定分词处理后的第一文本的词槽匹配值,或分词处理后的第二文本词槽匹配值;

24、根据所述词槽匹配值确定所述命令词文本中的命令词对应的业务操作。

25、根据本专利技术提供的命令词识别方法,所述根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作之后,还包括:

26、根据所述业务操作生成业务请求指令,并将所述业务请求指令发送给所述业务应用;

27、所述业务应用根据所述业务请求指令执行所述业务操作。

28、根据本专利技术提供的命令词识别方法,所述获取待识别的命令词文本,包括:

29、获取用户发起的语音控制指令;所述语音控制指令中包含命令词信息;

30、对所述语音控制指令进行语音识别和文本转换处理,将所述语音控制指令转换为文本信息,得到所述命令词信息对应的命令词文本。

31、本专利技术还提供一种命令词识别装置,包括:

32、文本获取模块,用于获取待识别的命令词文本;

33、信息提取模块,用于提取所述命令词文本的词槽信息和词性信息;

34、命令词识别模块,用于根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作。

35、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述命令词识别方法。

36、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述命令词识别方法。

37、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述命令词识别方法。

38、本专利技术提供的命令词识别方法、装置、设备及存储介质,通过提取命令词文本的词槽信息和词性信息,基于词槽信息和词性信息识别命令词对应的业务操作。基于词槽信息和词性信息,实现了对候选词语与命令词识别的业务隔离,也即,可以在识别到对应的业务后,进一步将命令词与该业务下的文本进行匹配,从而确定业务操作指向的对象,进而可以创建实例以执行对应的业务操作,而对命令词的识别无需列举每个词槽的所有候选词,只需要声明候选词的词性即可,将对命令词的识别上升到业务层面,而不是直接对应到具体的业务实例,在候选词发生变更的情况下,对命令词的识别不受影响,降低了命令词识别在开放场景下应用的局限性,提高了命令词识别在候选词多变的场景中应用的灵活性。

本文档来自技高网...

【技术保护点】

1.一种命令词识别方法,其特征在于,包括:

2.根据权利要求1所述的命令词识别方法,其特征在于,所述根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作,包括:

3.根据权利要求2所述的命令词识别方法,其特征在于,所述根据所述词槽信息,确定所述命令词文本对应的匹配规则,包括:

4.根据权利要求2所述的命令词识别方法,其特征在于,所述根据所述匹配规则和所述词性信息对所述命令词文本进行规则匹配,并根据匹配结果识别所述命令词文本中的命令词对应的业务操作,包括:

5.根据权利要求4所述的命令词识别方法,其特征在于,所述根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作,包括:

6.根据权利要求5所述的命令词识别方法,其特征在于,所述根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作之后,还包括:

7.根据权利要求1所述的命令词识别方法,其特征在于,所述获取待识别的命令词文本,包括:

8.一种命令词识别装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述命令词识别方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述命令词识别方法。

...

【技术特征摘要】

1.一种命令词识别方法,其特征在于,包括:

2.根据权利要求1所述的命令词识别方法,其特征在于,所述根据所述词槽信息和所述词性信息识别所述命令词文本中的命令词对应的业务操作,包括:

3.根据权利要求2所述的命令词识别方法,其特征在于,所述根据所述词槽信息,确定所述命令词文本对应的匹配规则,包括:

4.根据权利要求2所述的命令词识别方法,其特征在于,所述根据所述匹配规则和所述词性信息对所述命令词文本进行规则匹配,并根据匹配结果识别所述命令词文本中的命令词对应的业务操作,包括:

5.根据权利要求4所述的命令词识别方法,其特征在于,所述根据所述命令词规则识别所述命令词文本中的命令词对应的业务操作,包括...

【专利技术属性】
技术研发人员:李玥刘翔马志添邱汉彬
申请(专利权)人:广州数鹏通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1