一种适用于多场景的可扩展的指令识别方法和电子设备技术

技术编号：40658415 阅读：5 留言：0更新日期：2024-03-18 18:50

本申请提供一种适用于多场景的可扩展的指令识别方法，属于通信技术领域，包括识别配置和指令识别，所述识别配置对指令是被相关的内容进行预配置；所述指令识别包括以下步骤：S1、识别用户输入信息并进行预处理得到输入内容；S2、提取输入内容中的实体信息，替换相应指令话术模版中对应的实体项，得到识别结果进入步骤S4，否则进入步骤S3；S3、利用泛化识别模型提取输入内容中对应的实体信息，将实体信息替换相应指令话术模版中对应的实体项，并进行规范化处理得到识别结果进入步骤S4；S4、输出识别结果或者错误提示；本申请适用多种复杂场景，能高效配置，具有高可用可扩展性，能在大数据集下精准快速识别的智能设备指令。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于通信，具体涉及一种适用于多场景的可扩展的指令识别方法和电子设备。

技术介绍

1、随着软硬件技术不断发展，智能化控制的概念悄悄兴起，用户操作越来越倾向于“傻瓜式操作”，动动手甚至于动动嘴即可控制各种设备。此外，随着软硬件与各个行业的结合，各种可操作设备爆炸式增加，控制终端也随之急速增多。以家庭生活场景为例，有电视、空调、cd机等各种遥控器，时常还有丢失的风险，这与近年来用户所追求的“简单美”、“方便美”相背离。那么就需要一种，既能支持多种方式，比如动动手、动动嘴即可操作各种设备；也能够从多种维度对一个/多个复杂场景，进行指令控制。也就是一种“支持多种输入形式的多设备控制中心”，比如使用一个如手机、音箱的智能助手载体，即可轻松控制任意家庭设备。这样一来，不仅可以简化用户的上手难度，便捷用户的操作，而且可以做统一化管理，简单来说，就是一对多控制以及多元化控制。

2、传统的硬件指令识别是集成于芯片中的，识别出相应的关键词后进行对应的操作。但是由于硬件本身内存等条件的限制，硬件识别指令有指令词和说法较少、识别准确率低、场景较为单一和扩展困难的缺点，硬件设备之间的互联以及互相控制就更加困难。

3、在这一背景下，必须采用一种新的方式来进行设备控制，可采用指令与设备拆分的形式来实现，除了各种设备是指令执行终端，还有一个控制指令的解析终端，比如想以语音指令为主，可以使用一个控制音箱作为指令采集识别以及发出指令的中间设备。那么，这个中间设备是否足够“智能”，对内置其中的指令识别系统的能力就提出了具象化的要求，如何建

技术实现思路

1、本专利技术针对现有技术中的不足，提供一种适用于多场景的可扩展的指令识别方法和电子设备，适用多种复杂场景，能高效配置，具有高可用可扩展性，能在大数据集下精准快速识别的智能设备指令。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种适用于多场景的可扩展的指令识别方法，包括识别配置和指令识别，所述识别配置包括以下内容：

4、配置业务场景；

5、配置用户输入形式；

6、配置每个业务场景中的子场景、每个子场景的指令话术模版和指令话术模版中涉及的素有实体项和实体信息；

7、配置泛化识别模型；

8、配置规范化算法及输出格式；

9、配置返回值的数据格式；

10、将所有配置与用户信息进行绑定；

11、所述指令识别包括以下步骤：

12、s1、根据用户输入信息查询用户的配置信息，并识别用户输入信息的具体内容，对识别的内容进行预处理得到输入内容；

13、s2、提取输入内容中的实体信息，如果提取出实体信息则替换相应指令话术模版中对应的实体项，选择最匹配的指令话术模版，并进行规范化算法进行规范化处理，得到识别结果进入步骤s401，否则进入步骤s3；

14、s3、根据步骤s1查询到的配置信息，确认是否存在配置泛化识别模型，如果存在则根据该泛化识别模型识别输入内容中的用户意图，如果不存在则则赋予相应的异常码进入步骤s402；

15、如果识别用户意图，则根据用户意图匹配对应的指令话术模版及其所属的所有实体信息，利用泛化识别模型提取输入内容中对应的实体信息，将实体信息替换相应指令话术模版中对应的实体项，并进行规范化处理得到识别结果进入步骤s401；如果未识别用户意图，则赋予相应的异常码进入步骤s402

16、s401、将识别结果按照配置的输出格式返回给用户；

17、s402、根据异常码匹配对应的异常内容按照输出格式返回给用户。

18、作为优选，所述识别配置中配置用户输入形式包括语音输入和文本输入；所述指令话术模版由若干个实体项按顺序组成，实体信息为实体项的具体内容。

19、作为优选，所述步骤s1中用户输入信息包括语音输入信息和文本输入信息，对语音输入信息通过自动语音识别转化为文本信息；所述对识别内容的预处理包括为去除空格、去除标点符号和去除特殊符号。

20、作为优选，所述步骤s2包括准备步骤：

21、根据步骤s1查询到的配置信息和输入信息匹配对应的业务场景，确认该业务场景下所有的指令话术模版及其所述的实体项和实体信息，以及实体信息的同义词。

22、作为优选，所述步骤s2中根据匹配的业务场景中所有的实体信息构建ac自动机，通过构建的ac自动机提取输入内容中的实体信息。

23、作为优选，所述ac自动机构建过程如下：

24、s201、构建字典树，使用实体信息中的词汇构件字典树，每个节点包含了一个子节点字典、一个结束标记、一个失败指针以及一个同义词集合；

25、s202、构件ac自动机，在在字典树的基础上添加失败指针，形成ac自动机。

26、作为优选，所述指令话术模版为：实体项1,实体项2,...,实体项n，n为该指令话术模版实体项的总数；不同的场景中存在相同实体项。

27、作为优选，所述泛化识别模型包括chatgpt。

28、一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序使计算机执行上述任一项所述的一种适用于多场景的可扩展的指令识别方法。

29、一种电子设备，其特征在于，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行计算机程序时，实现上述任一项所述的一种适用于多场景的可扩展的指令识别方法。

30、本专利技术的有益效果是：

31、1、本申请的指令识别是模式匹配加上泛化模型的结构，兼顾了速度和泛化性。模式匹配速度极快、拓展性高，配合固定说法（比如在某些场景下，用户的指令组成相对单一，比如在电视节目点播场景，一个{name}可能就可以命中大多数的指令，用户说“西游记”、“红楼梦”，本质上都是一个“name”的指令说法）能命中大部分指令。但是一旦有超出标准实体名称的实体或者用户的话术模式过于复杂，未收入指令话术模板，则会被误判，识别不出正确结果；泛化模型相对模式匹配比较慢，但是具有泛化性，可以对用户指令进行泛化识别，配合实体规范化算法，识别准确率将进一步提高。

32、2、本申请的识别配置是对指令识别功能的进一步强化，使得指令识别不仅可以配置多个场景，还可以对支持的说法和实体进行及时扩充，延长平台的使用周期。不管是面对有若干子场景的单个总场景还是连结了多个设备的多场景情况，一套配置平台，化繁为简。

33、3、利用ac自动机实现了一个实体抽取和话术模式规则匹配器。它首先构建了一个ac自动机来高效地在文本中搜索预定的关键词集。然后，它将找到的关键词与预定义的规则进行匹配，以找出符合规则的关键词。最后，它会根据匹配的规则和关键词生成一个结果列表，并按照得分将结果进行排序。该方法兼具高效性、灵活性和准本文档来自技高网...

【技术保护点】

1.一种适用于多场景的可扩展的指令识别方法，其特征在于：包括识别配置和指令识别，所述识别配置包括以下内容：

2.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述识别配置中配置用户输入形式包括语音输入和文本输入；所述指令话术模版由若干个实体项按顺序组成，实体信息为实体项的具体内容。

3.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤S1中用户输入信息包括语音输入信息和文本输入信息，对语音输入信息通过自动语音识别转化为文本信息；所述对识别内容的预处理包括为去除空格、去除标点符号和去除特殊符号。

4.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤S2包括准备步骤：

5.根据权利要求4所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤S2中根据匹配的业务场景中所有的实体信息构建AC自动机，通过构建的AC自动机提取输入内容中的实体信息。

6.根据权利要求5所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述AC自动机构建过程如下：

7.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述指令话术模版为：实体项1,实体项2,...,实体项n，n为该指令话术模版实体项的总数；不同的场景中存在相同实体项。

8.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述泛化识别模型包括ChatGPT。

9.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序使计算机执行如权利要求1-8任一项所述的一种适用于多场景的可扩展的指令识别方法。

10.一种电子设备，其特征在于，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行计算机程序时，实现如权利要求1-8任一项所述的一种适用于多场景的可扩展的指令识别方法。

...

【技术特征摘要】

1.一种适用于多场景的可扩展的指令识别方法，其特征在于：包括识别配置和指令识别，所述识别配置包括以下内容：

3.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤s1中用户输入信息包括语音输入信息和文本输入信息，对语音输入信息通过自动语音识别转化为文本信息；所述对识别内容的预处理包括为去除空格、去除标点符号和去除特殊符号。

4.根据权利要求1所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤s2包括准备步骤：

5.根据权利要求4所述的一种适用于多场景的可扩展的指令识别方法，其特征在于：所述步骤s2中根据匹配的业务场景中所有的实体信息构建ac自动机，通过构建的ac...

【专利技术属性】
技术研发人员：陈萍，高培培，陈辉，薄萌萌，
申请(专利权)人：江苏号百科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人