一种语句识别方法、语句识别装置及智能设备制造方法及图纸

技术编号:23891785 阅读:59 留言:0更新日期:2020-04-22 06:46
本申请公开了一种语句识别方法、装置、智能设备及计算机可读存储介质,其中,该方法包括:对接收的输入语句进行实体词语识别;若输入语句不存在实体词语,则将输入语句作为识别语料;否则基于各个实体词语及其所属的实体词语类别对输入语句进行替换,得到多个替换语料作为识别语料;获取预设的多项意图类别,并得到各项意图类别所包含的模板语料;通过已训练的神经网络模型得到各个识别语料的语句向量以及各个模板语料的模板语料向量;计算得到各项意图类别的平均语料向量;根据各语句向量与每一平均语料向量的相似度,确定各识别语料的所属意图类别;根据每一识别语料的所属意图类别,确定输入语句的意图。本申请方案可提升语音助手的工作效率。

A statement recognition method, statement recognition device and intelligent device

【技术实现步骤摘要】
一种语句识别方法、语句识别装置及智能设备
本申请属于人工智能
,尤其涉及一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质。
技术介绍
当前,随着当前人工智能的不断发展,用户已经可以通过智能设备所搭载的语音助手实现多项操作。语音助手在识别用户所输入的语句时,往往会先对该语句的意图进行识别,以获知用户所需要进行的操作。这一过程往往会导致数据爆炸,从而影响到语音助手的工作效率。
技术实现思路
有鉴于此,本申请提供了提供了一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质,可提升语音助手识别语句的速度,减轻语音助手训练过程中的数据量。本申请的第一方面提供了一种语句识别方法,包括:接收输入语句;对上述输入语句进行实体词语识别;若上述输入语句不存在实体词语,则将上述输入语句作为识别语料;若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料,并将上述替换语料作为识别语料;获取预设的一项以上意图类别,并得到每一项意图类别所包含的模板语料,其中,每一项意图类别对应一个意图;通过已训练的神经网络模型,得到各个识别语料的语句向量以及各个模板语料的模板语料向量;根据各项意图类别所包含的模板语料的模板语料向量,计算得到各项意图类别的平均语料向量;分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别;根据每一识别语料的所属意图类别,确定上述输入语句的意图。本申请的第二方面提供了一种语句识别装置,包括:接收单元,用于接收输入语句;实体词语识别单元,用于对上述输入语句进行实体词语识别;替换单元,用于若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料;识别语料确定单元,用于当上述输入语句不存在实体词语时,将上述输入语句作为识别语料,当上述输入语句存在一个以上实体词语时,将上述替换语料作为识别语料;模板语料获取单元,用于获取预设的一项以上意图类别,并得到每一项意图类别所包含的模板语料,其中,每一项意图类别对应一个意图;向量获取单元,用于通过已训练的神经网络模型,得到各个识别语料的语句向量以及各个模板语料的模板语料向量;平均语料向量计算单元,用于根据各项意图类别所包含的模板语料的模板语料向量,计算得到各项意图类别的平均语料向量;相似度计算单元,用于分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别;意图确定单元,用于根据每一识别语料的所属意图类别,确定上述输入语句的意图。本申请的第三方面提供了一种智能设备,上述智能设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。本申请的第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。由上可见,在本申请方案中,由上可见,在本申请方案中,首先接收输入语句,然后对上述输入语句进行实体词语识别,若上述输入语句不存在实体词语,则将上述输入语句作为识别语料,若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料,并将上述替换语料作为识别语料,接着获取预设的一项以上意图类别,并得到每一项意图类别所包含的模板语料,其中,每一项意图类别对应一个意图,随后通过已训练的神经网络模型,得到各个识别语料的语句向量以及各个模板语料的模板语料向量,再根据各项意图类别所包含的模板语料的模板语料向量,计算得到各项意图类别的平均语料向量,最后分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别,并根据每一识别语料的所属意图类别,确定上述输入语句的意图。通过本申请方案,可提升语音助手识别语句的速度,减轻语音助手训练过程中的数据量。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的语句识别方法的实现流程示意图;图2是本申请实施例提供的语句识别方法中,神经网络模型的训练流程示意图;图3是本申请实施例提供的语句识别装置的结构框图;图4是本申请实施例提供的智能设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。本申请实施例的一种语句识别方法及语句识别装置可应用于机器人、智能手机、平板电脑等具备语音助手功能的智能设备中。为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。实施例一下面对本申请实施例提供的一种语句识别方法进行描述,请参阅图1,本申请实施例中的语句识别方法包括:步骤101,接收输入语句;在本申请实施例中,智能设备可以先获取待识别的输入语句,上述输入语句指的是用户在与智能设备的语音助手交互的过程中所输入的语句。可选地,上述输入语句可以是用户通过文字所输入的语句;或者,上述语句也可以是用户通过语音所输入的语句,此处不对上述输入语句的输入形式作出限定。步骤102,对上述输入语句进行实体词语识别,得到上述输入语句所包含的一个以上实体词语;在本申请实施例中,语音助手在接收到上述输入语句之后,将首先对输入语句进行实体词语识别。上述实体词语为命名实体,指的是指代实际生活中的实物的词语,例如人名,地名,机构名等;需要注意的是,在本申请实施例中,时间也是一种实体词语,也即,本申请实施例所指的实体词语为广义上的命名实体。在对上述输入语句进行实体词语识别后,将得到上述输入语句所可能包含的所有实体词语,其中,所识别得到的实体词语中可能会有发生重叠的部分。以下以实例进行说明:假定输入语句为“播五月天的阿宝专辑”,则通过上述步骤102所提取到的实体词语会有如下几个本文档来自技高网...

【技术保护点】
1.一种语句识别方法,其特征在于,包括:/n接收输入语句;/n对所述输入语句进行实体词语识别;/n若所述输入语句不存在实体词语,则将所述输入语句作为识别语料;/n若所述输入语句存在一个以上实体词语,则基于所述输入语句所包含的一个以上实体词语,以及所述一个以上实体词语所属的实体词语类别,对所述输入语句进行替换,得到一个以上替换语料,并将所述替换语料作为识别语料;/n获取预设的一项以上意图类别,并得到每一项意图类别所包含的模板语料,其中,每一项意图类别对应一个意图;/n通过已训练的神经网络模型,得到各个识别语料的语句向量以及各个模板语料的模板语料向量;/n根据各项意图类别所包含的模板语料的模板语料向量,计算得到各项意图类别的平均语料向量;/n分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别;/n根据每一识别语料的所属意图类别,确定所述输入语句的意图。/n

【技术特征摘要】
1.一种语句识别方法,其特征在于,包括:
接收输入语句;
对所述输入语句进行实体词语识别;
若所述输入语句不存在实体词语,则将所述输入语句作为识别语料;
若所述输入语句存在一个以上实体词语,则基于所述输入语句所包含的一个以上实体词语,以及所述一个以上实体词语所属的实体词语类别,对所述输入语句进行替换,得到一个以上替换语料,并将所述替换语料作为识别语料;
获取预设的一项以上意图类别,并得到每一项意图类别所包含的模板语料,其中,每一项意图类别对应一个意图;
通过已训练的神经网络模型,得到各个识别语料的语句向量以及各个模板语料的模板语料向量;
根据各项意图类别所包含的模板语料的模板语料向量,计算得到各项意图类别的平均语料向量;
分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别;
根据每一识别语料的所属意图类别,确定所述输入语句的意图。


2.如权利要求1所述的语句识别方法,其特征在于,所述对所述输入语句进行实体词语识别,得到所述输入语句所包含的一个以上实体词语,包括:
获取预设的一个以上实体词语类别;
依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别;
基于所述目标实体词语类别所关联的实体词语识别算法,对所述输入语句进行实体词语识别,得到属于所述目标实体词语类别的实体词语。


3.如权利要求2所述的语句识别方法,其特征在于,所述依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别,包括:
分别获取各个实体词语类别的优先级;
基于所述优先级由高至低的顺序,依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别。


4.如权利要求1所述的语句识别方法,其特征在于,所述分别计算每一语句向量与每一项意图类别的平均语料向量的相似度,以确定每一识别语料的所属意图类别,包括:
计算待匹配识别语料的语句向量与待匹配意图类别的平均语料向量的距离,其中,所述待匹配识别语料为任一识别语料,所述待匹配意图类别为任一意图类别;
将与所述待匹配识别语料的语句向量的距离最大的平均语料向量所对应的意图类别确定为所述待匹配识别语料的所属意图类别。


5.如权利要求1至4任一项所述的语句识别方法,其特征在于,所述语句识别方法还包括对所述神经网络模型的训练,所述训练的过程包括:
初始化待训练的神经网络模型的模型参数;
获取每一项待训练意图类别所包含的待训练模板语料;
将一个以上待训练模板语料输入至所述神经网络模型,得到一个以上待训练模板语料向量;
根据每一项待训练意图类别所包含的待训练模板语料,计算得到每一项待训练意图类别的待训练平均语料向...

【专利技术属性】
技术研发人员:黄日星熊友军
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1