一种语句识别方法、语句识别装置及智能设备制造方法及图纸

技术编号:23891786 阅读:64 留言:0更新日期:2020-04-22 06:46
本申请提供了一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质,其中,该语句识别方法包括:接收输入语句;对所述输入语句进行实体词语识别;若所述输入语句不存在实体词语,则将所述输入语句作为识别语料;若所述输入语句存在一个以上实体词语,则基于所述输入语句所包含的一个以上实体词语,以及所述一个以上实体词语所属的实体词语类别,对所述输入语句进行替换,得到一个以上替换语料,并将所述替换语料作为识别语料;分别对各个识别语料进行意图识别,并根据意图识别的结果确定所述输入语句的意图。通过本申请方案,不再需要大量训练语料进行训练,也能够得到可以准确识别用户所输入的语句的语音助手。

【技术实现步骤摘要】
一种语句识别方法、语句识别装置及智能设备
本申请属于人工智能
,尤其涉及一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质。
技术介绍
当前,随着当前人工智能的不断发展,用户已经可以通过智能设备所搭载的语音助手实现多项操作。大部分智能设备的厂商往往采用深度学习算法对语音助手进行训练,然而,深度学习需要大量的训练语料的支撑。当训练语料较少时,就难以采用深度学习算法对语音助手进行训练。
技术实现思路
有鉴于此,本申请提供了一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质,可在训练语料较少的前提下,仍能得到可以准确识别用户所输入的语句的语音助手。本申请的第一方面提供了一种语句识别方法,包括:接收输入语句;对上述输入语句进行实体词语识别;若上述输入语句不存在实体词语,则将上述输入语句作为识别语料;若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料,并将上述替换语料作为识别语料;分别对各个识别语料进行意图识别,并根据意图识别的结果确定上述输入语句的意图。本申请的第二方面提供了一种语句识别装置,包括:接收单元,用于接收输入语句;实体词语识别单元,用于对上述输入语句进行实体词语识别;替换单元,用于若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料;识别语料确定单元,用于当上述输入语句不存在实体词语时,将上述输入语句作为识别语料,当上述输入语句存在一个以上实体词语时,将上述替换语料作为识别语料;意图识别单元,用于分别对各个识别语料进行意图识别,并根据意图识别的结果确定上述输入语句的意图。本申请的第三方面提供了一种智能设备,上述智能设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。本申请的第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。由上可见,在本申请方案中,首先接收输入语句,然后对上述输入语句进行实体词语识别,若上述输入语句不存在实体词语,则将上述输入语句作为识别语料,若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料,并将上述替换语料作为识别语料,最后分别对各个识别语料进行意图识别,并根据意图识别的结果确定上述输入语句的意图。通过本申请方案,不再需要大量训练语料进行训练,也能够得到可以准确识别用户所输入的语句的语音助手。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的语句识别方法的实现流程示意图;图2是本申请实施例提供的语句识别装置的结构框图;图3是本申请实施例提供的智能设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。本申请实施例的一种语句识别方法及语句识别装置可应用于机器人、智能手机、平板电脑等具备语音助手功能的智能设备中,为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。实施例一下面对本申请实施例提供的一种语句识别方法进行描述,请参阅图1,本申请实施例中的语句识别方法包括:步骤101,接收输入语句;在本申请实施例中,智能设备可以先获取待识别的输入语句,上述输入语句指的是用户在与智能设备的语音助手交互的过程中所输入的语句。可选地,上述输入语句可以是用户通过文字所输入的语句;或者,上述语句也可以是用户通过语音所输入的语句,此处不对上述输入语句的输入形式作出限定。步骤102,对上述输入语句进行实体词语识别;在本申请实施例中,语音助手在接收到上述输入语句之后,将首先对输入语句进行实体词语识别。上述实体词语为命名实体,指的是指代实际生活中的实物的词语,例如人名,地名,机构名等;需要注意的是,在本申请实施例中,时间也是一种实体词语,也即,本申请实施例所指的实体词语为广义上的命名实体。在对上述输入语句进行实体词语识别后,将得到上述输入语句所可能包含的所有实体词语,其中,所识别得到的实体词语中可能会有发生重叠的部分。以下以实例进行说明:假定输入语句为“播五月天的阿宝专辑”,则通过上述步骤102所提取到的实体词语会有如下几个:“五月”、“五月天”、“阿宝”和“月”,可以看到,“五月”、“五月天”和“月”这三个实体词语有重叠的部分。步骤103,若上述输入语句存在一个以上实体词语,则基于上述输入语句所包含的一个以上实体词语,以及上述一个以上实体词语所属的实体词语类别,对上述输入语句进行替换,得到一个以上替换语料,并将上述替换语料作为识别语料;在本申请实施例中,每一实体词语对应有所属的实体词语类别。需要注意的是,考虑到实际生活中实体词语的丰富程度,一个实体词语在不同的语境下可能会属于不同的实体词语类别,因而,此处将对识别出的所有实体词语,及各个实体词语所有可能所属的实体词语类别进行替换,以获得所有可能的替换语料。通常来说,上述替换语料的数量为一个以上。具体地,在进行替换时,有两种极端的替换方式,一种是所有实体词语都不替换,也即被替换的实体词语的数量为零;另一种是所有实体词语(在不重叠的情况下)都被替换。则在对上述输入语句进行替换时,首先以被替换的实体词语数量为0作为基础,得到一替换语料(此时,输入语句本身即为一替换语料);然后以被替换的实体词语数量为1作为基础,得到一个以上替换语料;接着再以被替换的实体词语数量为2作为基础,得到一个以上替换语料,以此类推,得到所有可能的替换语料。具体地,在进行替换时,是以实体词语所属的实体词语类别来替换掉对应的输入语句中的实体词语。例如,输入语句为“播五月天的阿宝专辑”,以被替换的实体词语为“五月天”,被替换的实体词语“五月天”所属的实体词语类别为歌手(si本文档来自技高网...

【技术保护点】
1.一种语句识别方法,其特征在于,包括:/n接收输入语句;/n对所述输入语句进行实体词语识别;/n若所述输入语句不存在实体词语,则将所述输入语句作为识别语料;/n若所述输入语句存在一个以上实体词语,则基于所述输入语句所包含的一个以上实体词语,以及所述一个以上实体词语所属的实体词语类别,对所述输入语句进行替换,得到一个以上替换语料,并将所述替换语料作为识别语料;/n分别对各个识别语料进行意图识别,并根据意图识别的结果确定所述输入语句的意图。/n

【技术特征摘要】
1.一种语句识别方法,其特征在于,包括:
接收输入语句;
对所述输入语句进行实体词语识别;
若所述输入语句不存在实体词语,则将所述输入语句作为识别语料;
若所述输入语句存在一个以上实体词语,则基于所述输入语句所包含的一个以上实体词语,以及所述一个以上实体词语所属的实体词语类别,对所述输入语句进行替换,得到一个以上替换语料,并将所述替换语料作为识别语料;
分别对各个识别语料进行意图识别,并根据意图识别的结果确定所述输入语句的意图。


2.如权利要求1所述的语句识别方法,其特征在于,所述对所述输入语句进行实体词语识别,包括:
获取预设的一个以上实体词语类别;
依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别;
基于所述目标实体词语类别所关联的实体词语识别算法,对所述输入语句进行实体词语识别,得到属于所述目标实体词语类别的实体词语。


3.如权利要求2所述的语句识别方法,其特征在于,所述依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别,包括:
分别获取各个实体词语类别的优先级;
基于所述优先级由高至低的顺序,依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别。


4.如权利要求1所述的语句识别方法,其特征在于,所述分别对各个识别语料进行意图识别,并根据意图识别的结果确定所述输入语句的意图,包括:
计算待匹配识别语料与预设的一项以上意图类别的匹配得分,其中,所述待匹配识别语料为任一识别语料,每一项意图类别对应一个意图;
根据所述待匹配识别语料与预设的一项以上意图类别的匹配得分,确定待匹配识别语料的所属意图类别;
在所有识别语料中,根据各个识别语料与对应的所属意图类别的匹配得分,确定目标识别语料,其中,所述目标识别语料为与对应的所属意图类别的匹配得分最高的识别语料;
将所述目标识别语料的所属意图类别所对应的意图确定为所述输入语句的意图。


5.如权利要求4所述语句识别方法,其特征在于,所述计算待匹配识别语料与预设的一项以上意图类别的匹配得分,包括:
获取待匹配意图类别中所包含的所有模板语料,其中,所述待匹配意图类别为任一项意图类别;
分别计算所述待匹配识别语料与所述待匹配意图类别中所包含的各个模板语料的距离;
基于所述待匹配识别语料与所述待匹配意图类别中所包含的各个模板语料的距离,确定所述待匹配识别语料与所述待匹配意图类别的匹配得分。


6.如权利要求5所述的语句识别方法,其特征在于,所述分别计算待匹配识别语料与所述待匹配意图类别中所包含的各个模板语料的距离,包括:
计算所述待匹配识别语料与所述待匹配意图类别中所包含的各个模板语料的余弦距离,并筛选得到余弦距离最大值;
计算所述待匹配识别语料与所述待匹配意图类别中所包含的所有模板语料的余弦距离平均值;
计算所述待匹配识别语料与所述待匹配意图类别中所包含...

【专利技术属性】
技术研发人员:黄日星熊友军
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1