一种意图识别方法及系统技术方案

技术编号:20448783 阅读:21 留言:0更新日期:2019-02-27 02:54
本发明专利技术属于意图识别技术领域,公开了一种意图识别方法及系统,其方法包括:建立意图相同且词性组合顺序不同的正则表达式的正则库;获取用户输入的语音信息;对所述语音信息进行分词,并标注词性;根据所述语音信息中的词语的词性和词语所处的位置,生成对应的词性组合的正则表达式;在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式;根据所述目标正则表达式,识别所述用户的意图。本发明专利技术通过查找到与语音信息匹配的正则表达式来识别用户的意图,对于意图相同句式不同的句子可准确地识别出用户的意图,不仅可简化处理过程,而且识别准确率较高。

An Intention Recognition Method and System

The invention belongs to the field of intent recognition technology, and discloses an intent recognition method and system, which includes: establishing a regular expression library with the same intent and different order of part-of-speech combination; acquiring voice information input by users; partitioning the voice information and annotating the part of speech; generating according to the part of speech and the position of the words in the voice information; A regular expression corresponding to a part of speech combination; a regular expression matching the regular expression corresponding to the voice information is found in the regular library as a target regular expression; and the intention of the user is recognized according to the target regular expression. The invention identifies the user's intention by finding regular expressions matching the voice information. For sentences with the same intention and different sentence patterns, the user's intention can be accurately identified, which not only simplifies the processing process, but also has a high recognition accuracy.

【技术实现步骤摘要】
一种意图识别方法及系统
本专利技术属于意图识别
,特别涉及一种意图识别方法及系统。
技术介绍
随着智能终端及网络技术的迅速发展,人们越来越习惯地使用智能终端完成各种需求,如在学习的过程中,碰到不理解的知识点、不会解的习题时,在智能学习设备中语音输入相关内容,智能学习设备通过识别用户的意图,来为用户推荐相应的答案和知识讲解,以便对用户进行学习辅导。目前,在人机交互场景中,准确理解用户的意图是做出正确应答的基础。但是,由于用户在讲话过程中,经常会出现语言顺序和逻辑颠倒错乱,意思相同但句式不同的情况,这种话语会导致意图识别结果不准确,使得智能设备无法准确的理解用户的真实意图,从而无法为用户推荐符合其需求的内容,使得用户的体验感较差,不利于产品的推广和使用。
技术实现思路
本专利技术的目的是提供一种意图识别方法及系统,实现提高意图识别准确率的目的。本专利技术提供的技术方案如下:一方面,提供一种意图识别方法,包括:建立意图相同且词性组合顺序不同的正则表达式的正则库;获取用户输入的语音信息;对所述语音信息进行分词,并标注词性;根据所述语音信息中的词语的词性和词语所处的位置,生成对应的词性组合的正则表达式;在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式;根据所述目标正则表达式,识别所述用户的意图。优选地,所述的建立意图相同且词性组合顺序不同的正则表达式的正则库具体包括:获取若干语料信息;对所述语料信息进行分词,并标注词语的词性;在不改变每条语料信息的意图的情况下,对每条语料信息中的词语按不同顺序进行组合,生成每条语料信息对应的词性组合的正则表达式;将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。优选地,所述的在不改变每条语料信息的意图的情况下,对每条语料信息中的词语按不同顺序进行组合,生成每条语料信息对应的词性组合的正则表达式之后,所述的将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库之前还包括:在不改变每条语料信息的意图的情况下,在所述每条语料信息中加入连接词,生成新正则表达式;所述的将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库具体包括:将所述语料信息对应的正则表达式和对应的新正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。优选地,所述的在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式之后还包括:根据所述目标正则表达式,输出与所述语音信息意图相同、句式不同的语句。优选地,所述的根据所述目标正则表达式,识别所述用户的意图具体包括:根据所述目标正则表达式,得到与所述目标正则表达式对应的意图识别规则;根据所述意图识别规则及所述语音信息中的词语的词性,识别所述用户的意图。另一方面,还提供一种意图识别系统,包括:正则库建立模块,用于建立意图相同且词性组合顺序不同的正则表达式的正则库;语音获取模块,用于获取用户输入的语音信息;分词标注模块,用于对所述语音信息进行分词,并标注词性;正则表达式生成模块,用于根据所述语音信息中的词语的词性和词语所处的位置,生成对应的词性组合的正则表达式;查找模块,用于在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式;识别模块,用于根据所述目标正则表达式,识别所述用户的意图。优选地,所述正则库建立模块包括:语料获取单元,用于获取若干语料信息;分词标注单元,用于对所述语料信息进行分词,并标注词语的词性;正则表达式生成单元,用于在不改变每条语料信息的意图的情况下,对每条语料信息中的词语按不同顺序进行组合,生成每条语料信息对应的词性组合的正则表达式;正则库建立单元,用于将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。优选地,所述正则表达式生成单元,还用于在不改变每条语料信息的意图的情况下,在所述每条语料信息中加入连接词,生成新正则表达式;所述正则库建立单元,还用于将所述语料信息对应的正则表达式和对应的新正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。优选地,还包括:语句输出模块,用于根据所述目标正则表达式,输出与所述语音信息意图相同、句式不同的语句。优选地,所述识别模块包括:识别规则获取单元,用于根据所述目标正则表达式,得到与所述目标正则表达式对应的意图识别规则;意图识别单元,用于根据所述意图识别规则及所述语音信息中的词语的词性,识别所述用户的意图。与现有技术相比,本专利技术提供的一种意图识别方法及系统具有以下有益效果:1、本专利技术先建立正则库,然后将用户输入的语音信息转换为正则表达式,再根据语音信息的正则表达式在正则库中查找到对应的目标正则表达式,最后根据目标正则表达式即可识别出用户的意图;本专利技术通过查找到与语音信息匹配的正则表达式来识别用户的意图,对于意图相同句式不同的句子可准确地识别出用户的意图,不仅可简化处理过程,而且识别准确率较高。2、本专利技术通过在正则表达式中加入连接词,以充分考虑连接词的存在对意图的影响,使得意图识别方法更加全面准确。3、本专利技术的意图识别方法,还可用于生成意图相同、句式不同的语句,以解决在语言学习过程中的中文句式转换的问题。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对一种意图识别方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。图1是本专利技术一种意图识别方法的第一实施例的流程示意图;图2是本专利技术一种意图识别方法的第二实施例的流程示意图;图3是本专利技术一种意图识别方法的第三实施例的流程示意图;图4是本专利技术一种意图识别方法的第四实施例的流程示意图;图5是本专利技术一种意图识别方法的第五实施例的流程示意图;图6是本专利技术一种意图识别系统的一个实施例的结构示意框图;图7是本专利技术一种意图识别系统的另一个实施例的结构示意框图;图8是本专利技术一种意图识别系统的又一个实施例的结构示意框图;图9是本专利技术一种意图识别系统的再一个实施例的结构示意框图。附图标号说明100、正则库建立模块;110、语料获取单元;120、分词标注单元;130、正则表达式生成单元;140、正则库建立单元;200、语音获取模块;300、分词标注模块;400、正则表达式生成模块;500、查找模块;600、识别模块;610、识别规则获取单元;620、意图识别单元;700、语句输出模块。具体实施方式为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。为使图面简洁,各图中只示意性地表示出了与本专利技术相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。根据本专利技术提供的第一实施例,如图1所示,一本文档来自技高网...

【技术保护点】
1.一种意图识别方法,其特征在于,包括:建立意图相同且词性组合顺序不同的正则表达式的正则库;获取用户输入的语音信息;对所述语音信息进行分词,并标注词性;根据所述语音信息中的词语的词性和词语所处的位置,生成对应的词性组合的正则表达式;在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式;根据所述目标正则表达式,识别所述用户的意图。

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:建立意图相同且词性组合顺序不同的正则表达式的正则库;获取用户输入的语音信息;对所述语音信息进行分词,并标注词性;根据所述语音信息中的词语的词性和词语所处的位置,生成对应的词性组合的正则表达式;在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式;根据所述目标正则表达式,识别所述用户的意图。2.根据权利要求1所述的一种意图识别方法,其特征在于,所述的建立意图相同且词性组合顺序不同的正则表达式的正则库具体包括:获取若干语料信息;对所述语料信息进行分词,并标注词语的词性;在不改变每条语料信息的意图的情况下,对每条语料信息中的词语按不同顺序进行组合,生成每条语料信息对应的词性组合的正则表达式;将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。3.根据权利要求2所述的一种意图识别方法,其特征在于,所述的在不改变每条语料信息的意图的情况下,对每条语料信息中的词语按不同顺序进行组合,生成每条语料信息对应的词性组合的正则表达式之后,所述的将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库之前还包括:在不改变每条语料信息的意图的情况下,在所述每条语料信息中加入连接词,生成新正则表达式;所述的将所述语料信息对应的正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库具体包括:将所述语料信息对应的正则表达式和对应的新正则表达式进行分类组合,建立意图相同且词性组合顺序不同的正则表达式的正则库。4.根据权利要求1所述的一种意图识别方法,其特征在于,所述的在所述正则库中查找到与所述语音信息对应的正则表达式相匹配的正则表达式为目标正则表达式之后还包括:根据所述目标正则表达式,输出与所述语音信息意图相同、句式不同的语句。5.根据权利要求1-4任一项所述的一种意图识别方法,其特征在于,所述的根据所述目标正则表达式,识别所述用户的意图具体包括:根据所述目标正则表达式,...

【专利技术属性】
技术研发人员:魏誉荧
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1