【技术实现步骤摘要】
【国外来华专利技术】使自主代理能够区分问题和请求相关申请的交叉引用本申请要求于2017年9月28日提交的美国临时申请No.62/564,868的权益,该申请通过引用整体并入本文。
本公开一般而言涉及语言学。更具体而言,本公开涉及使用语言学将话语分类为问题或让自主代理执行动作的请求。关于由联邦政府资助的研发工作所获得的专利技术权利的声明不适用
技术介绍
自主代理可以被用于解决各种用户问题。例如,自主代理从用户接收对信息的请求,诸如“whatarethefeesassociatedwithacheckingaccount(与支票账户相关的费用是多少)”。随后,用户可能会问“pleaseopenanewbankaccountforme.(请为我开设新的银行账户)”。但是,当前的解决方案不能区分与问题相关的用户话语(utterance)和作为对要执行的动作的请求的话语。这部分地是因为是请求可能是隐式的,例如,“Iamtoocold(我太冷)”,而不是显式的,例如“pleaseturnontheheat.(请打开暖气)”。现有的解决方案可能将“Iamtoocold”错误地分类为与“coldness(冷)”相关的问题,并提供诸如“inSanFrancisco,thetemperaturecansometimesbecold.(在旧金山,温度有时可能会很冷)”之类的答案。因此,现有的解决方案可能使用户感到沮丧。继续以上示例,用户可能会感到沮丧,因为他对自主代理打开暖气的期望被忽略。误认这两种类型的话语的 ...
【技术保护点】
1.一种将文本分类为问题或请求的系统,包括:/n语言引擎,被配置为:/n访问包含至少一个词语的话语;/n生成用于所述话语的解析树,其中所述解析树包括包含词语类型的至少一个终端节点,其中每个终端节点表示所述话语的词语或短语;以及/n将包含一个或多个词语类型的一个或多个语言模板应用于所述解析树;以及/n规则引擎,被配置为生成从所述语言引擎获得的一个或多个匹配结果,并通过应用包括以下各项的规则来确定所述文本的分类:/n(i)响应于确定语言模板匹配,将所述话语分类为请求,/n(ii)响应于确定所述话语包括祈使动词作为所述话语的第一词语,将所述话语分类为请求,/n(iii)响应于在所述话语中识别出一个或多个预定义的请求关键字,将所述话语分类为请求,以及/n(iv)响应于在所述话语中识别一个或多个预定义的问题关键字,将所述话语分类为问题,/n其中,所述系统还基于所述分类被配置为向用户设备发送消息或调整外部设备的配置。/n
【技术特征摘要】
【国外来华专利技术】20170928 US 62/564,8681.一种将文本分类为问题或请求的系统,包括:
语言引擎,被配置为:
访问包含至少一个词语的话语;
生成用于所述话语的解析树,其中所述解析树包括包含词语类型的至少一个终端节点,其中每个终端节点表示所述话语的词语或短语;以及
将包含一个或多个词语类型的一个或多个语言模板应用于所述解析树;以及
规则引擎,被配置为生成从所述语言引擎获得的一个或多个匹配结果,并通过应用包括以下各项的规则来确定所述文本的分类:
(i)响应于确定语言模板匹配,将所述话语分类为请求,
(ii)响应于确定所述话语包括祈使动词作为所述话语的第一词语,将所述话语分类为请求,
(iii)响应于在所述话语中识别出一个或多个预定义的请求关键字,将所述话语分类为请求,以及
(iv)响应于在所述话语中识别一个或多个预定义的问题关键字,将所述话语分类为问题,
其中,所述系统还基于所述分类被配置为向用户设备发送消息或调整外部设备的配置。
2.如权利要求1所述的系统,其中,所述规则还包括:(v)响应于未能将所述话语识别为问题或请求而将所述话语分类为未知。
3.如权利要求1所述的系统,其中,所述语言模板包括第一人称代词和名词。
4.如权利要求1所述的系统,其中,所述规则还包括:(v)响应于确定所述话语在第一词语位置中包括问题前缀而将所述话语分类为问题。
5.如权利要求1所述的系统,其中,所述一个或多个预定义的问题词语包括心理动词。
6.如权利要求1所述的系统,其中,所述规则还包括:(v)响应于确定所述话语在所述话语的最后词语位置处包括请求后缀而将所述话语分类为请求。
7.如权利要求1所述的系统,其中,所述规则还包括:(v)响应于确定所述话语包括事务动词而将所述话语分类为请求。
8.如权利要求1所述的系统,其中,所述语言引擎被配置为在确定所述解析树之前从所述话语中移除一个或多个停用词。
9.一种使用分类模型将话语分类为问题或请求的方法,所述方法包括:
访问文本的话语,其中所述话语包括至少一个词语;
生成用于所述话语的解析树,其中所述解析树包括包含词语类型的至少一个终端节点,其中每个终端节点表示所述话语的词语或短语;
通过将分类模型应用于所述解析树来确定所述话语的分类,所述应用包括:
为所述解析树确定第一相似度分数,所述第一相似度分数指示所述话语和被识别为问题的训练类别之间的第一匹配,以及
为所述解析树确定第二相似度分数,所述第二相似度分数指示所述话语和被识别为请求的训练类别之间的第二匹配;
从所述分类模型接收所述话语的分类,其中所述话语的所述分类(i)基于所确定的类别的相似度分数高于其它相似度分数,或者(ii)是未知的。
10.如权利要求9所述的方法,还包括:
访问包括训练数据对集合的训练数据集合,其中每个训练数据对包括文本和预期分类,并且其中所述训练数据集合包括(i)包含问题的第一训练数据对以...
【专利技术属性】
技术研发人员:B·加里斯基,V·韦氏诺一,徐新,
申请(专利权)人:甲骨文国际公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。