本公开涉及域间通过语法槽的分类
【技术实现步骤摘要】
域间通过语法槽的分类
[0001]本申请是申请日为
2017
年
09
月
05
日
、
题为“域间通过语法槽的分类”的中国专利技术专利申请
No.201710791381.3
的分案申请
。
[0002]本专利技术涉及机器学习领域,并且更具体地,涉及根据用户对用于自然语言理解的系统所说的内容来对用户进行分类
。
技术介绍
[0003]域和语法
[0004]越来越多的人成为虚拟助理的用户,虚拟助理例如可以是
SoundHound Hound、Okay Google、Amazon Alexa、
百度度秘
、Apple Siri、Line Clova、Microsoft Cortana、KT Giga Genie
以及
SK Telecom NUGU。
这些系统具有各种领域的知识,如天气
、
新闻
、
琐事
、
餐馆
、
数学
、
维基百科
(Wikipedia)。
这样的系统还具有各种领域的能力,例如恒温器
、
照明控制
、
音乐播放
、SMS
短信发送以及制作日历约会
。
一些虚拟助理是封闭系统,因为一家公司控制着可用的域
。
这有助于确保友好的用户体验
。
一些虚拟助理是开放系统,因为第三方可以创建域
。
[0005]一些系统具有成千上万的第三方域提供商
。
许多是小公司,甚至是个人程序员
。
许多域访问
web
应用程序编程接口
(API)
,以访问特定信息或动态信息或引起所请求的操作
。
例如,一些天气域访问国家天气服务
API
以获取天气报告信息
。
[0006]许多
API
需要提供请求者
ID
的请求,并且
API
提供商存储分配给每个请求者
ID
的多个信用额度
(credit)。
每个
API
请求都消耗一定数量的信用额度
。
这样的
API
跟踪每个请求者的信用额度,并且将每个请求者限制在仅一定数量的信用额度
。
一些这样的
API
每天提供多个信用额度
。
一些这样的实施例允许请求者购买信用额度
。
[0007]许多虚拟助理系统使用客户端
‑
服务器架构,其中客户端设备提供用户界面,并且服务器提供高性能处理和对大量数据的访问
。
各种系统从诸如电话
、
汽车
、
机器人
、
购物亭和电器之类的连网设备接受语音或其他形式的自然语言表达
。
[0008]为了支持用户易于访问这些系统的知识和能力,域还包括语法
。
语法是自然语言处理系统可用于将用户表达解析为指向域的表达的单词和短语的集合
。
语法具有对语法槽进行操作的语法规则,系统用来自表达的信息来填充语法槽
。
[0009]例如,给出天气报告的语法具有用于
<
位置
>
和
<
时间
>
的槽
。
如果用户询问“明天廷巴克图
(Timbuktu)
的天气怎么样”,则系统用值“Timbuctoo”来填充
<
位置
>
槽并且用值“明天”来填充
<
时间
>
槽
。
如果用户说:“最近的至少4星级的法国餐厅在哪里”,则系统使用针对餐厅域的语法,其具有值为“法国”的
<
食物样式
>
槽以及值为“至少
4”的
<
星级
>
槽
。
如果用户说“向妈妈发消息:我爱你”,则系统使用针对
SMS
短信发送域的语法槽,并用“妈妈”填充
<
接收者
>
槽并且用“我爱你”填充
<
消息
>
槽
。
如果用户说“猫有多少个爪子”,则系统使用动物域语法,并用值“猫”来填充槽
<
物种
>
,用“爪子”来填充槽
<
属性
>
,用“多少”来填充槽
<
问题
>。
某些系统存储用户表达的历史
。
[0010]通常,虚拟助理具有的域越多,喜欢它的用户越多,用户越喜欢虚拟助理,域提供商越有动机来创建和改进域
。
[0011]分类
[0012]分类是一种有用的监督式机器学习算法
。
它基于包含其类别成员已知并被标记的值的数据的训练集,来计算未知值属于一组类别中的哪一个类别的概率
。
分类结果是概率分布,尽管一些算法只输出最可能的值
。
例如,考虑个人汽车的大型数据集,每个汽车都以其品牌
(
如大众汽车或法拉利
)
来标记,并以其颜色
(
如红色或银色
)
来标记
。
对于未看见的法拉利,分类算法可以计算它是红色的概率和它是银色的概率
。
对于未看见的红色轿车,分类算法可以计算它是法拉利的概率和它是大众汽车的概率
。
[0013]对人的分类对于许多目的是有用的
。
广告是一个
。
例如,男性和女性对一些广告采用非常不同的兴趣水平进行响应
。
给定人物名称和性别的大型数据集,知道新用户名称的系统可以计算用户是男性或女性的概率
。
因此,系统可以选择展示最感兴趣的广告
。
技术实现思路
[0014]本公开涉及应用机器学习算法以基于语法槽的值对虚拟助理用户进行分类的系统
、
方法和计算机可读介质
。
还公开了用于分类客户端的提供训练数据以接收高价值分类的系统
、
方法和计算机可读介质
。
还公开了使用分类来提高对自然语言表达的解释的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种选择广告的方法,包括:向虚拟助理提供商的
web
应用编程接口
(API)
发送针对分类的请求,所述请求包括用户身份
(ID)
;从所述
web API
接收对应于所述用户
ID
的分类;至少部分地根据所述分类来选择多个广告中的一个广告;以及从所述虚拟助理提供商请求
API
信用额度
。2.
根据权利要求1所述的方法,还包括:向所述虚拟助理提供商提供针对多个用户的标记有感兴趣属性的用户
ID
数据
。3.
根据权利要求1所述的方法,还包括:选择用于分类的语法槽的子集
。4.
根据权利要求1所述的方法,还包括:对多个语法槽子集测试分类请求
。5.
一种计算机可读介质,其上存储有指令,所述指令在由计算机系统执行时使得所述计算机系统:向虚拟助理提供商的
web
【专利技术属性】
技术研发人员:郑永强,普仲朗,
申请(专利权)人:声音猎手公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。