【技术实现步骤摘要】
具有深度学习特征的指数建模优先权要求本申请要求于2018年10月29日提交的标题为“ExponentialModelingwithDeepLearningFeatures”的美国专利申请序列号62/752,128的优先权,其全部公开内容通过引用合并于此。
本公开总体上涉及机器学习。更具体地,本公开涉及机器学习模型,包括利用输出类别和嵌入参数之间的映射以提供压缩增益的指数模型(例如,最大熵模型)。
技术介绍
各种形式的机器学习模型已经彻底改变了机器智能的许多领域。作为一个早期的示例,在过去的某个时刻,最大熵模型在自然语言处理和其他
提供了最先进的性能。最大熵模型遵循以下原则:模型应根据给定信息提供尽可能少的偏差估计;也就是说,对于丢失信息最大程度地不置可否。然而,最近,人工神经网络(“神经网络”)已为包括自然语言处理在内的许多问题领域提供了最先进的解决方案。取代最大熵建模作为学习算法的一个主要原因是最大熵模型要使用的特征是手工的,而不是自动学习的。神经网络是一类机器学习模型,特别强大、准确或高效执行各种任务。神经网络可以包括一组连接节点,也可以被称为(人工)神经元或感知器。神经网络可以被组织成一层或多层。神经网络的节点可以与边连接,并且权重可以与每个边相关联。包含多层的神经网络可以被称为“深度”网络。深度网络可以包括输入层、输出层以及位于输入层和输出层之间的一个或多个隐藏层。神经网络的节点可以完全连接或不完全连接。示例神经网络包括前馈神经网络、递归神经网络、卷积神经网络、其他形式的 ...
【技术保护点】
1.一种计算机系统,包括:/n一个或多个处理器;以及/n一个或多个非暂时性计算机可读介质,共同存储机器学习分类模型,所述机器学习分类模型被配置为基于输入数据集合生成分类输出,所述分类输出包括分别用于多个离散类别的多个分类分数,每个离散类别的分类分数指示输入数据对应于离散类别的可能性;/n其中,机器学习分类模型包括嵌入模型和指数模型;/n其中,嵌入模型被配置为接收输入数据集合并基于输入数据集合产生嵌入,其中,所述嵌入包括分别用于在嵌入模型的最终层中包括的多个参数的多个参数值,其中,参数值的数量小于离散类别的数量;以及/n其中,指数模型被配置为接收嵌入并应用映射以生成分类输出,其中,映射描述在嵌入模型的最终层中包括的多个参数与多个离散类别之间的多个关系。/n
【技术特征摘要】
20181029 US 62/752,1281.一种计算机系统,包括:
一个或多个处理器;以及
一个或多个非暂时性计算机可读介质,共同存储机器学习分类模型,所述机器学习分类模型被配置为基于输入数据集合生成分类输出,所述分类输出包括分别用于多个离散类别的多个分类分数,每个离散类别的分类分数指示输入数据对应于离散类别的可能性;
其中,机器学习分类模型包括嵌入模型和指数模型;
其中,嵌入模型被配置为接收输入数据集合并基于输入数据集合产生嵌入,其中,所述嵌入包括分别用于在嵌入模型的最终层中包括的多个参数的多个参数值,其中,参数值的数量小于离散类别的数量;以及
其中,指数模型被配置为接收嵌入并应用映射以生成分类输出,其中,映射描述在嵌入模型的最终层中包括的多个参数与多个离散类别之间的多个关系。
2.根据权利要求1所述的计算机系统,其中,指数模型包括最大熵模型。
3.根据权利要求1所述的计算机系统,其中,多个关系为多个离散类别中的每一个指定这种离散类别被映射到的多个参数中的一个或多个。
4.根据权利要求1所述的计算机系统,其中,对于多个离散类别中的每一个,指数模型至少部分地基于提高到这种离散类别通过映射被映射到的参数值的第一和的幂的第一指数除以所有可能输出值之和来确定其相应分类分数。
5.根据权利要求1所述的计算机系统,其中,至少一个离散类别被映射到在嵌入模型的最终层中包括的两个或更多个参数。
6.根据权利要求1所述的计算机系统,其中,在嵌入模型的最终层中包括的至少一个参数被映射到两个或更多个离散类别。
7.根据权利要求1所述的计算机系统,其中,通过映射描述的多个关系中的至少一个是用户特定的。
8.根据权利要求1所述的计算机系统,其中,确定性地分配通过映射描述的多个关系中的至少一个。
9.根据权利要求1所述的计算机系统,其中,多个关系中的至少一个是机器学习的。
10.根据权利要求1所述的计算机系统,其中,多个离散类别包括在词汇表中包括的多个离散单词。
11.根据权利要求10所述的计算机系统,其中,通过映...
【专利技术属性】
技术研发人员:M温特劳布,AT苏雷什,E瓦里亚尼,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。