用于确定分段的混合式主动机器学习系统和方法技术方案

技术编号:22472371 阅读:24 留言:0更新日期:2019-11-06 13:21
计算机系统可以基于实体的特征和相关标签执行半监督机器学习过程,以聚类群体中的多个实体。计算机系统可以生成表示实体的聚类和相关标签的可视化数据以显示在用户界面上。用户可以查看实体的聚类,并使用用户界面添加或修改与特定实体或实体集相关联的标签。计算机系统可以使用用户的反馈来更新标签,然后使用半监督的机器学习过程以更新后的标签作为输入来重新确定实体的聚类。因此,计算机系统可以使用用户的反馈来提高机器学习模型的准确性,而不需要更大量的标记的输入数据。

Hybrid active machine learning system and method for determining segments

【技术实现步骤摘要】
【国外来华专利技术】用于确定分段的混合式主动机器学习系统和方法相关申请交叉引用本申请是要求2017年3月17日提交的第15/462,675号美国专利申请的提交日的权益的国际专利申请,所述美国专利申请以全文引用的方式并入本文中以用于所有目的。
技术介绍
分段可用于划分广泛群体中的各种实体,使得特定分段中的实体具有类似的特征。例如,可以使用分段来识别不同对象和字符以用于图像识别,识别音频中的词语以用于语音识别,以及根据常见人口统计学或心理图像学(psychographics)识别个体市场。过去,使用由领域专家定义的规则集执行分段。近来,已经由机器学习过程执行分段,其能够识别群体数据中的模式。例如,机器学习过程可以构建模型以基于字母“a”的其它图像和其它字母的图像来识别图像中的字母“a”。当更多群体数据被输入机器学习过程时,这种机器学习过程可以构建更准确的模型。但是,获得足够的群体数据以提供足够的准确度可能是困难而且昂贵的。例如,获得成千上万的图像并且识别、标记所描绘的对象或字母可能是困难而且昂贵的。因此,需要改进的机器学习过程来构建更准确的模型。
技术实现思路
计算机系统可以执行基于用户反馈的半监督机器学习过程。半监本文档来自技高网...

【技术保护点】
1.一种方法,包括:由计算机从由多个个体执行的交易获得交易数据;由所述计算机获得与所述多个个体的子集相关联的标签数据,所述标签数据将一个或多个标签分配到所述子集的每个个体;由所述计算机使用所述交易数据和所述标签数据执行半监督机器学习过程;由所述计算机生成可视化数据,所述可视化数据基于所述半监督机器学习过程并且显示给用户,所述可视化数据表示所述多个个体的一个或多个分段;由所述计算机从与所述可视化数据对应的用户接收用户反馈;以及由所述计算机使用所述用户反馈、所述交易数据和所述标签数据执行所述半监督机器学习过程。

【技术特征摘要】
【国外来华专利技术】2017.03.17 US 15/462,6751.一种方法,包括:由计算机从由多个个体执行的交易获得交易数据;由所述计算机获得与所述多个个体的子集相关联的标签数据,所述标签数据将一个或多个标签分配到所述子集的每个个体;由所述计算机使用所述交易数据和所述标签数据执行半监督机器学习过程;由所述计算机生成可视化数据,所述可视化数据基于所述半监督机器学习过程并且显示给用户,所述可视化数据表示所述多个个体的一个或多个分段;由所述计算机从与所述可视化数据对应的用户接收用户反馈;以及由所述计算机使用所述用户反馈、所述交易数据和所述标签数据执行所述半监督机器学习过程。2.根据权利要求1所述的方法,还包括由所述计算机基于所述标签数据将所述多个个体分割成一个或多个个体分段,每个个体分段中的每个个体与所述标签数据中的特定标签相关联。3.根据权利要求1所述的方法,还包括由所述计算机基于所述交易数据确定初始特征集,所述初始特征集包括针对所述多个个体中的每个个体的初始特征集,其中,所述半监督机器学习过程包括基于所述初始特征集和所述标签数据确定更新特征集,所述更新特征集包括针对所述多个个体中的每个个体的更新特征集,并且其中,所述可视化数据的生成基于所述更新特征集和所述标签数据。4.根据权利要求3所述的方法,其中,所述初始特征集的确定基于深度嵌入式模型或自动编码器过程。5.根据权利要求3所述的方法,还包括由所述计算机执行以下各项中的一个或多个:基于所述更新特征集的t-分布随机邻域嵌入聚类过程,基于所述更新特征集的双聚类过程,和基于所述更新特征集的统计概略化过程,以及对与所述交易数据相关联的元数据的剖析过程,其中,所述可视化数据的生成基于以下各项中的一个或多个:所述t-分布随机邻域嵌入聚类过程、所述统计概略化过程、所述统计概略化过程以及所述剖析过程。6.根据权利要求3所述的方法,其中,所述半监督机器学习过程包括梯形网络过程,所述梯形网络过程使用基于所述初始特征集和所述更新特征集之一的无监督机器学习过程,以及基于所述初始特征集和所述更新特征集之一和所述标签数据和所述用户反馈中的一个或多个的监督学习过程。7.根据权利要求1所述的方法,还包括由所述计算机基于所述用户反馈修改所述标签数据,其中,响应于接收所述用户反馈而执行的所述半监督机器学习过程基于根据所述用户反馈修改的所述标签数据。8.根据权利要求7所述的方法,其中,所述用户反馈包括将第一标签应用到所述可视化数据中表示的第一个体的第一命令或从所述第一个体移除所述第一标签的第二命令。9.根据权利要求1所述的方法,还包括:由所述计算机基于所述半监督机器学习过程执行聚类算法,以确定所述多个个体的个体聚类;以及由所述计算机基于第一个体与第一个体聚类之间的距离修改与所述第一个体相关联的标签数据。10.根据权利要求1所述的方法,其中,所述交易数据包括图像识别数据或语音识别数据。11.一种机器学习计算机系统,包括:存储多个指令的计算机可读存储介质;和一个或多个处理器,所述一个或多个处...

【专利技术属性】
技术研发人员:苟良H·杨
申请(专利权)人:维萨国际服务协会
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1