机器学习输出与训练数据之间的动态用户界面比较制造技术

技术编号:39402428 阅读:11 留言:0更新日期:2023-11-19 15:54
本公开提供了促进机器学习输出与训练数据之间的动态用户界面比较的系统/技术。在各种实施方案中,系统可访问将在其上执行机器学习分类器的数据候选。在各个方面,该系统可经由该机器学习分类器的执行基于该数据候选生成预测分类。在各种情况下,该系统可在电子显示器上呈现置信度图,该置信度图视觉地描绘该数据候选和该预测分类如何好或如何差地拟合到已在其上训练该机器学习分类器的经注释训练数据集中。练数据集中。练数据集中。

【技术实现步骤摘要】
机器学习输出与训练数据之间的动态用户界面比较


[0001]本公开整体涉及机器学习,并且更具体地涉及机器学习输出与训练数据之间的动态用户界面比较。

技术介绍

[0002]机器学习分类器在以下两个阶段中实现:训练阶段和部署/推断阶段。在训练阶段期间,机器学习分类器被迭代地训练以准确地执行其期望的分类和/或确定。在部署/推断阶段期间,机器学习分类器在训练后在真实世界数据上被执行,使得所期望的分类和/或确定被应用于此类真实世界数据。遗憾的是,当经由现有技术实现部署/推断阶段时,存在机器学习分类器尽管已经被训练但仍不能准确地分类某些真实世界数据的显著可能性。
[0003]因此,可以解决这些技术问题中的一个或多个技术问题的系统和/或技术可能是期望的。

技术实现思路

[0004]以下呈现了
技术实现思路
以提供对本专利技术的一个或多个实施方案的基本理解。本
技术实现思路
不旨在标识关键或重要元素,也不旨在描绘具体实施方案的任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现概念,作为稍后呈现的更详细描述的序言。在本文所述的一个或多个实施方案中,描述了促进机器学习输出与训练数据之间的动态用户界面比较的设备、系统、计算机实现的方法、装置和/或计算机程序产品。
[0005]根据一个或多个实施方案,提供了一种系统。该系统可以包括可存储计算机可执行部件的计算机可读存储器。该系统还可以包括处理器,该处理器可以操作地联接到计算机可读存储器并且可以执行存储在计算机可读存储器中的计算机可执行部件。在各种实施方案中,该计算机可执行部件可以包括接收器部件。在各种情况下,该接收器部件可访问将在其上执行机器学习分类器的数据候选。在各个方面,该计算机可执行部件还可包括模型部件。在各种情况下,该模型部件可经由该机器学习分类器的执行基于该数据候选生成预测分类,其中该机器学习分类器可接收该数据候选作为输入,并且其中该机器学习分类器可产生该预测分类作为输出。在各种情况下,该计算机可执行部件还可包括可视化部件。在各种情况下,该可视化部件可在电子显示器上呈现置信度图,该置信度图视觉地描绘该数据候选和该预测分类如何好或如何差地拟合到已在其上训练该机器学习分类器的经注释训练数据集中,其中该置信度图可包括分别对应于至少一个数据特征的至少一条坐标轴,其中可沿该至少一条坐标轴在该置信度图中绘制该经注释训练数据集的至少某个部分并且可根据真值分类对其进行颜色编码或符号编码,并且其中可沿该至少一条坐标轴在该置信度图中绘制该数据候选并且可根据该预测分类对其进行颜色编码或符号编码。
[0006]根据一个或多个实施方案,上述系统可被实现为计算机实现的方法和/或计算机程序产品。
附图说明
[0007]本专利或专利申请文件包含至少一个彩色绘制的附图。带有彩色附图的本专利或专利申请公布的副本将在提出请求并支付必要费用后由专利局提供。
[0008]图1示出了根据本文所述的一个或多个实施方案的示例性非限制性系统的框图,该系统促进机器学习输出与训练数据之间的动态用户界面比较。
[0009]图2示出了根据本文所述的一个或多个实施方案的数据候选的示例性非限制性框图,该数据候选具有一个或多个数据特征。
[0010]图3示出了根据本文所述的一个或多个实施方案的经注释训练数据集的示例性非限制性框图。
[0011]图4示出了根据本文所述的一个或多个实施方案的包括预测分类的示例性非限制性系统的框图,该系统促进机器学习输出与训练数据之间的动态用户界面比较。
[0012]图5示出了根据本文所述的一个或多个实施方案的示例性非限制性框图,其示出了可如何基于数据候选来生成预测分类。
[0013]图6示出了根据本文所述的一个或多个实施方案的包括经注释训练子集的示例性非限制性系统的框图,该系统促进机器学习输出与训练数据之间的动态用户界面比较。
[0014]图7示出了根据本文所述的一个或多个实施方案的示例性非限制性框图,其示出了可如何从经注释训练数据集选择经注释训练子集。
[0015]图8示出了根据本文所述的一个或多个实施方案的经注释训练子集的示例性非限制性框图。
[0016]图9示出了根据本文所述的一个或多个实施方案的包括置信度图的示例性非限制性系统的框图,该系统促进机器学习输出与训练数据之间的动态用户界面比较。
[0017]图10示出了根据本文所述的一个或多个实施方案的置信度图的示例性非限制性视图,该置信度图基于经注释训练数据集的子集。
[0018]图11示出了根据本文所述的一个或多个实施方案的置信度图的示例性非限制性视图,该置信度图基于经注释训练数据集的整体。
[0019]图12示出了根据本文所述的一个或多个实施方案的示例性非限制性医学图形用户界面,其描绘了置信度图。
[0020]图13示出了根据本文所述的一个或多个实施方案的包括推断部件的示例性非限制性系统的框图,该系统促进机器学习输出与训练数据之间的动态用户界面比较。
[0021]图14示出了根据本文所述的一个或多个实施方案的示例性非限制性计算机实现的方法的流程图,该计算机实现的方法促进机器学习输出与训练数据之间的动态用户界面比较。
[0022]图15示出了示例性非限制性操作环境的框图,在该操作环境中可促进本文所述的一个或多个实施方案。
[0023]图16示出了可操作为执行本文所述的各种具体实施的示例性联网环境。
具体实施方式
[0024]以下具体实施方式仅仅是示例性,并非旨在限制实施方案和/或实施方案的应用或使用。此外,并不意图受前述“
技术介绍
”或“
技术实现思路
”部分或者“具体实施方式”部分中
提出的任何明示或暗示信息的约束。
[0025]现在参考附图描述一个或多个实施方案,其中相同的附图标号始终用于表示相同的元件。在以下描述中,出于说明的目的,阐述了许多具体细节以便提供对一个或多个实施方案的更透彻理解。然而,很明显,在各种情况下,可以在没有这些具体细节的情况下实践一个或多个实施方案。
[0026]机器学习分类器(例如,神经网络分类器、支持矢量机分类器、朴素贝叶斯分类器、线性和/或逻辑回归分类器、决策树分类器、随机森林分类器)可在以下两个阶段中实现:训练阶段和部署/推断阶段。在训练阶段期间,机器学习分类器可被迭代地训练(例如,经由用于神经网络的反向传播、经由用于决策树的样本分割)以准确地执行其期望的分类和/或确定。在部署/推断阶段期间(例如,其在训练之后发生),可在真实世界数据上执行机器学习分类器,使得可将期望的分类和/或确定应用于此类真实世界数据。
[0027]遗憾的是,当经由现有技术实现部署/推断阶段时,存在机器学习分类器尽管已经被训练但仍不能准确地分类某些真实世界数据的显著可能性。特别地,仅可在真实世界数据上准确地执行机器学习分类器,该真实世界数据与已在其上训练机器学习分类器的数据充分地“相似”。如果在不与已在其上训练机器学习分类器的数据充分地“相似”的给定数据片上执行机器学习分类器,则由本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,所述系统包括:处理器,所述处理器执行存储在计算机可读存储器中的计算机可执行部件,所述计算机可执行部件包括:接收器部件,所述接收器部件访问将在其上执行机器学习分类器的数据候选;模型部件,所述模型部件经由所述机器学习分类器的执行基于所述数据候选生成预测分类,其中所述机器学习分类器接收所述数据候选作为输入,并且其中所述机器学习分类器产生所述预测分类作为输出;和可视化部件,所述可视化部件在电子显示器上呈现置信度图,所述置信度图视觉地描绘所述数据候选和所述预测分类如何好或如何差地拟合到已在其上训练所述机器学习分类器的经注释训练数据集中,其中所述置信度图包括分别对应于至少一个数据特征的至少一条坐标轴,其中沿所述至少一条坐标轴在所述置信度图中绘制所述经注释训练数据集的至少某个部分并且根据真值分类对其进行颜色编码或符号编码,并且其中沿所述至少一条坐标轴在所述置信度图中绘制所述数据候选并且根据所述预测分类对其进行颜色编码或符号编码。2.根据权利要求1所述的系统,其中根据与所述经注释训练数据集的所述至少某个部分不同的大小或不同的形状在所述置信度图中绘制所述数据候选。3.根据权利要求1所述的系统,其中所述置信度图是一维柱状图、二维散点图、三维散点图、热图、密度图或t分布随机邻域嵌入图。4.根据权利要求1所述的系统,其中所述置信度图是散点图,并且其中所述置信度图包括所述经注释训练数据集的所述至少某个部分的第一组特征分布,其中所述第一组特征分布对应于所述至少一个数据特征的第一数据特征,并且其中根据真值分类对所述第一组特征分布进行颜色编码或符号编码。5.根据权利要求4所述的系统,其中所述置信度图识别所述第一组特征分布中的哪个特征分布具有最接近所述数据候选的均值。6.根据权利要求1所述的系统,其中所述计算机可执行部件还包括:过滤器部件,所述过滤器部件基于用户提供的输入来选择所述经注释训练数据集的所述至少某个部分。7.根据权利要求1所述的系统,其中所述计算机可执行部件还包括:过滤器部件,所述过滤器部件基于所述数据候选来选择所述经注释训练数据集的所述至少某个部分。8.根据权利要求1所述的系统,其中所述数据候选是描绘医学患者的解剖结构的医学图像,其中所述预测分类是病理诊断,并且其中所述至少一个数据特征包括与所述解剖结构相关联的尺寸度量或形状度量。9.一种计算机实现的方法,所述计算机实现的方法包括:由操作地联接到处理器的设备访问将在其上执行机器学习分类器的数据候选;由所述设...

【专利技术属性】
技术研发人员:尼古拉斯
申请(专利权)人:通用电气精准医疗有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1