特征选择系统技术方案

技术编号:38413141 阅读:13 留言:0更新日期:2023-08-07 11:18
一种特征选择系统。该文档描述了一种计算机实现的方法,该方法包括:通过网络接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的数据来标识特定实体的候选特征集;加载包括多个特征的特征库,多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于特定实体的候选特征集,从特征空间中的每个特征空间选择一个或多个特征。个特征。个特征。

【技术实现步骤摘要】
特征选择系统

技术介绍

[0001]总体而言,产品和服务可以根据其特征来限定。特征通常包括数字度量。对于复杂的产品和服务,可以使用基于网络的平台来标识和持续追踪不断增长的相关特征和度量的数量。

技术实现思路

[0002]本说明书总体描述了一种使用自然语言处理来处理来自数据源的信息,以标识特定实体(例如,公司)的特征集的系统。特征选择引擎使用机器学习技术来基于特定实体的特征从特征库选择相关特征。所选择的特征可以显示在用户界面上,例如用于编辑和更新特征。
[0003]总体而言,本说明书中描述的主题的一个创新方面可以在以下方法中实施,这些方法包括以下动作:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的数据来标识特定实体的候选特征集;加载包括多个特征的特征库,多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于特定实体的候选特征集从特征空间中的每个特征空间选择一个或多个特征。该方面的其他实现包括被配置为执行编码在计算机存储设备上的方法的动作的相应系统、装置和计算机程序。
[0004]这些和其他实现可以各自可选地包括以下特征中的一个或多个特征。
[0005]在一些实现中,标识特定实体的候选特征集包括:从与实体相关联的文本、音频、图像或视频数据提取文本;以及使用自然语言处理(NLP)模型,基于与实体相关联的数据中的词的用法和上下文来创建特征相关词的向量。
[0006]在一些实现中,这些操作包括通过网络来接收与多个实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的数据标识包括感兴趣实体和多个附加实体的实体域;以及从特定域的特征库加载特定域的候选特征集,其中特征选择引擎基于特定实体的候选特征集和特定域的候选特征集从特征空间中的每个特征空间选择一个或多个特征。
[0007]在某些情况下,这些操作可以包括使用可解释的AI技术向所选择的特征中的每个特征分配加权得分;以及基于加权得分来过滤所选择的特征。
[0008]在一些实现中,特征选择引擎在第一时间,基于特定实体的候选特征集,从特征空间中的每个特征空间选择包括一个或多个特征的第一特征集;以及特征选择引擎在第一时间之后的第二时间,基于特定实体的候选特征集和特定域的候选特征集,从特征空间中的每个特征空间选择包括一个或多个特征的第二特征集。
[0009]在一些实现中,所加载的特定域的候选特征中的每个候选特征还包括基线测量,并且这些操作包括针对所选择的特征中的每个特征,基于特定域的候选特征的基线测量来标识基线测量。
[0010]在一些实现中,这些操作可以包括标识由特定实体的候选特征集或特定域的候选特征集包括的、并且不由特征库包括的一个或多个定制特征;以及将一个或多个定制特征存储在特征库中。
[0011]在一些实现中,这些操作可以包括针对每个特征空间生成可视化,该可视化呈现由特征选择引擎选择的特征和一个或多个未选特征两者;接收选择或取消选择特征中的一个或多个特征的用户输入;以及基于用户输入来更新所选择的特征。
[0012]应当理解,根据本公开的方法可以包括本文描述的方面和特征的任何组合。也就是说,例如,根据本公开的装置和方法不限于本文具体描述的方面和特征的组合,还可以包括所提供的方面和特征的任何组合。
[0013]本公开的一个或多个实现的细节在附图和下面的描述中阐述。从说明书、附图和权利要求书中可以明显看出本公开的其他特征和优点。
附图说明
[0014]图1描绘了用于选择特征的示例系统。
[0015]图2描绘了示例特征树。
[0016]图3是用于选择特征的示例过程的流程图。
[0017]图4描绘了可以执行本公开的实现的示例系统。
[0018]各种附图中相同的附图标记和名称表示相同的元素。
具体实施方式
[0019]在大多数技术和商业上下文中,“成功”传统上是用数字度量来定义的,这些数字度量通常写入客户

供应方合同或服务级别协议。这种协议的各方一般能够评估合作是否成功。近年来,人们的观点发生了变化,即这种协议的各方对非合同协议当事方的其他利益相关方(例如,股东、雇员、客户和供应方)以及公众负有责任。虽然各方可以继续用数字来限定成功,但其他利益相关方的预期正开始塑造客户

供应方关系。
[0020]例如,轮胎制造方和汽车制造方可以有协议,其中轮胎制造方向汽车制造方供应某一型号的轮胎。传统上,协议可能规定了性能度量,诸如制动距离,以及财务度量,诸如单位价格。然而,随着电动汽车的出现,度量的数量可能会增加,以包括例如可能影响胎面图案设计和材料选择的道路噪声需求。此外,电动汽车可能意味着外部利益相关方对可持续性的某些预期,这也会影响材料选择以及轮胎的制造方式。当面对复杂性的突然增加和优先事项的转移时,各方可能会过度强调一些关注领域,而忽视其他领域,从而导致对工程项目的不完整或不平衡的概述。
[0021]在商业环境中,例如在咨询领域,也可能面临类似的问题。虽然传统上聘用顾问来改进财务度量,但现在有预期,即通过各种方式同时改进性能。在合约开始时,客户的管理人员与高级顾问会面,以标识改进领域、在这些领域中改进的动作和措施,以及用于测量改进的度量。一般而言,客户清楚地说明改进领域,并且顾问建议动作、措施和度量。当面临各种潜在问题时,客户的上层管理可能会过于关注某一特定领域,诸如多样性或可持续性,例如,由于一系列负面的公共关系事件。相反,高级顾问可能明显倾向于通过从过去与其他客户的合约中熟悉的特定度量来追踪改进。
[0022]因此,需要灵活和稳健的工具来找准和追踪针对众多项目的预期的平衡集。在本公开中,预期可以用特征来限定,例如,目标、动作和度量。更具体地,本公开描述了特征树的集合,每个特征树包含结构化的客户相关信息,以及如何利用该集合来使用人工智能以
标识针对单个客户的特征。如示例所示,特征树应用于各种上下文和情况。除了提供平衡的动作和度量谱之外,本公开的实现还可以适合于自动追踪,并且甚至可以与客户的操作系统(例如,企业资源规划系统)交互,以自动将所标识的动作实现为客户操作的部分。
[0023]图1描绘了用于选择特征的示例系统100。示例系统100包括数据源110、特征库120、特征选择引擎130和用户界面140。如下文更详细地描述的,数据源110可以包括与感兴趣实体相关联的公共和/或内部信息。来自数据源110的信息被用来汇编特定实体的候选特征150的列表。特征选择引擎130可以用于选择从特征库120加载的一个或多个特征160。在一些情况下,特征库120包括多个特征树,每个特征树属于特征空间或关注领域。如下文更详细地描述的,系统100的一些实现被配置为与企业资源规划系统180或其他信息消费方交换数据。在一些实现中,系统100还可以包括相关性引擎190。
[0024]特征树可以用于根据层级结构来组织信息。例如,特征树可以将前述电动汽车的特征分组为例如底盘、动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法,包括:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据来标识特定实体的候选特征集;加载包括多个特征的特征库,所述多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择一个或多个特征。2.根据权利要求1所述的计算机实现的方法,其中标识所述特定实体的候选特征集包括:从与所述实体相关联的所述文本、音频、图像或视频数据提取文本;以及使用自然语言处理NLP模型,基于与所述实体相关联的所述数据中的词的使用和上下文来创建特征相关词的向量。3.根据权利要求1所述的计算机实现的方法,还包括:通过网络来接收与多个实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据,标识包括所述感兴趣实体和多个附加实体的实体域;以及从特定域的特征库加载特定域的候选特征集,其中所述特征选择引擎基于所述特定实体的候选特征集和所述特定域的候选特征集,从所述特征空间中的每个特征空间选择所述一个或多个特征。4.根据权利要求3所述的计算机实现的方法,还包括:使用可解释的AI技术,向所选择的所述特征中的每个特征分配加权得分;以及基于所述加权得分来过滤所选择的所述特征。5.根据权利要求3所述的计算机实现的方法,其中:所述特征选择引擎在第一时间,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择包括一个或多个特征的第一特征集;并且所述特征选择引擎在所述第一时间之后的第二时间,基于所述特定实体的候选特征集和所述特定域的候选特征集,从所述特征空间中的每个特征空间选择包括一个或多个特征的第二特征集。6.根据权利要求3所述的计算机实现的方法,其中,所加载的所述特定域的候选特征中的每个候选特征还包括基线测量,所述方法还包括:针对所选择的所述特征中的每个特征,基于所述特定域的候选特征的所述基线测量来标识基线测量。7.根据权利要求3所述的计算机实现的方法,还包括:标识由所述特定实体的候选特征集或所述特定域的候选特征集包括的、并且不由所述特征库包括的一个或多个定制特征;以及将所述一个或多个定制特征存储在所述特征库中。8.根据权利要求1所述的计算机实现的方法,还包括:针对每个特征空间生成可视化,所述可视化呈现由所述特征选择引擎选择的所述特征和一个或多个未选择的特征两者;接收选择或取消选择所述特征中的一个或多个特征的用户输入;以及基于所述用户输入来更新所选择的所述特征。9.一种系统,包括:
一个或多个处理器;以及计算机可读存储设备,被耦合到所述一个或多个处理器并且其上存储有指令,所述指令在由所述一个或多个处理器执行时,使所述一个或多个处理器执行操作,所述操作包括:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据来标识特定实体的候选特征集;加载包括多个特征的特征库,所述多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择一个或多个特征。10.根据权利要求9所述的系统,其中标识所述特定实体的候选特征集包括:从与所述实体相关联的所述文本、音频、图像或视频数据提取文本;以及使用自然语言处理NLP模型,基于与所述实体相关联的所述数据中的词的使用和上下...

【专利技术属性】
技术研发人员:J
申请(专利权)人:埃森哲环球解决方案有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1