【技术实现步骤摘要】
特征选择系统
技术介绍
[0001]总体而言,产品和服务可以根据其特征来限定。特征通常包括数字度量。对于复杂的产品和服务,可以使用基于网络的平台来标识和持续追踪不断增长的相关特征和度量的数量。
技术实现思路
[0002]本说明书总体描述了一种使用自然语言处理来处理来自数据源的信息,以标识特定实体(例如,公司)的特征集的系统。特征选择引擎使用机器学习技术来基于特定实体的特征从特征库选择相关特征。所选择的特征可以显示在用户界面上,例如用于编辑和更新特征。
[0003]总体而言,本说明书中描述的主题的一个创新方面可以在以下方法中实施,这些方法包括以下动作:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的数据来标识特定实体的候选特征集;加载包括多个特征的特征库,多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于特定实体的候选特征集从特征空间中的每个特征空间选择一个或多个特征。该方面的其他实现包括被配置为执行编码在计算机存储设备上的方法的动作的相应系统、装置和计算机程序。
[0004]这些和其他实现可以各自可选地包括以下特征中的一个或多个特征。
[0005]在一些实现中,标识特定实体的候选特征集包括:从与实体相关联的文本、音频、图像或视频数据提取文本;以及使用自然语言处理(NLP)模型,基于与实体相关联的数据中的词的用法和上下文来创建特征相关词的向量。
[0006]在一些实现中,这些操作包括通过网络来接收与多个实体相关联的文本、音频、图像或视频数据中的 ...
【技术保护点】
【技术特征摘要】
1.一种计算机实现的方法,包括:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据来标识特定实体的候选特征集;加载包括多个特征的特征库,所述多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择一个或多个特征。2.根据权利要求1所述的计算机实现的方法,其中标识所述特定实体的候选特征集包括:从与所述实体相关联的所述文本、音频、图像或视频数据提取文本;以及使用自然语言处理NLP模型,基于与所述实体相关联的所述数据中的词的使用和上下文来创建特征相关词的向量。3.根据权利要求1所述的计算机实现的方法,还包括:通过网络来接收与多个实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据,标识包括所述感兴趣实体和多个附加实体的实体域;以及从特定域的特征库加载特定域的候选特征集,其中所述特征选择引擎基于所述特定实体的候选特征集和所述特定域的候选特征集,从所述特征空间中的每个特征空间选择所述一个或多个特征。4.根据权利要求3所述的计算机实现的方法,还包括:使用可解释的AI技术,向所选择的所述特征中的每个特征分配加权得分;以及基于所述加权得分来过滤所选择的所述特征。5.根据权利要求3所述的计算机实现的方法,其中:所述特征选择引擎在第一时间,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择包括一个或多个特征的第一特征集;并且所述特征选择引擎在所述第一时间之后的第二时间,基于所述特定实体的候选特征集和所述特定域的候选特征集,从所述特征空间中的每个特征空间选择包括一个或多个特征的第二特征集。6.根据权利要求3所述的计算机实现的方法,其中,所加载的所述特定域的候选特征中的每个候选特征还包括基线测量,所述方法还包括:针对所选择的所述特征中的每个特征,基于所述特定域的候选特征的所述基线测量来标识基线测量。7.根据权利要求3所述的计算机实现的方法,还包括:标识由所述特定实体的候选特征集或所述特定域的候选特征集包括的、并且不由所述特征库包括的一个或多个定制特征;以及将所述一个或多个定制特征存储在所述特征库中。8.根据权利要求1所述的计算机实现的方法,还包括:针对每个特征空间生成可视化,所述可视化呈现由所述特征选择引擎选择的所述特征和一个或多个未选择的特征两者;接收选择或取消选择所述特征中的一个或多个特征的用户输入;以及基于所述用户输入来更新所选择的所述特征。9.一种系统,包括:
一个或多个处理器;以及计算机可读存储设备,被耦合到所述一个或多个处理器并且其上存储有指令,所述指令在由所述一个或多个处理器执行时,使所述一个或多个处理器执行操作,所述操作包括:通过网络来接收与感兴趣实体相关联的文本、音频、图像或视频数据中的至少一个;基于所接收的所述数据来标识特定实体的候选特征集;加载包括多个特征的特征库,所述多个特征各自被分配给一个或多个特征空间;以及使用特征选择引擎,基于所述特定实体的候选特征集,从所述特征空间中的每个特征空间选择一个或多个特征。10.根据权利要求9所述的系统,其中标识所述特定实体的候选特征集包括:从与所述实体相关联的所述文本、音频、图像或视频数据提取文本;以及使用自然语言处理NLP模型,基于与所述实体相关联的所述数据中的词的使用和上下...
【专利技术属性】
技术研发人员:J,
申请(专利权)人:埃森哲环球解决方案有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。