公开了用于诊断和维修的进入半众源非结构化数据摘录中的领域知识注入。用于生成知识库的信息合成系统将领域知识注入到半众源摘录流水线中以用于从非结构化数据源提取信息。摘录流水线包括由大众工人完成的和/或机器化的任务链。信息合成系统将任务分发给大众工人和/或机器。对任务响应进行处理并且聚合以确定被用于更新知识库的新信息。
【技术实现步骤摘要】
用于诊断和维修的进入半众源非结构化数据摘录中的领域知识注入
本申请一般涉及一种用于注入领域知识并且生成用于众源和机器源数据摘录的任务的系统。
技术介绍
产品可以由许多组件组成,组件中的一些可以是可维修和/或可更换的。此外,产品对于操作来说是越来越复杂的。在操作的过程中,出于各种原因,产品可能并未如所意图的那样工作。例如,组件可能磨损或损坏,导致产品的不当操作或者产品无操作。一些产品可能包括自诊断特征。自诊断特征可能引起产品存储和/或显示可以指示问题的错误代码。在其它情况下,产品可能展现问题或症状而不存储错误代码。典型的过程可以包括读取错误代码并且基于错误代码而影响到维修。在一些情况下,错误代码可以指示若干问题。可能要求进一步的诊断和故障查找以确定问题的来源。在其它情况下,问题/症状可能没有关联的错误代码。在一些情况下,问题可能未通过制造商诊断和维修过程而被理解。已经典型地由领域专家来产生产品诊断和维修文档化。例如,制造商可以让专家承担生成产品维修手册的任务。维修手册可以包括诊断和维修过程。
技术实现思路
一种用于生成知识库的信息合成系统,包括:计算系统,其被编程为:将包括用于从非结构化源提取信息的任务的模板分发到任务执行方,从任务执行方接收任务结果作为模板中的响应,标识在任务结果中出现的但是从知识库缺少的领域知识表示,生成定义任务并且包括领域知识表示以用于从非结构化源提取附加的信息的模板。任务可以被定义为仅人类任务、机器任务和机器引导的任务。计算系统可以被进一步编程以基于任务执行方的可用性和任务执行方的准确度来分发模板。任务可以包括摘录来自非结构化数据源的信息。任务可以包括摘录包含在视频的至少一部分中的信息。计算系统可以被进一步编程以验证从任务执行方中的每个接收的任务结果并且响应于任务完成时间小于所述视频的所述部分的持续时间的预定百分比而将任务结果标识为无效。计算系统可以被进一步编程以验证来自任务执行方中的每个的任务结果并且响应于如下而将任务结果标识为无效:(i)任务结果对于预定数量的响应而言相同;(ii)任务结果包括标识从与任务结果对应的原始源缺少的组件的术语;以及(iii)任务结果与由其它任务执行方提交的任务结果相比是独特的。计算系统可以被进一步编程以保持用于任务的数据链,对于任务中的每个而言,该数据链包括针对任务中的每个的:定义原始源的数据:原始源的相关部分;相关部分的摘录;以及从摘录得出的最终摘要。计算系统可以被进一步编程以通过将数据链提供给作为训练输入的一个或多个机器学习模型来促进机器学习模型的训练。计算系统可以被进一步编程以在分发模板之前预测任务执行方的准确度。一种用于由计算系统更新知识库的方法,包括:保持用于任务执行方的惩罚分数;以及响应于惩罚分数小于预定阈值而将任务分发给任务执行方。方法进一步包括:响应于任务执行方提供多于预定数量的对包含未出现在与任务关联的原始源中的特定领域的表示的任务的响应,将用于任务执行方的惩罚分数增加到大于预定阈值的值。方法可以进一步包括:响应于接收到多于预定数量的来自任务执行方的针对不同的任务同样的响应,将用于任务执行方的惩罚分数增加到大于预定阈值的值。方法可以进一步包括:响应于任务执行方提供多于预定数量的对于同一任务的与由其它任务执行方提交的响应相比是独特的响应,将用于任务执行方的惩罚分数增加到大于预定阈值的值。方法可以进一步包括:响应于任务执行方在小于所分配的视频区段的运行时间的预定百分比的时间中完成视频摘录任务,增加用于任务执行方的惩罚分数。方法可以进一步包括使贡献于惩罚分数超过预定阈值的响应无效。一种用于合成来自非结构化数据源的信息以更新维修知识库的方法,包括:标识具有与维修知识库有关的特定领域的知识的原始源的相关部分;以及创建包括用于对相关部分中的每个进行摘录的任务的模板。方法进一步包括:基于任务执行方的可用性和准确度将模板分发给任务执行方;以及聚合来自于由任务执行方完成的模板的解决方案以创建被描述为动作动词后接组件名称的维修解决方案。方法进一步包括:利用来自维修解决方案的未出现在维修知识库中的特定领域的表示来更新维修知识库;以及基于特定领域的表示来创建并且分发新模板。方法可以进一步包括:使用原始源、相关部分、摘要和维修解决方案作为训练数据来创建新的机器学习模型以用于更新机器学习模型。维修解决方案可以被描述为动作动词后接组件名称。原始源可以是在网站上访问的文档。原始源可以是在网站上访问的视频。附图说明图1描绘针对用于开发知识库的信息合成系统的可能配置。图2描绘针对用于信息合成系统的处理的可能框图。图3A和图3B描绘用于第一示例模板的可能显示输出。图4A和图4B描绘用于第二示例模板的可能显示输出。图5A和图5B描绘用于第三示例模板的可能显示输出。图6描绘用于第四示例模板的可能显示输出。图7描绘用于第五示例模板的可能显示输出。图8描绘用于第六示例模板的可能显示输出。图9描绘用于第七示例模板的可能显示输出。图10描绘用于第八示例模板的可能显示输出。图11描绘用于摘录工作流的操作的可能序列。图12描绘用于可以由任务配置器管理的任务的类型的框图。图13描绘用于保持轨迹数据以用于更新知识库的框图。图14描绘用于实现信息合成系统的操作的可能的序列。具体实施方式在此描述本公开的实施例。然而,要理解所公开的实施例仅是示例,并且其它实施例可以采取各种各样的形式和替换的形式。各图未必成比例;一些特征可能被放大或最小化以示出特定组件的细节。因此,在此公开的具体结构和功能细节不应被解释为限制性的,而仅作为用于教导本领域技术人员以各种方式采用本专利技术的代表性基础。如本领域普通技术人员将理解的,参照各图中的任何一个来图示并且描述的各种特征可以与在一个或多个其它的图中图示的特征组合,以产生未明确地图示或描述的实施例。所图示的特征的组合提供用于典型应用的代表性实施例。然而,对于特定应用或实现而言,与本公开的教导一致的特征的各种组合和修改可能是合期望的。生成诊断和维修指令的现有方法一般已经借助了特定领域中的专家。例如,机动车维修知识库可以依赖于经训练的机械师或相似领域知识的其他人的专长。具有领域专长是有利的,因为专家了解领域的典型的标准术语和过程。这样的方法的缺点在于:每个领域要求不同的专家,并且未必借助非专家的努力。在这些类型的活动中使用非专家可以减少成本。可以通过将众源模型应用于生成诊断和维修知识库来实现一些益处。众源系统可以被用于通过将高认知性的任务(例如,照片或所写文本的意义理解)分解为可以由没有专业技能(例如,没有广泛的领域知识)的普通人类工人容易地完成的相对低认知性的任务来完成高认知性的任务。众多的工人可以被注册在众源市场(诸如AmazonMechanicalTurk)中。各种设计模式(例如寻找—提取—证实模式)和质量控制机制(例如多数投票、黄金标准注入)是通过使来自大众工人的任务结本文档来自技高网...
【技术保护点】
1.一种用于生成知识库的信息合成系统,包括:/n计算系统,其被编程以将包括用于从非结构化源提取信息的任务的模板分发给任务执行方,从任务执行方接收任务结果作为模板中的响应,标识在任务结果中出现的但是从知识库缺少的领域知识表示,生成定义任务并且包括领域知识表示以用于从非结构化源提取附加的信息的模板。/n
【技术特征摘要】
20181228 US 16/2347831.一种用于生成知识库的信息合成系统,包括:
计算系统,其被编程以将包括用于从非结构化源提取信息的任务的模板分发给任务执行方,从任务执行方接收任务结果作为模板中的响应,标识在任务结果中出现的但是从知识库缺少的领域知识表示,生成定义任务并且包括领域知识表示以用于从非结构化源提取附加的信息的模板。
2.如权利要求1所述的系统,其中,任务被定义为仅人类任务、机器任务和机器引导的任务。
3.如权利要求1所述的系统,其中,计算系统被进一步编程以基于任务执行方的可用性和任务执行方的准确度来分发模板。
4.如权利要求1所述的系统,其中,任务包括摘录来自非结构化数据源的信息。
5.如权利要求1所述的系统,其中,任务包括摘录包含在视频的至少一部分中的信息。
6.如权利要求5所述的系统,其中,计算系统被进一步编程以验证从任务执行方中的每个接收的任务结果,并且响应于任务完成时间小于视频的所述部分的持续时间的预定百分比而将任务结果标识为无效。
7.如权利要求1所述的系统,其中,计算系统被进一步编程以验证来自任务执行方中的每个的任务结果,并且响应于如下而将任务结果标识为无效:(i)任务结果对于预定数量的响应而言相同;(ii)任务结果包括标识从与任务结果对应的原始源缺少的组件的术语;以及(iii)任务结果与由其它任务执行方提交的任务结果相比是独特的。
8.如权利要求1所述的系统,其中,计算系统被进一步编程以保持用于任务的数据链,对于任务中的每个而言,该数据链包括针对任务中的每个的:定义原始源的数据:原始源的相关部分;相关部分的摘录;以及从摘录得出的最终摘要。
9.如权利要求8所述的系统,其中,计算系统被进一步编程以通过将数据链提供给一个或多个机器学习模型作为训练输入来促进机器学习模型的训练。
10.如权利要求1所述的系统,其中,计算系统被进一步编程以在分发模板之前预测任务执行方的准确度。
11.一种用于更新知识库的方法,包括:...
【专利技术属性】
技术研发人员:JE金,WY林,L余,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。