检测与报告相关的问题制造技术

技术编号:23485283 阅读:36 留言:0更新日期:2020-03-10 12:44
本公开的实施例涉及检测与报告相关的问题。一种设备可以接收与以下内容相关的数据:与组织相关联的历史报告、历史报告的历史审计和与历史报告相关联的个体。设备可以确定针对数据的多实体简档。多实体简档可以包括数据的根据数据中所包括的属性集合的分组集合。设备可以使用多实体简档来确定针对历史报告的监督模型特征集合。设备可以使用多实体简档来独立于历史审计确定针对历史报告的无监督模型特征集合。设备可以利用模型来确定针对报告的分数。设备可以执行一个或者多个动作。

Test and report related problems

【技术实现步骤摘要】
检测与报告相关的问题
本公开的实施例涉及检测与报告相关的问题。
技术介绍
组织可以生成与组织的运营相关的各种类型的报告。例如,组织可以生成支出报告、时间报告、收入报告等。报告可以与个体(例如,提交报告的人、与报告的内容相关联的人等)、位置(例如,报告的主题内容的位置、与报告相关联的个体的位置等)、价值量(例如,针对支出报告的支出价值量、针对时间报告的时间价值量等)等相关联。
技术实现思路
根据一些可能的实现,一种方法可以包括:由设备接收与以下内容相关的数据:与组织相关联的历史报告,历史报告的历史审计,以及与历史报告相关联的个体;在接收到数据之后,由设备确定针对数据的多实体简档,其中多实体简档包括数据的根据数据中所包括的属性集合的分组集合;由设备使用多实体简档,基于历史审计来确定针对历史报告的监督模型特征集合,其中监督模型特征集合与在历史审计的上下文中训练模型以处理报告相关联;由设备使用多实体简档,独立于历史审计来确定针对历史报告的无监督模型特征集合,其中无监督模型特征集合与独立于历史审计的上下文训练模型以处理报告相关联;在模型使用监督模型特征集合和无监督模型特征集合而被训练之后,由设备利用模型来确定针对报告的分数,其中分数指示与报告相关的问题的可能性;以及由设备基于分数来执行一个或者多个动作。根据一些可能的实现,一种设备可以包括:一个或者多个存储器;以及一个或者多个处理器,该一个或者多个处理器被通信地耦合至一个或者多个存储器,该一个或者多个处理器用以:接收与训练模型相关的数据以标识报告中所包括的问题;在接收到数据之后确定针对数据的多实体简档,其中多实体简档包括数据的根据数据中所包括的属性集合的分组集合;使用多实体简档,基于历史审计来确定针对历史报告的监督模型特征集合,其中监督模型特征集合与在历史审计的上下文中训练模型以处理报告相关联;使用多实体简档来独立于历史审计确定针对历史报告的无监督模型特征集合,其中无监督模型特征集合与独立于历史审计的上下文训练模型以处理报告相关联;在模型使用监督模型特征集合和无监督模型特征集合而被训练之后,利用模型来处理报告以标识指示报告中是否包括问题的分数;以及基于分数来将报告标记为包括问题或者不包括问题。根据一些可能的实现,一种非瞬态计算机可读介质存储指令,这些指令包括:一个或者多个指令,该一个或者多个指令在由一个或者多个处理器执行时使一个或者多个处理器:接收将被用来训练模型的数据以标识报告中所包括的问题,其中数据与以下内容相关:与组织相关联的历史报告,历史报告的历史审计,以及与历史报告相关联的个体;在接收到数据之后确定针对数据的多实体简档,其中多实体简档包括数据的根据数据中所包括的属性集合的分组集合;使用多实体简档,基于历史审计来确定针对历史报告的监督模型特征集合,其中监督模型特征集合与在历史审计的上下文中训练模型以处理报告相关联;使用多实体简档来独立于历史审计确定针对历史报告的无监督模型特征集合,其中无监督模型特征集合与独立于历史审计的上下文训练模型以处理报告相关联;在确定监督模型特征集合和无监督模型特征集合之后,基于监督模型特征集合和无监督模型特征集合来训练模型;在训练模型之后,利用模型来确定针对报告的分数,其中分数指示与报告相关的问题的可能性;以及基于分数来执行一个或者多个动作。附图说明图1A至图1G是本文描述的示例实现的示意图。图2是可以实现本文描述的系统和/或方法的示例环境的示意图。图3是图2所示一个或者多个设备的示例组件的示意图。图4是用于检测与报告相关的问题的示例过程的流程图。图5是用于检测与报告相关的问题的示例过程的流程图。图6是用于检测与报告相关的问题的示例过程的流程图。具体实施方式以下对示例实现的详细描述参考附图。不同附图中的相同附图标记可以标识相同或者相似的元件。组织可以生成与组织的运营相关的各种类型的报告。组织可能想要对报告进行审计以确定组织所生成的报告是否包括问题(例如,是欺骗性的、是不准确的、不符合格式规则等)。一种用于对报告进行审计的技术可以包括:标识报告的样本(例如,随机样本、基于时间表的样本等)并且对报告的样本进行审计。虽然该技术可以标识报告中所包括的一些问题,但是该技术对于标识报告中的问题可能具有较低的准确度和/或可能是耗时的。另外,随着组织所生成的报告的数量增加,该技术可能难以随着数量的增加而扩展。这可以导致组织在某一时间段期间所生成的绝大多数(例如,百分之90或者更多)报告从未被审计过。这大大降低了组织标识和/或修整包括问题的报告的能力,从而消耗了组织的大量资源(例如,基于包含问题的报告而消耗的货币资源、使用包含问题的报告而消耗的时间资源、处理包含问题的报告而消耗的计算资源等)。本文描述的一些实现提供了一种报告分析平台,该报告分析平台能够利用机器学习模型来处理与组织相关联的报告(例如,数千、数百万或者更多的报告)并且检测报告中的问题。按照这种方式,报告分析平台可以按照快速并且有效的方式来处理组织所生成的绝大多数(例如,百分之90或者更多)或者全部报告。相对于其他技术,这提高了处理报告以标识问题的准确度。另外,这增加了组织处理与组织相关联的报告的能力的吞吐量,从而减少了或者消除了错过包括问题的报告的风险。进一步地,这节省了组织的由于使用其他技术来处理报告而将以其他方式消耗的资源(例如,货币资源、时间资源、计算资源等)。进一步地,按照这种方式,用于检测与报告相关的问题的过程的若干不同阶段是自动化的,这可以消除过程中的人类主观性和浪费,并且这可以提高过程的速度和效率以及节省计算资源(例如,处理器资源、存储器资源等)。此外,本文描述的实现使用严密的计算机化过程来执行先前未执行的或者先前使用主观人类直觉或者输入而执行的任务或者作用。进一步地,使用于检测与报告相关的问题的过程自动化节省了设备的在进行以下操作时将以其他方式被浪费的计算资源(例如,处理器资源、存储器资源等):尝试使用另一技术来处理组织所生成的报告和/或使用、处理等包含问题的报告。图1A至图1G是本文描述的示例实现100的示意图。如在图1A中示出的,实现100包括服务器设备、客户端设备、用户设备和报告分析平台。如通过附图标记105示出的,报告分析平台可以接收与处理与组织相关联的支出报告相关的数据。例如,数据可以与支出报告的历史审计(例如,标识历史支出报告的审计结果的数据)相关、与历史支出报告相关、与和组织相关联的雇员(或者其他个体)相关(例如,标识职位、位置、任期等的数据)、与各种货币之间的汇率相关等。在一些实现中,报告分析平台可以从服务器设备、客户端设备和/或用户设备接收数据。在一些实现中,报告分析平台可以基于请求数据、根据时间表、周期性地等来接收数据。在一些实现中,报告分析平台可以按照各种形式来接收数据。例如,报告分析平台可以按照图像的形式来接收数据(例如,与支出报告相关联的收据的图像、图像形式的历史审计等),可以接收数据作为文本(例如,被输入至支出报告系统本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n由设备接收与以下内容相关的数据:/n与组织相关联的历史报告,/n所述历史报告的历史审计,以及/n与所述历史报告相关联的个体;/n在接收到所述数据之后,由所述设备确定针对所述数据的多实体简档,/n其中所述多实体简档包括所述数据的根据所述数据中所包括的属性集合的分组集合;/n由所述设备使用所述多实体简档,基于所述历史审计确定针对所述历史报告的监督模型特征集合,/n其中所述监督模型特征集合与在所述历史审计的上下文中训练模型以处理报告相关联;/n由所述设备使用所述多实体简档,独立于所述历史审计确定针对所述历史报告的无监督模型特征集合,/n其中所述无监督模型特征集合与独立于所述历史审计的所述上下文训练所述模型以处理所述报告相关联;/n在所述模型使用所述监督模型特征集合和所述无监督模型特征集合而被训练之后,由所述设备利用所述模型来确定针对所述报告的分数,/n其中所述分数指示与所述报告相关的问题的可能性;以及/n由所述设备基于所述分数执行一个或者多个动作。/n

【技术特征摘要】
20180831 US 16/119,6061.一种方法,包括:
由设备接收与以下内容相关的数据:
与组织相关联的历史报告,
所述历史报告的历史审计,以及
与所述历史报告相关联的个体;
在接收到所述数据之后,由所述设备确定针对所述数据的多实体简档,
其中所述多实体简档包括所述数据的根据所述数据中所包括的属性集合的分组集合;
由所述设备使用所述多实体简档,基于所述历史审计确定针对所述历史报告的监督模型特征集合,
其中所述监督模型特征集合与在所述历史审计的上下文中训练模型以处理报告相关联;
由所述设备使用所述多实体简档,独立于所述历史审计确定针对所述历史报告的无监督模型特征集合,
其中所述无监督模型特征集合与独立于所述历史审计的所述上下文训练所述模型以处理所述报告相关联;
在所述模型使用所述监督模型特征集合和所述无监督模型特征集合而被训练之后,由所述设备利用所述模型来确定针对所述报告的分数,
其中所述分数指示与所述报告相关的问题的可能性;以及
由所述设备基于所述分数执行一个或者多个动作。


2.根据权利要求1所述的方法,其中确定所述监督模型特征集合包括:
基于以下中的至少一项来确定所述监督模型特征集合:
所述历史报告中所包括的并且在所述历史审计中所标识的不适用报告的模式,
对所述历史报告和所述历史审计的线性判别分析,或者
对所述历史报告和所述历史审计的文本分析。


3.根据权利要求1所述的方法,其中确定所述无监督模型特征集合包括:
基于以下中的至少一项来确定所述无监督模型特征集合:
对所述个体的个体内分析,
对所述个体的个体间分析,或者
对所述历史报告的内核密度估计(KDE)异常检测分析。


4.根据权利要求1所述的方法,其中确定所述多实体简档包括:
基于以下中的至少一项确定所述多实体简档:
所述个体,
与所述历史报告相关联的供应者,或者
与所述个体、所述供应者或者所述组织相关联的位置。


5.根据权利要求1所述的方法,其中所述监督模型特征集合标识所述历史报告中所包括的适用历史报告和非适用历史报告的特征,
其中所述非适用历史报告包括所述问题,而所述适用历史报告不包括所述问题。


6.根据权利要求1所述的方法,其中所述无监督模型特征集合标识指示与所述历史报告相关的所述数据的模式的所述历史报告的特征。


7.根据权利要求1所述的方法,其中执行所述一个或者多个动作包括:
基于所述分数将所述报告标记为包括所述问题或者不包括所述问题;以及
在数据结构中存储标识所述报告的信息和标识所述报告包括所述问题或者不包括所述问题的标识符。


8.一种设备,包括:
一个或者多个存储器;以及
一个或者多个处理器,被通信地耦合至所述一个或者多个存储器,所述一个或者多个处理器用以:
接收与训练模型相关的数据,以标识报告中所包括的问题;
在接收到所述数据之后,确定针对所述数据的多实体简档,
其中所述多实体简档包括所述数据的根据所述数据中所包括的属性集合的分组集合;
使用所述多实体简档,基于历史审计来确定针对历史报告的监督模型特征集合,
其中所述监督模型特征集合与在所述历史审计的上下文中训练所述模型以处理所述报告相关联;
使用所述多实体简档独立于所述历史审计确定针对所述历史报告的无监督模型特征集合,
其中所述无监督模型特征集合与独立于所述历史审计的所述上下文训练所述模型以处理所述报告相关联;
在所述模型使用所述监督模型特征集合和所述无监督模型特征集合而被训练之后,利用所述模型来处理所述报告,以标识指示所述问题是否被包括在所述报告中的分数;以及
基于所述分数来将所述报告标记为包括所述问题或者不包括所述问题。


9.根据权利要求8所述的设备,其中所述一个或者多个处理器还用以:
利用所述监督模型特征集合和所述无监督模型特征集合来训练所述模型,以标识所述问题被包括在所述报告中的可能性。


10.根据权利要求9所述的设备,其中所述一个或者多个处理器在处理所述报告时用以:
在训练所述模型之后处理所述报告,以标识所述报告中所包括的所述问题。


11.根据权利要求10所述的设备,其中所述一个或者多个处理器在处理所述报告时用以:
在训练所述模型之后,利用所述模型来确定针对所述报告的所述分数,
其中所述分数指示所述问题被包括在所述报告中的所述可能性;并且
其中所述一个或者多个处理器在对所述问题进行标记时用以:
在确定所述分数之后将所述报告标记为包括所述问题,
其中所述分数满足阈值,或者
在确定所述分数之后将所述报告标记为不包括所述问题,
其中所述分数不满足所述阈值。


12.根据权利要求8所述的设备,其中所述一个或者...

【专利技术属性】
技术研发人员:R·苏布拉玛尼安裘堃
申请(专利权)人:埃森哲环球解决方案有限公司
类型:发明
国别省市:爱尔兰;IE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1