当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

从自由形式的表格式数据创建行项目信息制造技术

技术编号:27822825 阅读:20 留言:0更新日期:2021-03-30 10:50
本公开涉及用于从表格式数据创建行项目信息的系统、软件和计算机实施的方法。一种示例方法包括在系统处接收事件数据值。识别事件数据值中的列的列标题。至少一个列标题不被包括在由系统使用的标准行项目项中。识别事件数据值中的列的列值。使用一个或多个模型处理所识别的列标题和所识别的列值,以将每个列映射到由系统使用的标准行项目项。该处理包括使用上下文确定和内容辨识来识别标准行项目项。在系统中创建事件,包括从所识别的列值创建行项目。每个行项目包括被映射到列的标准行项目项。项。项。

【技术实现步骤摘要】
从自由形式的表格式数据创建行项目信息


[0001]本公开涉及用于从表格式数据创建行项目信息的计算机实施的方法、软件和系统。

技术介绍

[0002]战略采购可以由公司执行,以监控和评估采购战略。采购战略可以包括确定从哪个实体购买需要购置的项目。战略采购可以包括供应链管理、供应商开发、合同谈判和外购评估。

技术实现思路

[0003]本公开涉及用于从表格式数据创建行项目信息的系统、软件和计算机实施的方法。一种示例方法包括在系统处接收事件数据值。识别事件数据值中的列的列标题。至少一个列标题不被包括由系统使用的标准行项目项中。识别事件数据值中的列的列值。使用一个或多个模型处理所识别的列标题和所识别的列值,以将每个列映射到由系统使用的标准行项目项。该处理包括使用上下文确定和内容辨识来识别标准行项目项。在系统中创建事件,包括从所识别的列值创建行项目。每个行项目包括映射到列的标准行项目项。
[0004]虽然通常被描述为体现在有形介质上的处理和转换相应数据的计算机实施的软件,但是各方面中的一些或全部可以是计算机实施的方法,或者还被包括在用于执行该描述的功能的相应系统或其他设备中。本公开的这些和其他方面和实施例的细节在附图和以下描述中阐述。根据说明书和附图以及权利要求,本公开的其他特征、目的和优点将变得显而易见。
附图说明
[0005]图1是示出用于从表格式数据创建行项目信息的示例系统的框图。
[0006]图2示出了用于从表格式数据确定行项目信息的示例系统。
[0007]图3示出了用于从表格式输入数据创建行项目信息的处理的示例流水线的流程图。
[0008]图4A示出了示例输入表格。
[0009]图4B是示出列标题的候选项的匹配分数的表格。
[0010]图5是用于从表格式数据创建行项目信息的示例方法的流程图。
具体实施方式
[0011]组织中的买方可能想要为组织购置(多个)项目。买方可能想要找到能以最低价格提供(多个)项目的供应商。其他因素可能影响供应商的选择,诸如过去的互动、整体声誉、交付时间因素等。战略采购可以是尝试为组织寻找针对组织想要购置的一个或多个项目的集合的最佳供应商的过程。执行战略分析之后,可以选择供应商并授予采购机会。
[0012]战略采购的输入可以是采购事件,采购事件包括组织想要购置的(多个)行项目(line item)的列表。可以使用具有固定字段的用户界面来定义采购事件的行项目,行项目的值可以添加到固定字段中。作为另一示例,可以提供包括行项目的电子表单文件作为输入。固定字段用户界面和电子表单都可以具有预定义数量的预定义字段,这些预定义字段预计包括某些类型的数据。这些类型的输入格式通常不允许偏离预计的输入。虽然描述了采购事件,但是也可以使用其他类型的事件。
[0013]在一些实施方式中,例如,买方可以从采购系统或另一类型的系统下载电子表单模板,电子表单模板具有不同类型的行项目字段的固定列名称,诸如行项目编号、行项目描述、提前期(lead time)和各种价格字段。模板通常包括由采购系统使用的项和字段名称。这些字段名称可能与由买方使用的项和字段名称不匹配或不完全熟悉。这种不熟悉可能对买方和组织中的其他人(诸如组织中的其他采购经理)造成限制。例如,在组织中,买方和采购经理可能更熟悉“交付时间”,而不是“提前期”。其他类型的信息在买方组织和采购系统之间可能有不同的术语。不得不使用和解释不熟悉的项,而不是熟悉的项,这对买方来说是不方便和低效的,并且会导致用户对采购系统的不满意。
[0014]为了给买方提供更多的灵活性和便利性,买方可以使用对买方方便和熟悉的任何形式来生成行项目输入数据。例如,买方可以创建包括行项目信息的一个或多个电子表单。买方的行项目信息可以在一个表格中、多个表格中、一个表单内、跨表单等定义。例如,假设买方需要购买组织内供内部使用的项目,诸如家具项目和办公用品。第一个表单或第一个表格可以列出描述期望的家具项目的信息,诸如家具项目描述、家具项目尺寸等。第二个表单可以列出描述期望的办公用品的信息,例如,诸如颜色、品牌等供应特性。家具和办公用品的项目描述可能不同,因为不同的字段可以描述不同类型的项目。买方可以使用对买方有意义的字段/列名称来提供描述这些项目的数据,而不是尝试将项目描述放入不是由买方组织开发的模板的硬编码字段中。买方可以以买方需要的(多个)格式提供信息,而不是下载和使用不熟悉的模板或僵硬的用户界面。
[0015]采购系统可以接受自由形式的数据作为输入,并根据输入的数据确定和预测各种含义。例如,采购系统可以确定自由形式数据中每个项目的上下文,以确定每个行项目的行项目标识符、行项目描述和(多个)项的集合。项可以是例如价格、颜色、宽度、高度等。采购系统可以推断/确定每个项的数据类型。例如,可以为价格项推断货币数据类型,为高度和宽度项推断度量单位的数据类型。如下所述,可以基于关键字/符号识别来确定数据类型。附加地或可替换地,可以基于历史数据使用或确定来确定数据类型。例如,如果客户在过去使用名称为“总值”的项作为货币数据类型,则系统可以预测名称为“值”的项也属于货币类型。数据类型可以包括比基本数据类型(诸如整数)更高级别的更高级别类型。更高级别的数据类型可以包括货币、测量尺寸等。采购系统可以确定某些项目具有某种类型的货币,诸如USD(美元)、欧元等。例如,采购系统可以将不同类型的货币转换为一种通用货币,以便进行比较。
[0016]采购系统可以辨识项之间的同义词。如果输入的项是采购系统使用的标准全局项的同义词,则同义项可以链接到标准项,而不是在采购系统中创建新项。例如,通用项可以是“工厂”,而诸如“收货地址”的同义输入项可以映射到标准的“工厂”项。与通用的全局项匹配可以节省内存,从而提高性能,并支持项的标准处理,用于比较、决策等。全局项可以被
包括在语料库中。语料库可以基于关于多个购置产品的文档和其他数据来构建,以便包括购置系统中常用的项。
[0017]当翻译项时,可以为可能匹配输入项的候选全局项的集合中的每一个候选全局项生成匹配分数。可以选择最接近的匹配(例如,具有最高匹配分数的候选全局项)作为输入项的同义词,并且可以将输入项映射到所选择的全局项。如果没有匹配分数大于阈值,则可以基于输入项为客户创建新的定制项。
[0018]基于模型的方法可以提供各种优势。例如,基于列标题的映射可以以无监督的方式执行,不需要训练。模型可以识别由买方最近创建的新项(或采购系统首先看到的项)。可以基于列标题以及列内容推断标准行项目项。异构列可以映射到不同的目标列。方法可以是语言不可知的。
[0019]图1是示出用于从表格式数据创建行项目信息的示例系统100的框图。具体而言,示出的系统100包括或可通信地耦合到采购系统102、客户端设备104和网络106。虽然单独示出,但是在一些实施方式中,两个或更多系统或服务器的功能可以由单个系统或服务器提供。在一些实施方式中,一个所示系统或服务器的功能可以由多个系统或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实施的方法,包括:在系统处接收事件数据值;识别所述事件数据值中的列的列标题,其中至少一个列标题不被包括在由所述系统使用的标准行项目项中;识别所述事件数据值中的列的列值;使用一个或多个模型处理所识别的列标题和所识别的列值,以将每个列映射到由所述系统使用的标准行项目项,其中所述处理包括使用上下文确定和内容辨识来识别标准行项目项;以及在所述系统中创建事件,包括从所识别的列值创建行项目,其中每个行项目包括被映射到列的标准行项目项。2.根据权利要求1所述的方法,其中,所述一个或多个模型包括候选项到所述标准行项目项的映射。3.根据权利要求1所述的方法,其中,所述候选项被包括在语料库中。4.根据权利要求3所述的方法,其中,所述语料库包括从所述系统的产品文档或其他系统的产品文档中识别的项。5.根据权利要求1所述的方法,其中,在使用所述一个或多个模型进行所述处理之前,所述列标题被预处理。6.根据权利要求5所述的方法,其中,所述预处理包括大小写标准化、拼写错误纠正和短语处理。7.根据权利要求1所述的方法,其中,使用一个或多个模型包括使用生成分布模型从数值列值推断标准行项目项。8.根据权利要求1所述的方法,其中,使用一个或多个模型包括使用朴素贝叶斯模型从文本列值中识别标准行项目项。9.根据权利要求1所述的方法,其中,所述上下文确定包括基于所述事件数据值中的列的列名称或列标题来识别标准行项目项。10.一种系统,包括:一个或多个计算机;和耦合到所述一个或多个计算机的计算机可读介质,其上存储有指令,当所述指令被所述一个或多个计算机执行时,使得所述一个或多个计算机执行操作,所述操作包括:在系统处接收事件数据值;识别所述事件数据值中的列的列标题,其中至少一个列标题不被包括在由所述系统使用的标准行项目项中;识别所述事件数据值中的列的列值;使用一个或多个模型处理所识别的列标题和所识别的列值,以将每个列映射到由所述系...

【专利技术属性】
技术研发人员:K戈达N拉贾戈帕兰N库马尔P拉马克里什纳R伍帕拉E万登胡克
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1