当前位置: 首页 > 专利查询>苹果公司专利>正文

事件提取系统和方法技术方案

技术编号:23028726 阅读:118 留言:0更新日期:2020-01-03 18:15
在结构化数据(例如HTML网页或电子邮件)中或自然语言描述的文本中描述的事件可被提取并输入到用户设备上的一个或多个日历中。在一个实施方案中,在日历应用程序中选择添加事件命令可使得日历应用程序在未接收到任何搜索输入的情况下在所提取的事件的数据库中搜索,并且可将在预先确定的时间段内提取的事件建议为要添加至日历的事件。在一个实施方案中,所提取的事件可使得通知被显示给用户。本文还描述了其他实施方案。

Event extraction system and method

【技术实现步骤摘要】
【国外来华专利技术】事件提取系统和方法本专利申请要求2018年2月14日提交的美国专利申请15,897,038、2018年2月14日提交的美国专利申请15/897,043、2018年2月14日提交的美国专利申请15/897,047和2018年2月14日提交的15/897,053的优先权,这些专利申请均要求2017年6月2日提交的美国临时专利申请62/514,738的优先权,其全部内容以引用方式并入本文。
技术介绍
数据处理系统的用户通常发送关于事件的消息(例如,文本消息)或电子邮件,诸如去餐厅吃晚餐或午餐或者晚上去电影院看电影等。另外,数据处理系统的用户通常使用Web浏览器来预订餐厅、汽车租赁、凭票入场事件(例如,棒球比赛或电影等)、航班、酒店等。在过去,数据处理系统已得到增强,以包括识别不同类型的数据诸如事件的技术。参见例如美国专利7,912,828、8,423,288、以及8,738,360。这些技术依靠用户交互来利用所提取的数据。
技术实现思路
本文所述的各个方面和实施方案涉及从不同类型的数据中提取事件。在一个实施方案中,事件可从自然语言描述中提取,诸如某些类型的电子邮件或文本消息或其他文本内容。在另一个实施方案中,事件可从诸如HTML的结构化数据(例如,网页或某些类型的电子邮件等)中提取。从事件的自然语言描述中提取事件的方法可包括以下操作:从具有自然语言描述的文本中提取事件;将所提取的事件添加至包含一个或多个所提取的事件的数据库;记录表示与所提取的事件相关联的第一时间的数据;显示日历应用程序的用户界面,其中日历应用程序的用户界面包括添加事件命令;接收对添加事件命令的选择;响应于该选择,确定与事件相关联的第一时间是否在当前时间的时间段内;如果第一时间在当前时间的时间段内,则在日历用户界面中显示所提取的事件的至少一部分。在一个实施方案中,最近所提取的事件可被建议为响应于添加新事件的命令而要添加至日历的新事件。在一个实施方案中,所提取的事件的显示可以是搜索所提取事件数据库的结果,并且搜索结果显示可能被提取事件的自动完成建议,即使没有字符被输入到搜索输入字段中也可建议可能被提取的事件,该自动完成建议可被称为零字自动完成建议。换句话讲,在日历用户界面中的搜索输入字段中接收到零个字符时,可执行在日历用户界面中显示所提取的事件的至少一部分。当第一时间超出当前时间的时间段时,可能需要在搜索输入字段中输入字符,以便在搜索结果的自动完成建议集中检索所提取的事件作为可能的搜索结果。自然语言描述可以是文本消息或电子邮件的一部分。当用户在不考虑与每个所提取的事件相关联的时间的情况下选择添加事件命令时,另选的实施方案可提供来自对所提取的事件的搜索的自动完成建议。在该另选的实施方案中,可在没有任何字符被输入到搜索输入字段中(零字自动完成建议)的情况下或在字符(该字符与所提取事件数据库中的事件相匹配)被输入到该字段中之后,提供通过搜索所提取事件数据库而获得的这些自动完成建议。在一个实施方案中,与所提取的日历事件相关联的第一时间可以是以下各项中的一者:(a)接收文本消息或电子邮件的时间;或(b)在文本消息或电子邮件被显示时提取所提取的事件的时间;或(c)将所提取的事件添加至所提取事件数据库的时间。在一个实施方案中,该方法还可包括基于从自然语言描述提取的数据来确定所提取的事件的截止日期;以及在截止日期或之后从数据库中移除所提取的事件。在一个实施方案中,包含所提取的事件的数据库可包括数据结构,其中所提取的事件按照从最近到最远的时间排序。在一个实施方案中,该方法还可包括在日历用户界面中接收对所显示的所提取事件的选择,并且响应于对所显示的所提取事件的选择,显示预先填充有来自所提取事件的数据的日历事件创建面板,以允许基于所提取的事件将条目编辑到由日历应用程序所维护的日历中。在一个实施方案中,可将所提取的事件放置在子日历中,该子日历可被表征为与用户的主日历分离的“在应用程序中找到”的日历。在一个实施方案中,日历应用程序可支持多个子日历(诸如工作日历、家庭日历等),如公布的美国专利申请US2004/0109025中所述。从自然语言描述提取事件的另一个实施方案可包括以下操作:从具有自然语言描述的文本中提取事件;将所提取的事件添加至包含一个或多个所提取的事件的数据库;显示日历应用程序的用户界面,该用户界面包括日历格式的一组一个或多个日期;接收对日历格式的一个或多个日期中的一者的选择;响应于该选择,搜索数据库以获取针对所选择的日期的任何所提取的事件,该搜索在用于接收并引起对数据库的搜索的搜索输入字段中接收到零个字符时执行;将数据库中针对所选择的日期的所提取的事件中的每一者显示为一个或多个候选事件。在一个实施方案中,该方法还可包括基于从自然语言描述提取的数据来确定所提取的事件的截止日期;以及在截止日期或之后从数据库中移除所提取的事件。本文所述的另一个方面涉及在用户使用Web浏览器进行预订或以其他方式创建事件时对一个或多个事件的提取。在一个实施方案中,一种方法可包括以下操作:从域接收文档;将该域与域白名单中的一组域进行比较;确定当该域在该组域中时是否基于文档的标题或文档的统一资源标识符(URI)中的至少一者来继续处理文档;如果继续处理,则从文档中提取表示候选日历事件的结构化数据;将候选日历事件添加至日历数据库;以及向用户呈现通知,该通知显示关于候选日历事件的数据的至少一部分。在一个实施方案中,对是否继续处理文档的确定可利用在使用Web浏览器的同时创建事件的过程来通过相同域(或已知与原始域相关的域)的不同网页重复完成。在一个实施方案中,该文档是包含来自企业的结构化数据的网页或电子邮件或文本消息中的一者。在一个实施方案中,白名单是Web浏览器的进程的存储器中的数据结构,并且该数据结构是存储器映射查找树,且比较是存储器映射查找树中的查找操作。在一个实施方案中,对是否继续处理的确定可使用机器学习分类器,该分类器针对手动标记的示例进行训练,该手动标记的示例用于基于对网页的标题或电子邮件的主题行的表征来了解如何对结构化数据进行分类。在一个实施方案中,该表征指示电子邮件或网页是对预订的确认还是广告(非事件)或不被视为事件的促销。在一个实施方案中,日历数据库是在被存储在用户的私有云存储账户中时被加密的私有本地日历数据库,并且候选日历事件可显示在子日历中,该子日历可为在日历应用程序中可显示的多个子日历中的一个。在一个实施方案中,通知可包括以下各项中的至少一者:(a)关闭命令,该关闭命令在保留候选日历事件的同时退出对通知的显示;或(b)选择命令,该选择命令在日历应用程序的用户界面中显示候选日历事件,其中候选日历事件在日历应用程序中可编辑;或(c)删除命令,该删除命令从日历数据库中删除候选日历事件。在一个实施方案中,通知可以是显示关于看似相关的一组候选事件的数据的合并通知。在一个实施方案中,该方法还可包括基于以下各项中的一者或多者从日历数据库中移除重复事件:重复次数;或重复标题;或由一个或多个域指示的重复源。在一个实施方案中,可将重复事件合并到合并通知中而不是移除它们。本文档来自技高网...

【技术保护点】
1.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:/n从具有自然语言描述的文本提取事件;/n将所提取的事件添加至包含一个或多个所提取的事件的数据库;/n记录表示与所提取的事件相关联的第一时间的数据;/n显示日历应用程序的用户界面,所述用户界面包括添加事件命令;/n接收对所述添加事件命令的选择;/n响应于所述选择来确定所述第一时间是否在当前时间的时间段内;/n如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。/n

【技术特征摘要】
【国外来华专利技术】20170602 US 62/514,738;20180214 US 15/897,053;20181.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
记录表示与所提取的事件相关联的第一时间的数据;
显示日历应用程序的用户界面,所述用户界面包括添加事件命令;
接收对所述添加事件命令的选择;
响应于所述选择来确定所述第一时间是否在当前时间的时间段内;
如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。


2.根据权利要求1所述的介质,其中在所述日历用户界面中的搜索输入字段中接收到零个字符时,执行在所述日历用户界面中显示所提取的事件的至少一部分。


3.根据权利要求2所述的介质,其中所述时间段小于24小时或2小时。


4.根据权利要求2所述的介质,其中确定所述第一时间是否在所述时间段内是通过搜索所述数据库来执行的,并且所述搜索输入字段被配置为接收一个或多个字符并使得使用所接收的一个或多个字符作为搜索查询在所述数据库中执行搜索,并且对所述数据库的所述搜索返回匹配项,作为包含所接收的一个或多个字符的所述搜索查询的自动完成项。


5.根据权利要求4所述的介质,其中所述自然语言描述是文本消息或电子邮件的一部分。


6.根据权利要求5所述的介质,其中所述第一时间为以下各项中的一者:(a)接收文本消息或电子邮件的时间;或(b)在所述文本消息或电子邮件被显示时提取所提取的事件的时间;或(c)将所提取的事件添加至所述数据库的时间。


7.根据权利要求5所述的介质,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。


8.根据权利要求7所述的介质,其中所述数据库包括数据结构,其中所提取的事件与其他所提取的事件一起按照从最近到最远的时间排序。


9.根据权利要求2所述的介质,其中所述方法进一步包括:
在所述日历用户界面中接收对所显示的所提取的事件的选择;
响应于对所显示的所提取的事件的所述选择,显示日历事件创建面板,所述日历事件创建面板预先填充有来自所提取的事件的数据,以允许对由所述日历应用程序所维护的日历进行编辑和输入。


10.根据权利要求2所述的介质,其中所述方法进一步包括:
在所述日历用户界面上接收针对日期的输入;
响应于所述输入,搜索所述数据库以获取针对所述日期的任何所提取的事件,所述搜索在所述搜索输入字段中接收到零个字符时执行;
将针对所述日期的所提取的事件显示为零关键字自动建议。


11.根据权利要求1所述的介质,其中所述方法进一步包括:
从后面的自然语言描述中提取指示所提取的事件已被取消的文本并从所述数据库中移除所提取的事件。


12.一种方法,包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
记录表示与所提取的事件相关联的第一时间的数据;
显示日历应用程序的用户界面,所述用户界面包括添加事件命令;
接收对所述添加事件命令的选择;
响应于所述选择来确定所述第一时间是否在当前时间的时间段内;
如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。


13.根据权利要求12所述的方法,其中在所述日历用户界面中的搜索输入字段中接收到零个字符时,执行在所述日历用户界面中显示所提取的事件的至少一部分。


14.根据权利要求13所述的方法,其中所述时间段小于24小时或2小时。


15.根据权利要求13所述的方法,其中确定所述第一时间是否在所述时间段内是通过搜索所述数据库来执行的,并且所述搜索输入字段被配置为接收一个或多个字符并使得使用所接收的一个或多个字符作为搜索查询在所述数据库中执行搜索,并且对所述数据库的所述搜索返回匹配项,作为包含所接收的一个或多个字符的所述搜索查询的自动完成项。


16.根据权利要求15所述的方法,其中所述自然语言描述是文本消息或电子邮件的一部分。


17.根据权利要求16所述的方法,其中所述第一时间为以下各项中的一者:(a)接收文本消息或电子邮件的时间;或(b)在所述文本消息或电子邮件被显示时提取所提取的事件的时间;或(c)将所提取的事件添加至所述数据库的时间。


18.根据权利要求16所述的方法,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。


19.根据权利要求18所述的方法,其中所述数据库包括数据结构,其中所提取的事件与其他所提取的事件一起按照从最近到最远的时间排序。


20.根据权利要求13所述的方法,其中所述方法进一步包括:
在所述日历用户界面中接收对所显示的所提取的事件的选择;
响应于对所显示的所提取的事件的所述选择,显示日历事件创建面板,所述日历事件创建面板预先填充有来自所提取的事件的数据,以允许对由所述日历应用程序所维护的日历进行编辑和输入。


21.根据权利要求13所述的方法,其中所述方法进一步包括:
在所述日历用户界面上接收针对日期的输入;
响应于所述输入,搜索所述数据库以获取针对所述日期的任何所提取的事件,所述搜索在所述搜索输入字段中接收到零个字符时执行;
将针对所述日期的所提取的事件显示为零关键字自动建议。


22.根据权利要求12所述的方法,其中所述方法进一步包括:
从后面的自然语言描述中提取指示所提取的事件已被取消的文本并从所述数据库中移除所提取的事件。


23.一种存储可执行程序指令的非暂态机器可读介质,所述可执行程序指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
显示日历应用程序的用户界面,所述用户界面包括日历格式的一组一个或多个日期;
接收对所述日历格式的所述一个或多个日期中的一者的选择;
响应于所述选择,搜索所述数据库以获取针对所选择的日期的任何所提取的事件,所述搜索在用于接收并引起对数据库的搜索的搜索输入字段中接收到零个字符时执行;
将所述数据库中针对所选择的日期的所提取的事件中的每一者显示为一个或多个候选事件。


24.根据权利要求23所述的介质,其中所述日历格式为年份格式、月份格式、星期格式和日期格式中的一种。


25.根据权利要求24所述的介质,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。


26.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从域接收文档;
将所述域与域白名单中的一组域进行比较;
确定当所述域在所述一组域中时是否基于所述文档的标题或所述文档的统一资源标识符(URI)中的至少一者来继续处理所述文档;
如果继续处理,则从所述文档中提取表示候选日历事件的数据;
将所述候选日历事件添加至日历数据库;
向用户呈现通知,所述通知显示关于所述候选日历事件的数据的至少一部分。


27.根据权利要求26所述的介质,其中所述文档是以下各项中的一者:
(a)网页;或(b)电子邮件;或(c)文本消息。


28.根据权利要求26所述的介质,其中所述白名单是存储器映射查找树中的数据结构,并且所述比较是所述存储器映射查找树中的查找操作。


29.根据权利要求26所述的介质,其中所述确定是否继续处理使用机器学习分类器,所述机器学习分类器针对手动标记的示例进行训练,所述手动标记的示例用于基于网页的标题或电子邮件的主题行的特征来了解所述电子邮件或网页是对预订的确认还是广告或促销,并且其中表示所述候选日历事件的所述数据是结构化数据。


30.根据权利要求26所述的介质,其中所述日历数据库是在被存储在用户的私有云存储账户中时被加密的私有本地日历数据库,并且所述候选日历事件显示在子日历中,所述子日历是在日历应用程序中可显示的多个子日历中的一个。


31.根据权利要求26所述的介质,其中所述通知包括以下各项中的至少一者:(a)关闭命令,所述关闭命令在保留所述候选日历事件的同时退出对所述通知的显示;或(b)选择命令,所述选择命令在日历应用程序的用户界面中显示所述候选日历事件,所述候选日历事件在所述日历应用程序中可编辑;或(c)删除命令,所述删除命令从所述日历数据库中删除所述候选日历事件。


32.根据权利要求26所述的介质,其中所述通知是显示关于看似相关的一组候选事件的数据的合并通知。


33.根据权利要求26所述的介质,其中关于所述候选日历事件的所述数据的所述部分包括以下各项中的一者或多者:事件的日期;或事件的时间;或事件的名称;或事件的位置。


34.根据权利要求26所述的介质,其中所述方法进一步包括:
基于以下各项中的一者或多者从所述日历数据库中移除重复事件:重复次数;或重复标题;或由一个或多个域指示的重复源。


35.根据权利要求34所述的介质,其中重复事件被合并到合并通知中。


36.一种方法,包括:
从域接收文档;
将所述域与域白名单中的一组域进行比较;
确定当所述域在所述一组域中时是否基于所述文档的标题或所述文档的统一资源标识符(URI)中的至少一者来继续处理所述文档;
如果继续处理,则从所述文档中提取表示候选日历事件的结构化数据;
将所述候选日历事件添加至日历数据库;
向用户呈现通知,所述通知显示关于所述候选日历事件的数据的至少一部分。


37.根据权利要求36所述的方法,其中所述文档是以下各项中的一者:
(a)网页;或(b)电子邮件;或(c)文本消息。


38.根据权利要求36所述的方法,其中所述白名单是存储器映射查找树中的数据结构,并且所述比较是所述存储器映射查找树中的查找操作。


39.根据权利要求36所述的方法,其中所述确定是否继续处理使用机器学习分类器,所述机器学习分类器针对手动标记的示例进行训练,所述手动标记的示例用于基于网页的标题或电子邮件的主题行的特征来了解所述电子邮件或网页是对预订的确认还是广告或促销,并且其中表示所述候选日历事件的所述数据是结构化数据。


40.根据权利要求36所述的方法,其中所述日历数据库是在被存储在用户的私有云存储账户中时被加密的私有本地日历数据库,并且所述候选日历事件显示在子日历中,所述子日历是在日历应用程序中可显示的多个子日历中的一个。


41.根据权利要求36所述的方法,其中所述通知包括以下各项中的至少一者:(a)关闭命令,所述关闭命令在保留所述候选日历事件的同时退出对所述通知的显示;或(b)选择命令,所述选择命令在日历应用程序的用户界面中显示所述候选日历事件,所述候选日历事件在所述日历应用程序中可编辑;或(c)删除命令,所述删除命令从所述日历数据库中删除所述候选日历事件。


42.根据权利要求36所述的方法,其中所述通知是显示关于看似相关的一组候选事件的数据的合并通知。


43.根据权利要求36所述的方法,其中关于所述候选日历事件的所述数据的所述部分包括以下各项中的一者或多者:事件的日期;或事件的时间;或事件的名称;或事件的位置。


44.根据权利要求36所述的方法,其中所述方法进一步包括:
基于以下各项中的一者或多者从所述日历数据库中移除重复事件:重复次数;或重复标题;或由一个或多个域指示的重复源。


45.根据权利要求44所述的方法,其中重复事件被合并到合并通知中。


46.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从域接收文档,所述文档包含结构化数据;
将所述文档分类为事件或非事件中的一种;
基于被确定为处于所述类别中的一个类别的所述域,从用于不同事件类别的一组数据提取器中选择数据提取器;
由所选择的数据提取器调用一组字段提取器,所述字段提取器中的每一个被配置为从所述结构化数据中的对应类型的字段提取数据;
由所述一组字段提取器提取所述结构化数据的字段内的数据;
验证从所述字段提取的数据;<...

【专利技术属性】
技术研发人员:S·图吉S·B·亚阿拉A·瓦因尔E·M·博杰特H·J·阿拉斯R·F·比特奥德S·阿德勒S·C·凯茨C·菲德里格希P·L·科夫曼T·A·埃尔茨
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1