【技术实现步骤摘要】
【国外来华专利技术】事件提取系统和方法本专利申请要求2018年2月14日提交的美国专利申请15,897,038、2018年2月14日提交的美国专利申请15/897,043、2018年2月14日提交的美国专利申请15/897,047和2018年2月14日提交的15/897,053的优先权,这些专利申请均要求2017年6月2日提交的美国临时专利申请62/514,738的优先权,其全部内容以引用方式并入本文。
技术介绍
数据处理系统的用户通常发送关于事件的消息(例如,文本消息)或电子邮件,诸如去餐厅吃晚餐或午餐或者晚上去电影院看电影等。另外,数据处理系统的用户通常使用Web浏览器来预订餐厅、汽车租赁、凭票入场事件(例如,棒球比赛或电影等)、航班、酒店等。在过去,数据处理系统已得到增强,以包括识别不同类型的数据诸如事件的技术。参见例如美国专利7,912,828、8,423,288、以及8,738,360。这些技术依靠用户交互来利用所提取的数据。
技术实现思路
本文所述的各个方面和实施方案涉及从不同类型的数据中提取事件。在一个实施方案中,事件可从自然语言描述中提取,诸如某些类型的电子邮件或文本消息或其他文本内容。在另一个实施方案中,事件可从诸如HTML的结构化数据(例如,网页或某些类型的电子邮件等)中提取。从事件的自然语言描述中提取事件的方法可包括以下操作:从具有自然语言描述的文本中提取事件;将所提取的事件添加至包含一个或多个所提取的事件的数据库;记录表示与所提取的事件相关联的第一时间的数据;显示日历应用程序的用户界面,其中日历应用 ...
【技术保护点】
1.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:/n从具有自然语言描述的文本提取事件;/n将所提取的事件添加至包含一个或多个所提取的事件的数据库;/n记录表示与所提取的事件相关联的第一时间的数据;/n显示日历应用程序的用户界面,所述用户界面包括添加事件命令;/n接收对所述添加事件命令的选择;/n响应于所述选择来确定所述第一时间是否在当前时间的时间段内;/n如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。/n
【技术特征摘要】
【国外来华专利技术】20170602 US 62/514,738;20180214 US 15/897,053;20181.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
记录表示与所提取的事件相关联的第一时间的数据;
显示日历应用程序的用户界面,所述用户界面包括添加事件命令;
接收对所述添加事件命令的选择;
响应于所述选择来确定所述第一时间是否在当前时间的时间段内;
如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。
2.根据权利要求1所述的介质,其中在所述日历用户界面中的搜索输入字段中接收到零个字符时,执行在所述日历用户界面中显示所提取的事件的至少一部分。
3.根据权利要求2所述的介质,其中所述时间段小于24小时或2小时。
4.根据权利要求2所述的介质,其中确定所述第一时间是否在所述时间段内是通过搜索所述数据库来执行的,并且所述搜索输入字段被配置为接收一个或多个字符并使得使用所接收的一个或多个字符作为搜索查询在所述数据库中执行搜索,并且对所述数据库的所述搜索返回匹配项,作为包含所接收的一个或多个字符的所述搜索查询的自动完成项。
5.根据权利要求4所述的介质,其中所述自然语言描述是文本消息或电子邮件的一部分。
6.根据权利要求5所述的介质,其中所述第一时间为以下各项中的一者:(a)接收文本消息或电子邮件的时间;或(b)在所述文本消息或电子邮件被显示时提取所提取的事件的时间;或(c)将所提取的事件添加至所述数据库的时间。
7.根据权利要求5所述的介质,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。
8.根据权利要求7所述的介质,其中所述数据库包括数据结构,其中所提取的事件与其他所提取的事件一起按照从最近到最远的时间排序。
9.根据权利要求2所述的介质,其中所述方法进一步包括:
在所述日历用户界面中接收对所显示的所提取的事件的选择;
响应于对所显示的所提取的事件的所述选择,显示日历事件创建面板,所述日历事件创建面板预先填充有来自所提取的事件的数据,以允许对由所述日历应用程序所维护的日历进行编辑和输入。
10.根据权利要求2所述的介质,其中所述方法进一步包括:
在所述日历用户界面上接收针对日期的输入;
响应于所述输入,搜索所述数据库以获取针对所述日期的任何所提取的事件,所述搜索在所述搜索输入字段中接收到零个字符时执行;
将针对所述日期的所提取的事件显示为零关键字自动建议。
11.根据权利要求1所述的介质,其中所述方法进一步包括:
从后面的自然语言描述中提取指示所提取的事件已被取消的文本并从所述数据库中移除所提取的事件。
12.一种方法,包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
记录表示与所提取的事件相关联的第一时间的数据;
显示日历应用程序的用户界面,所述用户界面包括添加事件命令;
接收对所述添加事件命令的选择;
响应于所述选择来确定所述第一时间是否在当前时间的时间段内;
如果所述第一时间在所述当前时间的所述时间段内,则在所述日历用户界面中显示所提取的事件的至少一部分。
13.根据权利要求12所述的方法,其中在所述日历用户界面中的搜索输入字段中接收到零个字符时,执行在所述日历用户界面中显示所提取的事件的至少一部分。
14.根据权利要求13所述的方法,其中所述时间段小于24小时或2小时。
15.根据权利要求13所述的方法,其中确定所述第一时间是否在所述时间段内是通过搜索所述数据库来执行的,并且所述搜索输入字段被配置为接收一个或多个字符并使得使用所接收的一个或多个字符作为搜索查询在所述数据库中执行搜索,并且对所述数据库的所述搜索返回匹配项,作为包含所接收的一个或多个字符的所述搜索查询的自动完成项。
16.根据权利要求15所述的方法,其中所述自然语言描述是文本消息或电子邮件的一部分。
17.根据权利要求16所述的方法,其中所述第一时间为以下各项中的一者:(a)接收文本消息或电子邮件的时间;或(b)在所述文本消息或电子邮件被显示时提取所提取的事件的时间;或(c)将所提取的事件添加至所述数据库的时间。
18.根据权利要求16所述的方法,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。
19.根据权利要求18所述的方法,其中所述数据库包括数据结构,其中所提取的事件与其他所提取的事件一起按照从最近到最远的时间排序。
20.根据权利要求13所述的方法,其中所述方法进一步包括:
在所述日历用户界面中接收对所显示的所提取的事件的选择;
响应于对所显示的所提取的事件的所述选择,显示日历事件创建面板,所述日历事件创建面板预先填充有来自所提取的事件的数据,以允许对由所述日历应用程序所维护的日历进行编辑和输入。
21.根据权利要求13所述的方法,其中所述方法进一步包括:
在所述日历用户界面上接收针对日期的输入;
响应于所述输入,搜索所述数据库以获取针对所述日期的任何所提取的事件,所述搜索在所述搜索输入字段中接收到零个字符时执行;
将针对所述日期的所提取的事件显示为零关键字自动建议。
22.根据权利要求12所述的方法,其中所述方法进一步包括:
从后面的自然语言描述中提取指示所提取的事件已被取消的文本并从所述数据库中移除所提取的事件。
23.一种存储可执行程序指令的非暂态机器可读介质,所述可执行程序指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从具有自然语言描述的文本提取事件;
将所提取的事件添加至包含一个或多个所提取的事件的数据库;
显示日历应用程序的用户界面,所述用户界面包括日历格式的一组一个或多个日期;
接收对所述日历格式的所述一个或多个日期中的一者的选择;
响应于所述选择,搜索所述数据库以获取针对所选择的日期的任何所提取的事件,所述搜索在用于接收并引起对数据库的搜索的搜索输入字段中接收到零个字符时执行;
将所述数据库中针对所选择的日期的所提取的事件中的每一者显示为一个或多个候选事件。
24.根据权利要求23所述的介质,其中所述日历格式为年份格式、月份格式、星期格式和日期格式中的一种。
25.根据权利要求24所述的介质,其中所述方法进一步包括:
基于从所述自然语言描述提取的数据来确定所提取的事件的截止日期;
在所述截止日期或之后从所述数据库中移除所提取的事件。
26.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从域接收文档;
将所述域与域白名单中的一组域进行比较;
确定当所述域在所述一组域中时是否基于所述文档的标题或所述文档的统一资源标识符(URI)中的至少一者来继续处理所述文档;
如果继续处理,则从所述文档中提取表示候选日历事件的数据;
将所述候选日历事件添加至日历数据库;
向用户呈现通知,所述通知显示关于所述候选日历事件的数据的至少一部分。
27.根据权利要求26所述的介质,其中所述文档是以下各项中的一者:
(a)网页;或(b)电子邮件;或(c)文本消息。
28.根据权利要求26所述的介质,其中所述白名单是存储器映射查找树中的数据结构,并且所述比较是所述存储器映射查找树中的查找操作。
29.根据权利要求26所述的介质,其中所述确定是否继续处理使用机器学习分类器,所述机器学习分类器针对手动标记的示例进行训练,所述手动标记的示例用于基于网页的标题或电子邮件的主题行的特征来了解所述电子邮件或网页是对预订的确认还是广告或促销,并且其中表示所述候选日历事件的所述数据是结构化数据。
30.根据权利要求26所述的介质,其中所述日历数据库是在被存储在用户的私有云存储账户中时被加密的私有本地日历数据库,并且所述候选日历事件显示在子日历中,所述子日历是在日历应用程序中可显示的多个子日历中的一个。
31.根据权利要求26所述的介质,其中所述通知包括以下各项中的至少一者:(a)关闭命令,所述关闭命令在保留所述候选日历事件的同时退出对所述通知的显示;或(b)选择命令,所述选择命令在日历应用程序的用户界面中显示所述候选日历事件,所述候选日历事件在所述日历应用程序中可编辑;或(c)删除命令,所述删除命令从所述日历数据库中删除所述候选日历事件。
32.根据权利要求26所述的介质,其中所述通知是显示关于看似相关的一组候选事件的数据的合并通知。
33.根据权利要求26所述的介质,其中关于所述候选日历事件的所述数据的所述部分包括以下各项中的一者或多者:事件的日期;或事件的时间;或事件的名称;或事件的位置。
34.根据权利要求26所述的介质,其中所述方法进一步包括:
基于以下各项中的一者或多者从所述日历数据库中移除重复事件:重复次数;或重复标题;或由一个或多个域指示的重复源。
35.根据权利要求34所述的介质,其中重复事件被合并到合并通知中。
36.一种方法,包括:
从域接收文档;
将所述域与域白名单中的一组域进行比较;
确定当所述域在所述一组域中时是否基于所述文档的标题或所述文档的统一资源标识符(URI)中的至少一者来继续处理所述文档;
如果继续处理,则从所述文档中提取表示候选日历事件的结构化数据;
将所述候选日历事件添加至日历数据库;
向用户呈现通知,所述通知显示关于所述候选日历事件的数据的至少一部分。
37.根据权利要求36所述的方法,其中所述文档是以下各项中的一者:
(a)网页;或(b)电子邮件;或(c)文本消息。
38.根据权利要求36所述的方法,其中所述白名单是存储器映射查找树中的数据结构,并且所述比较是所述存储器映射查找树中的查找操作。
39.根据权利要求36所述的方法,其中所述确定是否继续处理使用机器学习分类器,所述机器学习分类器针对手动标记的示例进行训练,所述手动标记的示例用于基于网页的标题或电子邮件的主题行的特征来了解所述电子邮件或网页是对预订的确认还是广告或促销,并且其中表示所述候选日历事件的所述数据是结构化数据。
40.根据权利要求36所述的方法,其中所述日历数据库是在被存储在用户的私有云存储账户中时被加密的私有本地日历数据库,并且所述候选日历事件显示在子日历中,所述子日历是在日历应用程序中可显示的多个子日历中的一个。
41.根据权利要求36所述的方法,其中所述通知包括以下各项中的至少一者:(a)关闭命令,所述关闭命令在保留所述候选日历事件的同时退出对所述通知的显示;或(b)选择命令,所述选择命令在日历应用程序的用户界面中显示所述候选日历事件,所述候选日历事件在所述日历应用程序中可编辑;或(c)删除命令,所述删除命令从所述日历数据库中删除所述候选日历事件。
42.根据权利要求36所述的方法,其中所述通知是显示关于看似相关的一组候选事件的数据的合并通知。
43.根据权利要求36所述的方法,其中关于所述候选日历事件的所述数据的所述部分包括以下各项中的一者或多者:事件的日期;或事件的时间;或事件的名称;或事件的位置。
44.根据权利要求36所述的方法,其中所述方法进一步包括:
基于以下各项中的一者或多者从所述日历数据库中移除重复事件:重复次数;或重复标题;或由一个或多个域指示的重复源。
45.根据权利要求44所述的方法,其中重复事件被合并到合并通知中。
46.一种存储可执行指令的非暂态机器可读介质,所述可执行指令当由数据处理系统执行时使得所述数据处理系统执行方法,所述方法包括:
从域接收文档,所述文档包含结构化数据;
将所述文档分类为事件或非事件中的一种;
基于被确定为处于所述类别中的一个类别的所述域,从用于不同事件类别的一组数据提取器中选择数据提取器;
由所选择的数据提取器调用一组字段提取器,所述字段提取器中的每一个被配置为从所述结构化数据中的对应类型的字段提取数据;
由所述一组字段提取器提取所述结构化数据的字段内的数据;
验证从所述字段提取的数据;<...
【专利技术属性】
技术研发人员:S·图吉,S·B·亚阿拉,A·瓦因尔,E·M·博杰特,H·J·阿拉斯,R·F·比特奥德,S·阿德勒,S·C·凯茨,C·菲德里格希,P·L·科夫曼,T·A·埃尔茨,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。