当前位置: 首页 > 专利查询>苹果公司专利>正文

数据驱动的自然语言事件检测和分类制造技术

技术编号:16838599 阅读:50 留言:0更新日期:2017-12-19 20:39
本发明专利技术提供了一种用于操作数字助理的系统和过程。根据一个或多个示例,方法包括在具有存储器和一个或多个处理器的用户设备处从至少一个用户接收非结构化自然语言信息。该方法还包括响应于接收到该非结构化自然语言信息,确定事件信息是否存在于该非结构化自然语言信息中。该方法进一步包括根据确定事件信息存在于该非结构化自然语言信息内,确定对事件的协定是否存在于该非结构化自然语言信息中。该方法进一步包括根据确定对事件的协定存在,确定该事件的事件类型并基于该事件类型来提供事件描述。

Data driven natural language event detection and classification

The present invention provides a system and process for operating a digital assistant. According to one or more examples, the method includes receiving unstructured natural language information from at least one user at a user device with memory and one or more processors. The method also includes the response to receiving the unstructured natural language information to determine whether the event information exists in the unstructured natural language information. The method further includes determining whether an event agreement exists in the unstructured natural language information based on identifying the event information in the unstructured natural language information. This method further includes determining the event type of the event and providing an event description based on the type of event based on the determination of the existence of an agreement on the event.

【技术实现步骤摘要】
数据驱动的自然语言事件检测和分类相关专利申请的交叉引用本专利申请要求于2016年6月11日提交的标题为“DataDrivenNaturalLanguageEventDetectionandClassification”的美国临时申请序列号62/348,898、于2016年9月19日提交的标题为“DataDrivenNaturalLanguageEventDetectionandClassification”的美国非临时申请序列号15/269,721、以及于2016年7月25日提交的标题为“DataDrivenNaturalLanguageEventDetectionandClassification”的丹麦专利申请序列号PA201670552的优先权。这些专利申请中的每个专利申请的内容据此全文以引用方式并入以用于所有目的。
本公开整体涉及自然语言处理,并且更具体地涉及使用非结构化自然语言信息来对事件进行检测和分类。背景事件信息可被包括在非结构化自然语言信息中。例如,两个用户可使用文本消息来安排午餐事件。一旦用户就该事件达成一致,他们便可能希望针对该事件来创建日历条目。通常,为了创本文档来自技高网...
数据驱动的自然语言事件检测和分类

【技术保护点】
一种方法,包括:在包括至少一个处理器的电子设备处:从至少一个用户接收非结构化自然语言信息;响应于接收到所述非结构化自然语言信息,确定事件信息是否存在于所述非结构化自然语言信息中;根据确定事件信息存在于所述非结构化自然语言信息内,确定对事件的协定是否存在于所述非结构化自然语言信息中;以及根据确定对事件的协定存在,确定所述事件的事件类型;以及基于所述事件类型来提供事件描述。

【技术特征摘要】
2016.07.25 DK PA201670552;2016.06.11 US 62/348,8981.一种方法,包括:在包括至少一个处理器的电子设备处:从至少一个用户接收非结构化自然语言信息;响应于接收到所述非结构化自然语言信息,确定事件信息是否存在于所述非结构化自然语言信息中;根据确定事件信息存在于所述非结构化自然语言信息内,确定对事件的协定是否存在于所述非结构化自然语言信息中;以及根据确定对事件的协定存在,确定所述事件的事件类型;以及基于所述事件类型来提供事件描述。2.根据权利要求1所述的方法,其中所述非结构化自然语言信息包括消息。3.根据权利要求2所述的方法,其中所述至少一个消息包括文本消息。4.根据权利要求2-3中任一项所述的方法,其中所述至少一个消息包括语音输入。5.根据权利要求1-4中任一项所述的方法,其中所述非结构化自然语言信息包括多个消息。6.根据权利要求1-5中任一项所述的方法,其中所述非结构化自然语言信息包括至少一个电子邮件消息。7.根据权利要求1-6中任一项所述的方法,其中确定事件信息是否存在于所述非结构化自然语言信息中包括:确定与所述非结构化自然语言信息相关联的一个或多个极性;以及基于所述一个或多个极性来确定事件信息是否存在。8.根据权利要求7所述的方法,其中确定与所述非结构化自然语言信息相关联的一个或多个极性包括:基于所述非结构化自然语言信息来生成输入层,其中所述输入层包括多个输入单元和多个先前第一上下文单元;基于所述输入层来生成隐藏层,其中所述隐藏层包括多个当前第一上下文单元;以及基于所述隐藏层来生成输出层,其中所述输出层包括表示所述非结构化自然语言信息的至少一部分的所述一个或多个极性的一个或多个输出标签单元。9.根据权利要求8所述的方法,其中基于所述非结构化自然语言信息来生成所述输入层包括:基于所述非结构化自然语言信息来获取字词序列;基于所述非结构化自然语言信息来获取多个符号;以及使用所述字词序列和所述多个符号中的至少一者来生成所述输入层。10.根据权利要求9所述的方法,其中所述字词序列指示所述字词序列内的所述字词的相对定时关系。11.根据权利要求9-10中任一项所述的方法,其中所述多个符号表示被包括在所述非结构化自然语言信息中的日期和时间信息。12.根据权利要求9-11中任一项所述的方法,其中所述多个符号表示基于命名实体词汇所识别的实体。13.根据权利要求9-12中任一项所述的方法,其中所述输入层包括多个输入单元,所述输入单元中的每个输入单元表示字词或符号。14.根据权利要求13所述的方法,其中所述输入单元中的每个输入单元具有1-of-N编码,其中所述N表示词汇内的字词和符号的总数,所述词汇被配置为确定事件信息是否存在于所述非结构化自然语言信息中。15.根据权利要求8-14中任一项所述的方法,其中基于所述输入层来生成所述隐藏层包括:使用第一加权矩阵来对当前输入单元进行加权;使用第二加权矩阵来对先前第一上下文单元进行加权;以及基于对所述当前输入单元的所述加权和对所述先前第一上下文单元的所述加权来确定当前第一上下文单元。16.根据权利要求15所述的方法,其中对所述当前第一上下文单元的所述确定包括应用激活函数。17.根据权利要求16所述的方法,其中所述激活函数包括S形。18.根据权利要求16-17中任一项所述的方法,其中所述激活函数包括双曲正切。19.根据权利要求16-18中任一项所述的方法,其中所述激活函数包括整流线性单元。20.根据权利要求8-19中任一项所述的方法,其中所述隐藏层进一步包括多个第二上下文单元。21.根据权利要求20所述的方法,其中基于所述输入层来生成所述隐藏层包括:使用第三加权矩阵来对当前输入单元进行加权;使用第四加权矩阵来对随后的第二上下文单元进行加权;以及基于对所述当前输入单元的所述加权和对所述随后的第二上下文单元的所述加权来确定当前第二上下文单元。22.根据权利要求21所述的方法,其中对所述当前第二上下文单元的所述确定包括应用激活函数。23.根据权利要求8-22中任一项所述的方法,其中所述输出层包括多个输出标签单元,每个输出标签单元具有1-of-K编码,其中所述K表示预先确定的极性集的极性的数量。24.根据权利要求23所述的方法,其中所述预先确定的极性集包括提议、拒绝、接受、和无事件。25.根据权利要求8-24中任一项所述的方法,其中基于所述隐藏层来生成所述输出层包括:使用第五加权矩阵来对当前第一上下文单元进行加权;以及基于对所述当前第一上下文单元的所述加权来确定当前输出标签单元。26.根据权利要求25所述的方法,其中确定所述当前输出标签单元包括应用softmax激活函数。27.根据权利要求8-26中任一项所述的方法,其中基于所述隐藏层来生成输出层进一步包括:基于当前第一上下文单元和当前第二上下文单元来获取当前状态;使用第六加权矩阵来对所述当前状态进行加权;以及基于对所述当前状态的所述加权来确定当前输出标签单元。28.根据权利要求27所述的方法,其中确定所述当前输出标签单元包括应用softmax激活函数。29.根据权利要求7-28中任一项所述的方法,其中基于所述一个或多个极性来确定事件信息是否存在包括:确定所述一个或多个极性是否包括提议、拒绝、或接受中的至少一者;根据确定所述一个或多个极性包括提议、拒绝、或接受中的至少一者,确定与提议、拒绝、或接受中的至少一者相关联的概率;确定所述概率是否满足第一概率阈值;以及根据确定所述概率满足所述第一概率阈值,确定事件信息存在于所述非结构化自然语言信息中。30.根据权利要求7-29中任一项所述的方法,根据确定事件信息存在于所述非结构化自然语言信息中,确定对事件的协定是否存在于所述非结构化自然语言信息中包括:确定所述一个或多个极性是否包括接受;根据确定所述一个或多个极性包括接受,确定与所述接受相关联的概率;确定所述概率是否满足第二概率阈值;以及根据确定所述概率满足所述第二概率阈值,确定对事件的协定存在。31.根据权利要求1-30中任一项所述的方法,其中确定所述事件类型基于使用自然语言事件知识本体的分级分类。32.根据权利要求31所述的方法,其中所述自然语言事件知识本体包括一个或多个级别,每个级别包括一个或多个事件类型节点。33.根据权利要求32所述的方法,其中所述自然语言事件知识本体的第一级别包括聚会事件类型节点、娱乐事件类型节点、约会事件类型节点、和安排事件类型节点。34.根据权利要求32-33中任一项所述的方法,其中所述自然语言事件知识本体包括第一级别和第二级别,其中第一级别事件类型节点与一个或多个第二级别事件类型节点分级地相关。35.根据权利要求32-34中任一项所述的方法,其中至少一个事件类型节点与优先级规则相关联,所述优先级规则指示所述至少一个事件类型节点相对于另一个事件类型节点的相对优先级。36.根据权利要求32-35中任一项所述的方法,其中所述自然事件语言知识本体的第二级别或更高级别的至少一个事件类型节点是叶节点,其中所述叶节点不与子节点分级地相关。37.根据权利要求1-36中任一项所述的方法,其中确定所述事件的所述事件类型包括:确定与所述事件相关联的第一级别事件类型;以及基于所述第一级别事件类型来确定所述事件的所述事件类型。38.根据权利要求37所述的方法,其中确定所述第一级别事件类型包括确定输出层的第一级别事件类型输出,其中所述第一级别事件类型输出具有1-of-L编码,其中所述L表示所述自然语言事件知识本体的第一级别事件类型节点的数量。39.据权利要求38所述的方法,其中确定所述第一级别事件类型输出包括;对隐藏层的后续的第一上下文单元进行加权;以及基于对所述后续的第一上下文单元的所述加权来确定所述第一级别事件类型输出。40.根据权利要求38-39中任一项所述的方法,其中确定所述第一级别事件类型输出包括:拼接后续的第一上下文单元和前导的第二上下文单元;对所述后续的第一上下文单元和所述前导的第二上下文单元的所述拼接进行加权;以及基于对所述后续的第一上下文单元和所述前导的第二上下文单元的所述拼接的所述加权来确定所述第一级别事件类型输出。41.根据权利要求38-40中任一项所述的方法,其中确定所述第一级别事件类型输出包括应用激活函数。42.根据权利要求37-41中任一项所述的方法,其中基于所述第一级别事件类型来确定所述事件的所述事件类型包括:针对每个第二级别事件类型节点来确定所述第二级别事件类型节点和所述非结构化自然语言信息之间的相关性的数量,其中每个第二级别事件类型节点是表示所述第一级别事件类型的第一级别事件类型节点的子节点;以及基于每个第二级别事件类型节点的相关性的所述数量来确定第二级别事件类型。43.据权利要求42所述的方法,其中确定所述第二级别事件类型包括:基于每个第二级别事件类型节点的相关性的所述数量来确定相关性的最大数量;以及基于相关性的所述最大数量来确定所述第二级别事件类型。44.根据权利要求43所述的方法,还包括:确定至少两个第二级别事件类型节点是否对应于相关性的所述最大数量;以及根据确定至少两个第二级别事件类型节点对应于相关性的所述最大数量,基于一个或多个优先级规则来确定所述第二级别事件类型。45.根据权利要求42-44中任一项所述的方法,还包括基于所述第二级别事件类型来分级地确定更高级别事件类型。46.根据权利要求45所述的方法,其中继续所述分级确定,直到到达叶节点,其中所述叶节点并未分级地连接到子节点。47.根据权利要求45-46中任一项所述的方法,其中继续所述分级确定,直到每个更高级别事件类型节点的相关性的所述数量为零。48.根据权利要求45-47中任一项所述的方法,还包括:基于所述第二级别事件类型或更高级别事件类型来确定所述事件的所述事件类型。49.根据权利要求45-48中任一项所述的方法,还包括基于所述非结构化自然语言信息的一个或多个符号来调节对所述第一级别事件类型、所述第二级别事件类型、更高级别事件类型中的至少一者的确定。50.根据权利要求1-49中任一项所述的方法,其中基于所述事件的所述事件类型来提供事件描述包括提供事件标题,其中所述事件标题包括对应事件类型节点的主题。51.根据权利要求1-50中任一项所述的方法,其中基于所述事件的所述事件类型来提供所述事件描述包括提供所述事件的开始时间。52.根据权利要求1-51中任一项所述的方法,其中基于所述事件的所述事件类型来提供所述事件描述包括提供所述事件的结束时间。53.根据权利要求1-52中任一项所述的方法,其中基于所述事件的所述事件类型来提供所述事件描述包括提供所述事件的持续时间。54.根据权利要求1-53中任一项所述的方法,还包括基于上下文信息来提供对所述事件的所述事件描述。55.根据权利要求54所述的方法,其中所述上下文信息包括位置、日期、时间、或一个或多个用户偏好中的至少一者。56.根据权利要求1-55中任一项所述的方法,还包括:基于所述事件描述来生成日历条目;显示所述日历条目;以及提供一个或多个示能表示,其中所述一个或多个示能表示使得能够相对于所述日历条目来接收一个或多个用户输入。57.根据权利要求56所述的方法,还包括:接收用于确认所述日历条目的一个或多个用户输入;以及将所述日历条目添加到所述用户的日历。58.根据权利要求56-57中任一项所述的方法,还包括:接收用于编辑所述日历条目的一个或多个用户输入;以及将所编辑的日历条目添加到所述用户的日历。59.根据权利要求56-58中任一项所述的方法,还包括:接收用于拒绝所述日历条目的一个或多个用户输入;以及发起与所述用户的对话。60.根据权利要求1-59中任一项所述的方法,还包括:基于所述事件描述来生成日历条目;以及将所述日历条目自动添加到所述用户的日历。61.根据权利要求1-60中任一项所述的方法,还包括基于所述事件描述来生成预订请求。62.根据权利要求1-61中任一项所述的方法,还包括将所述事件描述提供至一个或多个应用程序。63.一种存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由电子设备的一个或多个处理器执行时使得所述电子设备:从至少一个用户接收非结构化自然语言信息;响应于接收到所述非结构化自然语言信息,确定事件信息是否存在于所述非结构化自然语言信息中;根据确定事件信息存在于所述非结构化自然语言信息内,确定对事件的协定是否存在于所述非结构化自然语言信息中;以及根据确定对事件的协定存在,确定所述事件的事件类型;以及基于所述事件类型来提供事件描述。64.一种电子设备,包括:一个或多个处理器;存储器;和被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于进行以下操作的指令:从至少一个用户接收非结构化自然语言信息;响应于接收到所述非结构化自然语言信息,确定事件信息是否存在于所述非结构化自然语言信息中;根据确定事件信息存在于所述非结构化自然语言信息内,确定对事件的协定是否存在于所述非结构化自然语言信息中;以及根据确定对事件的协定存在,确定所述事件的事件类型;以及基于所述事件类型来提供事件描述。65.一种电子设备,包括:用于从至少一个用户接收非结构化自然语言信息的装置;用于响应于接收到所述非结构化自然语言信息而确定事件信息是否存在于所述非结构化自然语言信息中的装置;用于根据确定事件信息存在于所述非结构化自然语言信息内来确定对事件的协定是否存在于所述非结构化自然语言信息中的装置;和用于根据确定对事件的协定存在来确定所述事件的事件类型的装置;和用于基于所述事件类型来提供事件描述的装置。66.一种电子设备,包括:一个或多个处理器;存储器;和被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行根据权利要求1-62中任一项所述的方法的指令。67.一种电子设备,包括:用于执行根据权利要求1-62所述的方法中的任一方法的装置。68.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质包括用于由电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括指令,所述指令当...

【专利技术属性】
技术研发人员:J·R·贝勒加达M·J·马特尔A·卡尔希安A·瓦因尔J·G·多尔芬格S·雷吉克M·伯格特H·阿拉斯
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1