用于语言转换的时间转换语法制造技术

技术编号:14055475 阅读:32 留言:0更新日期:2016-11-26 23:32
在语言转换和意图理解方案中,包含时间元素(例如,日历日期、日期范围、年代和持续时间)的表达的自动转换可通过转换技术的实现方式来实现,诸如汇编的规则集和/或已经通过训练集训练过的机器学习识别器。然而,在各实现方式当中共享开发资源可能很难;例如,当更新机器学习识别器时,对于转换技术应用于新上下文而扩展规则集的更新会难以利用。本文呈现的是通过提供时间转换语法来促进时间转换资源的开发的技术,时间转换语法包括:规定时间元素的识别的识别规则;规定将识别的时间元素标准化成标准化时间元素和时间意图的标准化规则;以及将表达的标准化时间元素转换成转换后表达中的日期的转换规则。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
在语言转换领域内,可使用许多技术来对与日期相关联的表达的时间元素进行标识、标准化、和/或转换,所述日期诸如日历日期、周日、一天的时间或持续期间。这些技术经常涉及到将转换逻辑应用于表达的设备的配置,诸如包括分别规定了将表达的时间元素转换成转换后表达的一组人工开发的规则的规则集,或者利用训练数据集进行训练以促进将时间元素转换成转换后表达的机器学习识别器。许多这样的技术可被设计和实现用于各种上下文;例如,第一实现方式可以包括提供在具有相对有限的计算资源的移动设备上使用的基本日期转换的比较简单的规则集,并且第二实现方式可以包括鲁棒的机器学习识别器和复杂逻辑,它们一起提供了在计算丰富的服务器上使用的复杂的、极其精确的日期转换。
技术实现思路
提供该
技术实现思路
以便以下文在具体实施方式中进一步描述的简化形式来引入构思的选择。该
技术实现思路
不意在标识出所要求保护的主题的关键特征或主要特征,该
技术实现思路
也不意在用来限定所要求保护的主题的范围。以上述方式所描述的用于各种上下文的语言转换资源的开发和调用会遇到一些开发难题。例如,当针对特定上下文人工开发规则集以及利用用于特定上下文的训练数据集训练机器学习识别器时,难以针对其它上下文扩展这些语言转换资源,例如将用于转换成新语言或方言的资源进行本地化。特别地,一些技术可以使用各种规则集和/或机器学习识别器(例如,针对不同设备和/或服务而设计的各种资源)或者这些技术的组合,并且难以在这些各种实现方式的开发中共享时间转换资源。也即,虽然开发了用于第一上下文的第一实现方式(例如,用于移动设备的规则集)以及用于第二上下文的第二实现方式(例如,用于计算上鲁棒的服务的机器学习识别器),可能难以开发由这两个实现方式的逻辑所使用的信息的共享基础。另外,为了将这些资源扩展到新的设备、语言和/或上下文,开发者可能不得不通过加工特定的实现方式来实现这些扩展,例如,通过开发使用与现有规则相同的语言的新规则,和/或通过开发使得能够机器语言识别器按期望的方式扩展的新的训练数据集。然而,这些实现方式特定的开发会将另一的复杂情况引入已经复杂化的自动时间语言评估领域。本文提供了用于开发基于时间转换语法的时间转换资源的技术,其包括共同提供了用于表达中的时间元素的转换流水线的多个规则集合。时间转换语法包括:至少一个识别规则,其标识表达的时间元素;至少一个标准化规则,其将所述表达的时间元素标准化成标准化时间元素;以及转换规则,其将标准化时间元素转换成日期,该日期可包含在转换后的表达中。该类型的时间转换语法可以被设计为,例如人类可读的、实现方式无关的规则集,诸如指示包括时间转换语法的各种规则集的可扩展标记语言(XML)文件。各种类型的具体实现方式可以通过各种方式消耗时间转换语法;例如,综合语言转换规则集可以包括时间转换语法,并且机器学习识别器可以用训练集和时间转换语法两者来进行训练,和/或可以连同时间转换语法一起评估表达。由此这些变型例使得基于各种技术的实现方式共享实现方式无关的时间转换语法,从而根据本文提供的技术促进时间转换资源的开发。为了实现上述目的以及相关的目的,下面的说明书和附图阐述了一些示例性的方面和实现方式。这些指示了可以采用一个或多个方面的各种方式中的仅仅几个。公开的其它方面、优点和新颖特征将根据以下结合附图考虑的具体实施方式中变得显而易见。附图说明图1是以使用各种技术来转换包括各种时间元素的表达的一组设备为特征的示范性的方案的图示说明。图2是以根据本文提供的技术的能用于促进计算机转换表达的时间元素的时间转换语法为特征的示范性的方案的图示说明。图3是将设备配置为根据本文提供的技术转换包含时间元素的表达的示范性的方法的流程图。图4是被配置为根据本文提供的技术来转换包含时间元素的表达的示范性的系统的组件框图。图5是包括被配置为具体实施本文阐述的一个或多个规定的处理器可执行指令的示范性的计算机可读介质的图示说明。图6是以根据本文提供的技术针对与其相关的基准日期来对表达的时间元素进行转换为特征的示范性的方案的图示说明。图7是以根据本文提供的技术使用由补充规则补充的时间转换语法和由应用提供的上下文来对包含时间元素的表达进行转换为特征的示范性的方案的图示说明。图8图示出其中可以实现本文阐述的一个或多个规定的示范性的计算环境。具体实施方式现在将参考附图来描述所要求保护的主题,其中在全文中相似的附图标记用来指代相似的元素。在下面的说明中,为了解释的目的,阐述了若干具体的细节以便提供对所要求保护的主题的全面理解。然而,显然,所要求保护的主题可以在没有这些具体细节的情况下实施。在其它实例中,为了促进所要求保护的主题的描述,以框图形式示出了结构和设备。A.介绍图1呈现了涉及到通过计算机106来转换的一组表达102的示范性的方案100的图示说明。在该示范性的方案100中,除了提供有关历史登月项目的自然语言陈述,各个表达102中的每一个均包括与表达102的事实相关联的时间元素104;并且虽然表达102中的每一个属于相同事件的日期,但是以自然语言表达时间元素104的多种方式证实了高度的多样性。例如,第一表达102包含以标准化的格式明确地规定了完整的日历日期的时间元素104,而第二表达102包含了仅规定年份的时间元素104。第三表达102和第四表达102包含标识出可以论及日期的口语方式的时间元素104(例如,为“’69”或者为“1960’s”)。第五表达102包含了以相对方式规定的时间元素104(例如,在另一日期之前的一年),并且第六表达102包含了分布在表达102的两个分立部分的时间元素104(例如,“于1969年….于7月”)。第七表达102和第八表达102包含了规定日期集合的时间元素104(“于1969年,1972年以及1972年…”以及“在’69与’72之间”的日期范围)。第九表达102包含了规定范围和频率的再发生的时间元素(“在1969年与1972年之间每年”)。考虑到每个均与涉及到同一基本事实的同一日期有关的时间元素104的显著的语言差异,可以意识到,配置计算机106正确地识别并解释指定的日期是困难的。为了实现该识别,例如,为了产生包含由各时间元素104所标识的日期的转换后表达112,可以实现各种语言转换技术。第一计算机106可以包括规则集108,该规则集由开发者汇编以转换表达102的时间元素104从而生成转换后表达112,而第二计算机106可以包括已经在训练数据集上训练来识别时间元素104的机器学习识别器110(例如,人工神经网络、遗传算法和/或贝叶斯分类器),并且可以调用机器学习识别器110来标识和转换表达102的时间元素104。其他计算机106可以包括这些技术的组合,任选地与其他技术相结合,从而转换表达102。B.呈现的技术在一系列可用的时间转换资源的实现方式中,特定的实现会依精度、转换速度、维护简易性、新上下文的可扩展性(例如,其他语言或方言)和/或计算资源的高效使用而不同。在一些方案中,这些特性可以代表权衡,并且对于适合的转换上下文(例如,基于特定计算机106的资源),适合的实现方式可被选为这些权衡的平衡。例如,对于具有比较受限的计算资源的计算机106,例如,移动电话,可以实现简单规则集1本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580016200.html" title="用于语言转换的时间转换语法原文来自X技术">用于语言转换的时间转换语法</a>

【技术保护点】
一种用于转换由具有处理器和存储器的计算机接收到的用户的表达的系统,所述系统包括:时间转换语法,其被存储在所述存储器中并且包括:至少一个识别规则,其分别标识表达的时间元素;至少一个标准化规则,其分别将所述表达的时间元素标准化成标准化时间元素;以及至少一个转换规则,其分别将标准化时间元素转换成日期;以及表达转换器,其包括存储在所述存储器中的指令,当在所述处理器上执行时,所述指令使得所述计算机在接收到来自所述用户的表达时应用所述时间转换语法用于:针对所述表达的相应的时间元素,标识由所述用户引用的选定日期;以及将所述表达的相应的时间元素转换成所述选定日期。

【技术特征摘要】
【国外来华专利技术】2014.03.26 US 14/225,8941.一种用于转换由具有处理器和存储器的计算机接收到的用户的表达的系统,所述系统包括:时间转换语法,其被存储在所述存储器中并且包括:至少一个识别规则,其分别标识表达的时间元素;至少一个标准化规则,其分别将所述表达的时间元素标准化成标准化时间元素;以及至少一个转换规则,其分别将标准化时间元素转换成日期;以及表达转换器,其包括存储在所述存储器中的指令,当在所述处理器上执行时,所述指令使得所述计算机在接收到来自所述用户的表达时应用所述时间转换语法用于:针对所述表达的相应的时间元素,标识由所述用户引用的选定日期;以及将所述表达的相应的时间元素转换成所述选定日期。2.如权利要求1所述的系统,其中,所述表达转换器进一步使得所述计算机在接收到包括第一时间元素和第二时间元素的表达时,用于:将第一标准化规则应用于所述表达,所述第一标准化规则将所述表达的所述第一时间元素标准化成第一标准化时间元素;以及将第二标准化规则应用于所述表达,所述第二标准化规则不同于所述第一标准化规则,并且所述第二标准化规则将所述表达的所述第二时间元素标准化成第二标准化时间元素。3.如权利要求1所述的系统,其中:至少一个选定的标准化时间元素是相对于基准日期的;以及所述时间转换语法的至少一个选定的转换规则将所述选定的标准化时间元素转换成相对于所述基准日期的日期。4.如权利要求3所述的系统,其中:所述计算机具有对知识集的访问权,所述知识集包括与基准日期关联的至少一个事实;以及所述选定的转换规则通过如下来转换所述选定的标准化时间元素:标识所述知识集中的与所述选定的基准日期...

【专利技术属性】
技术研发人员:A·普罗科耶夫S·钦奈
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1