自然语言表达变体的生成制造技术

技术编号:33628150 阅读:12 留言:0更新日期:2022-06-02 01:20
一种涉及自然语言表达变体生成的计算机实现的方法、系统和计算机程序产品。根据该方法,通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达(810)。基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达(820)。该模板结构化表达集合中的每一个模板结构化表达包括预定符号以表示关键实体。通过用所述源关键实体替换所述至少一个选定的模板结构化表达中的预定符号,生成用于所述源表达的至少一个变体表达(830)。(830)。(830)。

【技术实现步骤摘要】
【国外来华专利技术】自然语言表达变体的生成

技术介绍

[0001]本专利技术涉及自然语言处理技术,并且更具体地涉及自然语言表达变体的生成。
[0002]随着技术的发展,自然语言处理的使用已经扩展到涵盖各种各样的应用,这些应用的示例包括句子生成,该句子生成可以用于实现人机对话、问答、意图识别、报告创建、自动技术文档、定制指令、项目和事件描述、教程、以及故事。机器学习或深度学习模型被广泛地用于改进自然语言处理任务。

技术实现思路

[0003]根据本专利技术的一个实施例,提供了一种计算机实现的方法。根据该方法,通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达。基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达。该模板结构化表达集合中的每一个包括用于表示关键实体的预定符号。通过用所述源关键实体替换所述至少一个选定的模板结构化表达中的预定符号,为所述源表达生成至少一个变体表达。
[0004]根据本专利技术的另一实施例,提供了一种系统。该系统包括:处理单元;以及存储器,耦接至处理单元并且在其上存储指令。当该指令被处理单元执行时,执行根据本专利技术的实施例的方法的动作。
[0005]根据本专利技术的又一实施例,提供了一种有形地存储在非瞬态机器可读介质上并包括机器可执行指令的计算机程序产品。当在设备上执行时,这些指令使得该设备执行根据本专利技术的实施例的方法的动作。
附图说明
[0006]通过在附图中对本公开的一些实施例进行更详细的描述,本公开的上述和其他目的、特征和优点将变得更加明显,其中,在本公开的实施例中相同的参考标号通常指代相同的部件。
[0007]图1描绘了根据本专利技术实施例的云计算节点。
[0008]图2描绘了根据本专利技术实施例的云计算环境。
[0009]图3描绘了根据本专利技术实施例的抽象模型层。
[0010]图4描绘了根据本专利技术实施例的用于生成自然语言表达变体的示例系统的框图。
[0011]图5描绘了根据本专利技术实施例的图4的系统中的实体识别模块的示例的框图。
[0012]图6描绘了根据本专利技术另一实施例的用于生成自然语言表达变体的示例系统的框图。
[0013]图7描绘了根据本专利技术实施例的图6的系统中的模板添加模块的示例的框图。
[0014]图8描绘了根据本专利技术实施例的示例方法的流程图。
具体实施方式
[0015]将参考附图更详细地描述一些实施例,在附图中示出了本公开内容的实施例。然而,本公开可以以各种方式实施,并且因此不应被解释为局限于本文中公开的实施例。
[0016]应当理解,虽然本公开包括关于云计算的详细描述,但是本文所引用的教导的实现不限于云计算环境。相反,本专利技术的实施例能够结合现在已知的或以后开发的任何其他类型的计算环境来实现。
[0017]云计算是服务交付的模型,用于使得能够方便地、按需地网络访问可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池,所述可配置计算资源可以以最小的管理努力或与服务的提供商的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。
[0018]特性如下:
[0019]按需自助服务:云消费者可以单方面地根据需要自动地提供计算能力,诸如服务器时间和网络存储,而不需要与服务的提供者的人类交互。
[0020]广泛的网络接入:能力可通过网络获得并且通过标准机制接入,该标准机制促进异构瘦客户机平台或厚客户机平台(例如,移动电话、膝上型计算机和PDA)的使用。
[0021]资源池:提供者的计算资源被池化以使用多租户模型来服务于多个消费者,其中不同的物理和虚拟资源根据需要动态地指派和重新指派。存在位置独立性的感觉,因为消费者通常不具有对所提供的资源的确切位置的控制或了解,但可能能够以较高抽象级别(例如,国家、州或数据中心)指定位置。
[0022]快速弹性:能够快速和弹性地提供能力,在一些情况下自动地快速缩小和快速释放以快速放大。对于消费者而言,可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。
[0023]测量的服务:云系统通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某个抽象级别处利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用,为所利用的服务的提供者和消费者提供透明度。
[0024]服务模型如下:
[0025]软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如,基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至单独的应用能力的底层云基础设施,除了有限的特定于用户的应用程序配置设置之外。
[0026]平台即服务(PaaS):提供给消费者的能力是将消费者创建的或获取的使用由提供商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施,但是对所部署的应用和可能的应用托管环境配置具有控制。
[0027]基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源,所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,而是具有对操作系统、存储、所部署的应用的控制以及对所选联网组件(例如,主机防火墙)的可能受限的控制。
[0028]部署模型如下:
[0029]私有云:云基础架构仅为组织运作。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
[0030]社区云:云基础架构被若干组织共享并支持共享了关注(例如,任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
[0031]公共云:使云基础架构对公众或大型行业组可用,并且由出售云服务的组织拥有。
[0032]混合云:云基础架构是两个或更多个云(私有、社区或公共)的组合,这些云保持唯一实体但通过使数据和应用能够移植的标准化或专有技术(例如,云突发以用于云之间的负载平衡)绑定在一起。
[0033]云计算环境是面向服务的,集中于无状态、低耦合、模块化和语义互操作性。云计算的核心是包括互连节点网络的基础设施。
[0034]现在参见图1,示出了云计算节点的示例的示意图。云计算节点10仅仅是合适的云计算节点的一个示例,并不旨在对本文所述的本专利技术的实施例的使用或功能的范围提出任何限制。无论如何,云计算节点10能够被实现和/或执行上文阐述的任何功能。
[0035]在云计算节点10中,存在计算机系统/服务器12或诸如通信设备的便携式电子设备,其可与许多其他通用或专用计算系统环境或配置一起操作。可以适用于计算机系统/服务器12的公知的计算系统、环境本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成自然语言表达变体的计算机实现的方法,所述方法包括:由一个或多个处理器通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达;由所述一个或多个处理器基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达,所述模板结构化表达集合中的每一个模板结构化表达包括预定符号以表示关键实体;以及由所述一个或多个处理器通过用所述源关键实体替换所述至少一个所选模板结构化表达中的所述预定符号来生成用于所述源表达的至少一个变体表达。2.根据权利要求1所述的方法,其中,选择所述至少一个模板结构化表达包括:通过所述一个或多个处理器将所述相应相似性与第一阈值相似性进行比较;以及响应于所述结构化表达与所述集合中的所述相应模板结构化表达中的至少一个之间的所述相应相似性中的相似性超过第一阈值相似性,由一个或多个处理器选择所述至少一个模板结构化表达。3.根据权利要求2所述的方法,进一步包括:由所述一个或多个处理器确定与所述结构化表达的相似性高于所述第一阈值相似性的模板结构化表达的数目;响应于所确定的数量小于阈值数量,由一个或多个处理器并从预定语料库中获取与所述源表达的相似性高于第二相似性阈值的所述自然语言的至少一个原始表达,所述至少一个表达包括所述源关键实体;以及由所述一个或多个处理器基于所述至少一个原始表达来生成至少一个进一步的模板结构化表达。4.根据权利要求3所述的方法,其中,获得多个原始表达,并且其中,生成所述至少一个另外的模板结构化表达包括:由所述一个或多个处理器将所述多个原始表达聚集成原始表达的多个组,所述多个组中的每个组包括所述多个原始表达中的至少一个;由所述一个或多个处理器从所述多个原始表达组中选择相应的原始表达;以及由所述一个或多个处理器通过用所述预定符号替换所选择的原始表达中的所述源关键实体来生成多个进一步的模板结构化表达。5.根据权利要求4所述的方法,进一步包括:由所述一个或多个处理器提供所选择的原始表达中的至少一个原始表达作为所述源表达的至少一个变体表达。6.根据权利要求1所述的方法,其中,所述相应相似性至少部分地基于所述结构化表达与所述集合中的所述相应模板结构化表达之间的结构相似性。7.根据权利要求1所述的方法,进一步包括:由所述一个或多个处理器基于用于实体识别的经训练的机器学习模型从所述源表达标识所述源关键实体。8.一种系统,包括:处理单元;以及
存储器,所述存储器耦合至所述处理单元并且在其上存储指令,所述指令在由所述处理单元执行时执行动作,所述动作包括:通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达;基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达,所述模板结构化表达集合中的每一个模板结构化表达包括预定符号以表示关键实体;以及通过用所述源关键实体替换所述至少一个所选模板结构化表达中的所述预定符号来生成用于所述源表达的至少一个变体表达。9.根据权利要求8所述的系统,其中,选择所述至少一个模板结构化表达包括:将所述相应相似性与第一阈值相似性进行比较;以及响应于所述结构化表达与所述集合中的所述相应模板结构化表达中的至少一个之间的所述相应相似性中的相似性超过第一阈值相似性,选择所述至少一个模板结构化表达。10.根据权利要求9所述的系统,其中,所述...

【专利技术属性】
技术研发人员:刘桐殷昆燕元中方李贺章园
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1