【技术实现步骤摘要】
【国外来华专利技术】自然语言表达变体的生成
技术介绍
[0001]本专利技术涉及自然语言处理技术,并且更具体地涉及自然语言表达变体的生成。
[0002]随着技术的发展,自然语言处理的使用已经扩展到涵盖各种各样的应用,这些应用的示例包括句子生成,该句子生成可以用于实现人机对话、问答、意图识别、报告创建、自动技术文档、定制指令、项目和事件描述、教程、以及故事。机器学习或深度学习模型被广泛地用于改进自然语言处理任务。
技术实现思路
[0003]根据本专利技术的一个实施例,提供了一种计算机实现的方法。根据该方法,通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达。基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达。该模板结构化表达集合中的每一个包括用于表示关键实体的预定符号。通过用所述源关键实体替换所述至少一个选定的模板结构化表达中的预定符号,为所述源表达生成至少一个变体表达。
[0004]根据本专利技术的另一实施例,提供了一种系统。该系统包括:处理单元;以及存储器,耦接至处理单元并且在其上存储指令。当该指令被处理单元执行时,执行根据本专利技术的实施例的方法的动作。
[0005]根据本专利技术的又一实施例,提供了一种有形地存储在非瞬态机器可读介质上并包括机器可执行指令的计算机程序产品。当在设备上执行时,这些指令使得该设备执行根据本专利技术的实施例的方法的动作。
附图说明
[0006]通过在附图中对本公开的一些 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于生成自然语言表达变体的计算机实现的方法,所述方法包括:由一个或多个处理器通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达;由所述一个或多个处理器基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达,所述模板结构化表达集合中的每一个模板结构化表达包括预定符号以表示关键实体;以及由所述一个或多个处理器通过用所述源关键实体替换所述至少一个所选模板结构化表达中的所述预定符号来生成用于所述源表达的至少一个变体表达。2.根据权利要求1所述的方法,其中,选择所述至少一个模板结构化表达包括:通过所述一个或多个处理器将所述相应相似性与第一阈值相似性进行比较;以及响应于所述结构化表达与所述集合中的所述相应模板结构化表达中的至少一个之间的所述相应相似性中的相似性超过第一阈值相似性,由一个或多个处理器选择所述至少一个模板结构化表达。3.根据权利要求2所述的方法,进一步包括:由所述一个或多个处理器确定与所述结构化表达的相似性高于所述第一阈值相似性的模板结构化表达的数目;响应于所确定的数量小于阈值数量,由一个或多个处理器并从预定语料库中获取与所述源表达的相似性高于第二相似性阈值的所述自然语言的至少一个原始表达,所述至少一个表达包括所述源关键实体;以及由所述一个或多个处理器基于所述至少一个原始表达来生成至少一个进一步的模板结构化表达。4.根据权利要求3所述的方法,其中,获得多个原始表达,并且其中,生成所述至少一个另外的模板结构化表达包括:由所述一个或多个处理器将所述多个原始表达聚集成原始表达的多个组,所述多个组中的每个组包括所述多个原始表达中的至少一个;由所述一个或多个处理器从所述多个原始表达组中选择相应的原始表达;以及由所述一个或多个处理器通过用所述预定符号替换所选择的原始表达中的所述源关键实体来生成多个进一步的模板结构化表达。5.根据权利要求4所述的方法,进一步包括:由所述一个或多个处理器提供所选择的原始表达中的至少一个原始表达作为所述源表达的至少一个变体表达。6.根据权利要求1所述的方法,其中,所述相应相似性至少部分地基于所述结构化表达与所述集合中的所述相应模板结构化表达之间的结构相似性。7.根据权利要求1所述的方法,进一步包括:由所述一个或多个处理器基于用于实体识别的经训练的机器学习模型从所述源表达标识所述源关键实体。8.一种系统,包括:处理单元;以及
存储器,所述存储器耦合至所述处理单元并且在其上存储指令,所述指令在由所述处理单元执行时执行动作,所述动作包括:通过用预定符号替换自然语言的源表达中的源关键实体来确定用于所述源表达的结构化表达;基于所述结构化表达与模板结构化表达集合中的相应模板结构化表达之间的相应相似性来从所述模板结构化表达集合选择至少一个模板结构化表达,所述模板结构化表达集合中的每一个模板结构化表达包括预定符号以表示关键实体;以及通过用所述源关键实体替换所述至少一个所选模板结构化表达中的所述预定符号来生成用于所述源表达的至少一个变体表达。9.根据权利要求8所述的系统,其中,选择所述至少一个模板结构化表达包括:将所述相应相似性与第一阈值相似性进行比较;以及响应于所述结构化表达与所述集合中的所述相应模板结构化表达中的至少一个之间的所述相应相似性中的相似性超过第一阈值相似性,选择所述至少一个模板结构化表达。10.根据权利要求9所述的系统,其中,所述...
【专利技术属性】
技术研发人员:刘桐,殷昆燕,元中方,李贺,章园,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。