一种自然语言的生成方法、自然语言生成装置及电子设备制造方法及图纸

技术编号:17939532 阅读:26 留言:0更新日期:2018-05-15 19:58
本发明专利技术提供了一种自然语言的生成方法、自然语言生成装置及电子设备。本发明专利技术直接从语料库中提取句式模板,保证了后续生成的自然语句的句式正确性,而且,句式模板的提取,只需要删除输入模式中预先定义的语句中的组成成分,避免了过多的人工工作。另外,本发明专利技术基于输入语义与句式模板之间的匹配度,选择候选句式模板,提高了所生成自然语句的正确性。

Method for generating natural language, natural language generating device and electronic device

The invention provides a natural language generation method, a natural language generating device and an electronic device. The invention directly extracts sentence templates from the corpus, which ensures the correctness of the sentence pattern of subsequent generation of natural sentences. Moreover, the extraction of sentence templates only needs to delete the components of the predefined statements in the input mode and avoid too much manual work. In addition, based on the matching degree between the input semantics and the sentence template, the invention selects the template of the candidate sentence pattern, and improves the correctness of the generated natural sentence.

【技术实现步骤摘要】
一种自然语言的生成方法、自然语言生成装置及电子设备
本专利技术涉及自然语言处理
,具体涉及一种自然语言的生成方法、自然语言生成装置及电子设备。
技术介绍
随着人工智能的发展,人机对话等智能系统的应用范围越来越广,对拟人化输出的需求,即对直接输出自然语言的需求越来越高。现有技术生成并输出自然语言的实现方案,包括有:1)通过预先定义的语言模型生成自然语句;2)通过人工定义的模板生成自然语句。上述两类方法在实际应用过程中分别存在一定的问题。例如,第1种实现方案中,很难通过数学模型很好地表达自然语言的语法与逻辑关系,因此难以保证生成的语言的正确性;第2种基于人工模板的方案,通常只能应用于特定领域或单一用途,缺乏灵活性且需要大量的人工工作。因此,亟需一种自然语言的生成方法,能够提高方案的实现灵活性,减少人工工作量,并能够提高语言生成结果的正确性。
技术实现思路
本专利技术实施例要解决的技术问题是提供一种自然语言的生成方法、自然语言生成装置及电子设备,用以提高自然语句生成的灵活性,减少人工工作量,并提高语言生成结果的正确性。为解决上述技术问题,本专利技术实施例提供的自然语言的生成方法,包括:根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间的匹配度,选择出所述匹配度满足预定条件的至少一个候选句式模板;根据所述输入语义和所述候选句式模板,生成自然语句。其中,上述方法中,在生成匹配预定义的输入模式的至少一个句式模板的步骤之后,所述方法还包括:计算每两个句式模板之间的相似度;在计算所述输入语义与句式模板之间的匹配度的过程中,根据当前计算匹配度的句式模板与其他句式模板之间的相似度,确定下一个计算所述匹配度的句式模块。其中,上述方法中,所述计算每两个句式模板之间的相似度的步骤,包括:根据以下公式,计算每两个句式模板之间的相似度Sim(p1,p2):其中:w表示子语义对应的词;p1、p2分别表示每两个句式模板中的第一句式模板和第二句式模板;s表示句式模板中的一个填充位置;T(p,s)表示语料库中能够填充在句式模板p的填充位置s中的词的集合;Num(T())表示集合T()中词的数量;n表示T(p,s)中词的数量;θw表示词w的预设权重系数,x表示T(p,s)中的词,cos(w,x)表示词w与x的余弦相似度;T(p1,s)∩T(p2,s)表示两个集合的交集,T(p1,s)∪T(p2,s)表示两个集合的并集;表示针对句式模板中的所有填充位置s对应的Y值进行求和计算。其中,上述方法中,所述计算所述输入语义与句式模板之间的匹配度的步骤,包括:针对所述输入语义中的每个子语义,分别根据该子语义在句式模板中的填充位置,确定所述语料库中能够填充在该填充位置的词的第一集合;以及,根据该子语义与第一集合中的各个词之间的余弦相似度,计算得到该子语义与句式模板中对应填充位置的匹配因子,其中,所述匹配因子与所述余弦相似度正相关;根据每个子语义与句式模板中对应填充位置的匹配因子,计算所述输入语义与句式模板之间的匹配度。其中,上述方法中,所述根据所述输入语义和所述候选句式模板,生成自然语句的步骤,包括:将所述输入语义和/或替换语义中的词,填充至所述候选句式模板中的对应位置,得到候选自然语句,其中,所述替换语义与所述输入语义的语义近似度高于预设阈值;计算所述候选自然语句中的各个填充位置的子语义组成的填充语义,与对应的候选句式模板之间的匹配度,并根据所述匹配度,筛选出匹配度达到预定门限的自然语句。本专利技术实施例还提供了一种自然语言生成装置,包括:模板获得模块,用于根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;模板选择模块,用于获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间的匹配度,选择出所述匹配度满足预定条件的至少一个候选句式模板;语句生成模块,根据所述输入语义和所述候选句式模板,生成自然语句。其中,上述装置还包括:相似度计算模块,用于在所述模板获得模块生成匹配预定义的输入模式的至少一个句式模板之后,计算每两个句式模板之间的相似度;所述模板选择模块,还用于在计算所述输入语义与句式模板之间的匹配度的过程中,根据当前计算匹配度的句式模板与其他句式模板之间的相似度,确定下一个计算所述匹配度的句式模块。其中,上述装置中,所述相似度计算模块,具体用于:根据以下公式,计算每两个句式模板之间的相似度Sim(p1,p2):其中:w表示子语义对应的词;p1、p2分别表示每两个句式模板中的第一句式模板和第二句式模板;s表示句式模板中的一个填充位置;T(p,s)表示语料库中能够填充在句式模板p的填充位置s中的词的集合;Num(T())表示集合T()中词的数量;n表示T(p,s)中词的数量;θw表示词w的预设权重系数,x表示T(p,s)中的词,cos(w,x)表示词w与x的余弦相似度;T(p1,s)∩T(p2,s)表示两个集合的交集,T(p1,s)∪T(p2,s)表示两个集合的并集;表示针对句式模板中的所有填充位置s对应的Y值进行求和计算。其中,上述装置中,所述模板选择模块,具体用于:针对所述输入语义中的每个子语义,分别根据该子语义在句式模板中的填充位置,确定所述语料库中能够填充在该填充位置的词的第一集合;以及,根据该子语义与第一集合中的各个词之间的余弦相似度,计算得到该子语义与句式模板中对应填充位置的匹配因子,其中,所述匹配因子与所述余弦相似度正相关;根据每个子语义与句式模板中对应填充位置的匹配因子,计算所述输入语义与句式模板之间的匹配度。其中,上述装置中,所述语句生成模块,具体用于将所述输入语义和/或替换语义中的词,填充至所述候选句式模板中的对应位置,得到自然语句,其中,所述替换语义与所述输入语义的语义近似度高于预设阈值;以及,计算所述候选自然语句中的各个填充位置的子语义组成的填充语义,与对应的候选句式模板之间的匹配度,并根据所述匹配度,筛选出匹配度达到预定门限的自然语句。本专利技术实施例还提供了一种人数统计的电子设备,包括:处理器;和存储器,所述存储器中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器执行以下步骤:根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间的匹配度,选择出所述匹配度满足预定条件的至少一个候选句式模板;根据所述输入语义和所述候选句式模板,生成自然语句。与现有技术相比,本专利技术实施例提供的自然语言的生成方法、自然语言生成装置及电子设备,至少具有以下有益效果:本专利技术实施例直接从语料库中提取句式模板,保证了后续生成的自然语句的句式正确性,而且,句式模板的提取,只需要删除输入模式中预先定义的语句中的组成成分,避免了过多的人工工作。另外,本专利技术实施例基于输入语义与句式模板之间的匹配度,选择候选句式模板,提高了所生成自然语句的正确性,并且,本专利技术实施例还通过匹配度对生成的自然语句进行过滤,可以兼顾所获得的自然语句的正确性与多样性。附图说明图1为本专利技术实施例一提供的自然语言的生成方法的流程示意图;图2为本专利技术实施例二提供的自然语言的生成方法的流程示意图;图3本文档来自技高网...
一种自然语言的生成方法、自然语言生成装置及电子设备

【技术保护点】
一种自然语言的生成方法,其特征在于,包括:根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间的匹配度,选择出所述匹配度满足预定条件的至少一个候选句式模板;根据所述输入语义和所述候选句式模板,生成自然语句。

【技术特征摘要】
1.一种自然语言的生成方法,其特征在于,包括:根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间的匹配度,选择出所述匹配度满足预定条件的至少一个候选句式模板;根据所述输入语义和所述候选句式模板,生成自然语句。2.如权利要求1所述的方法,其特征在于,在生成匹配预定义的输入模式的至少一个句式模板的步骤之后,所述方法还包括:计算每两个句式模板之间的相似度;在计算所述输入语义与句式模板之间的匹配度的过程中,根据当前计算匹配度的句式模板与其他句式模板之间的相似度,确定下一个计算所述匹配度的句式模块。3.如权利要求2所述的方法,其特征在于,所述计算每两个句式模板之间的相似度的步骤,包括:根据以下公式,计算每两个句式模板之间的相似度Sim(p1,p2):其中:w表示子语义对应的词;p1、p2分别表示每两个句式模板中的第一句式模板和第二句式模板;s表示句式模板中的一个填充位置;T(p,s)表示语料库中能够填充在句式模板p的填充位置s中的词的集合;Num(T())表示集合T()中词的数量;n表示T(p,s)中词的数量;θw表示词w的预设权重系数,x表示T(p,s)中的词,cos(w,x)表示词w与x的余弦相似度;T(p1,s)∩T(p2,s)表示两个集合的交集,T(p1,s)∪T(p2,s)表示两个集合的并集;表示针对句式模板中的所有填充位置s对应的Y值进行求和计算。4.如权利要求1至3任一项所述的方法,其特征在于,所述计算所述输入语义与句式模板之间的匹配度的步骤,包括:针对所述输入语义中的每个子语义,分别根据该子语义在句式模板中的填充位置,确定所述语料库中能够填充在该填充位置的词的第一集合;以及,根据该子语义与第一集合中的各个词之间的余弦相似度,计算得到该子语义与句式模板中对应填充位置的匹配因子,其中,所述匹配因子与所述余弦相似度正相关;根据每个子语义与句式模板中对应填充位置的匹配因子,计算所述输入语义与句式模板之间的匹配度。5.如权利要求1所述的方法,其特征在于,所述根据所述输入语义和所述候选句式模板,生成自然语句的步骤,包括:将所述输入语义和/或替换语义中的词,填充至所述候选句式模板中的对应位置,得到候选自然语句,其中,所述替换语义与所述输入语义的语义近似度高于预设阈值;计算所述候选自然语句中的各个填充位置的子语义组成的填充语义,与对应的候选句式模板之间的匹配度,并根据所述匹配度,筛选出匹配度达到预定门限的自然语句。6.一种自然语言生成装置,其特征在于,包括:模板获得模块,用于根据语料库中的语句,生成匹配预定义的输入模式的至少一个句式模板;模板选择模块,用于获得基于所述输入模式的输入语义,计算所述输入语义与句式模板之间...

【专利技术属性】
技术研发人员:丁磊郑继川董滨姜珊珊童毅轩
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1