确定话题点转移以及获取回复文本的方法、装置制造方法及图纸

技术编号:18426247 阅读:16 留言:0更新日期:2018-07-12 01:58
本发明专利技术提供一种确定话题点转移的方法,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。另外,本发明专利技术还提供一种获取回复文本的方法,所述方法包括:获取文本数据;确定所述文本数据的转移话题点;将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本。通过本发明专利技术所提供的技术方案,能够获取更加丰富、准确的转移话题点,并且能够提升文本回复的回复效果。

Method and device for determining topic point transfer and obtaining reply text

The present invention provides a method for determining the transfer of topic points. The method includes: analyzing text topic points for text data, using the topic points obtained from the analysis to query the topic point transfer model in advance, and determining the transfer topic of the text data. In addition, the invention also provides a method for obtaining a reply text, which includes: obtaining text data, determining the transfer topic point of the text data, input the text data and the transfer topic point into a pre trained dialogue generation model, and obtain the number of text for the output of the dialogue generation model. According to the reply text. Through the technical proposal provided by the invention, a more abundant and accurate transfer point of view can be obtained, and the reply effect of text recovery can be enhanced.

【技术实现步骤摘要】
确定话题点转移以及获取回复文本的方法、装置
本专利技术涉及自然语言处理,尤其涉及一种确定话题点转移以及获取回复文本的方法、装置。
技术介绍
自然语言处理技术中涉及到一种新型的解析技术,即话题点转移。举个例子,当用户表达“我们去看电影吧”,现有技术中通常仅能够对该用户表达解析出其话题点为“看电影”,但实际上用户在表达“我们去看电影吧”时,已经出现了话题转移,其潜在话题点从“看电影”可能转移至“什么电影”、“约什么时间看电影”、“在哪看”等等。确定话题点转移能够更有效地理解用户的潜在意图,并广泛应用于搜索引擎、人机对话、自动问答等多种场景。但目前虽然存在多种文本话题点的解析方法,但往往仅限于文本本身的话题点分析,并不能有效地确定文本的话题点转移。因此,亟需提供一种能够准确确定话题点转移的方法。
技术实现思路
有鉴于此,本专利技术提供了一种确定话题点转移以及获取回复文本的方法、装置,用于实现更丰富准确地获取转移话题点,以及提升文本回复效果。本专利技术为解决技术问题所提供的技术方案是提供一种确定话题点转移的方法,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。根据本专利技术一优选实施例,所述针对文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。根据本专利技术一优选实施例,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。根据本专利技术一优选实施例,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出的语法结构内容进行组合,得到所述文本数据的话题点。根据本专利技术一优选实施例,所述话题点转移模型是采用如下方式预先建立的:获取对话文本对以及各对话文本的话题点;将各对话文本对中一个对话文本的话题点作为文本话题点,另一个对话文本的话题点作为所述文本话题点的转移话题点;利用所获取的各文本话题点以及与各文本话题点对应的转移话题点,建立所述话题点转移模型。根据本专利技术一优选实施例,所述话题点转移模型是采用如下方式预先建立的:获取训练数据,所述训练数据包括各话题点以及与各话题点对应的转移话题点;将各话题点作为输入,将与各话题点对应的转移话题点作为输出,训练神经网络模型,得到所述话题点转移模型。本专利技术为解决技术问题所采用的技术方案是提供一种确定话题点转移的装置,所述装置包括:分析单元,用于针对文本数据分析文本话题点;转移单元,用于利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。根据本专利技术一优选实施例,所述分析单元在针对文本数据分析文本话题点时,具体执行:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。根据本专利技术一优选实施例,所述装置还包括第一训练单元,用于采用如下方式预先建立话题点转移模型:获取对话文本对以及各对话文本的话题点;将各对话文本对中一个对话文本的话题点作为文本话题点,另一个对话文本的话题点作为所述文本话题点的转移话题点;利用所获取的各文本话题点以及与各文本话题点对应的转移话题点,建立所述话题点转移模型。根据本专利技术一优选实施例,所述装置还包括第一训练单元,用于采用如下方式预先建立话题点转移模型:获取训练数据,所述训练数据包括各话题点以及与各话题点对应的转移话题点;将各话题点作为输入,将与各话题点对应的转移话题点作为输出,训练神经网络模型,得到所述话题点转移模型。本专利技术为解决技术问题所采用的技术方案是提供一种获取回复文本的方法,所述方法包括:获取文本数据;确定所述文本数据的转移话题点;将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本。根据本专利技术一优选实施例,所述确定所述文本数据的转移话题点包括:针对所述文本数据分析文本话题点;利用所述文本话题点查询话题点转移模型,确定所述文本数据的转移话题点。根据本专利技术一优选实施例,所述针对所述文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。根据本专利技术一优选实施例,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。根据本专利技术一优选实施例,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出的语法结构内容进行组合,得到所述文本数据的话题点。根据本专利技术一优选实施例,所述对话生成模型是采用如下方式预先训练得到:获取训练数据,所述训练数据包括对话文本对以及各对话文本对中任一对话文本的话题点;将对话文本对中已知话题点的对话文本以及话题点作为输入,将另一对话文本作为输出,训练神经网络模型,得到所述对话生成模型。本专利技术为解决技术问题所采用的技术方案是提供一种获取回复文本的装置,所述装置包括:获取单元,用于获取文本数据;确定单元,用于确定所述文本数据的转移话题点;生成单元,用于将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本。根据本专利技术一优选实施例,所述确定单元在确定所述文本数据的转移话题点时,具体执行:针对所述文本数据分析文本话题点;利用所述文本话题点查询话题点转移模型,确定所述文本数据的转移话题点。根据本专利技术一优选实施例,所述装置还包括第二训练单元,用于采用如下方式预先训练得到对话生成模型:获取训练数据,所述训练数据包括对话文本对以及各对话文本对中任一对话文本的话题点;将对话文本对中已知话题点的对话文本以及话题点作为输入,将另一对话文本作为输出,训练神经网络模型,得到所述对话生成模型。由以上技术方案可以看出,本专利技术通过话题点转移模型获取转移话题点,使得转移话题点能够更加准确地刻画原文本数据的核心语义,并反映原文本数据中话题点的转移情况;另外,本专利技术通过转移话题点以及对话生成模型获取回复文本,使得所生成的回复文本具有合理、通顺、不转义的特点,从而提升对话系统中回复文本的回复效果。【附图说明】图1为本专利技术一实施例提供的确定话题点转移的方法流程图;图2为本专利技术一实施例提供的文本数据的语法结构的示意图;图3为本专利技术一实施例提供的获取回复文本的方法流程图;图4为本专利技术一实施例提供的确定话题点转移的装置结构图;图5为本专利技术一实施例提供的获取回复文本的装置结构图;图6为本专利技术一实施例提供的计算机系统/服务器的框图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结本文档来自技高网...

【技术保护点】
1.一种确定话题点转移的方法,其特征在于,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。

【技术特征摘要】
1.一种确定话题点转移的方法,其特征在于,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。2.根据权利要求1所述的方法,其特征在于,所述针对文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。3.根据权利要求2所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。4.根据权利要求2所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出的语法结构内容进行组合,得到所述文本数据的话题点。5.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:获取对话文本对以及各对话文本的话题点;将各对话文本对中一个对话文本的话题点作为文本话题点,另一个对话文本的话题点作为所述文本话题点的转移话题点;利用所获取的各文本话题点以及与各文本话题点对应的转移话题点,建立所述话题点转移模型。6.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:获取训练数据,所述训练数据包括各话题点以及与各话题点对应的转移话题点;将各话题点作为输入,将与各话题点对应的转移话题点作为输出,训练神经网络模型,得到所述话题点转移模型。7.一种获取回复文本的方法,其特征在于,所述方法包括:获取文本数据;确定所述文本数据的转移话题点;将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本。8.根据权利要求7所述的方法,其特征在于,所述确定所述文本数据的转移话题点包括:针对所述文本数据分析文本话题点;利用所述文本话题点查询话题点转移模型,确定所述文本数据的转移话题点。9.根据权利要求8所述的方法,其特征在于,所述针对所述文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。10.根据权利要求9所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。11.根据权利要求9所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出...

【专利技术属性】
技术研发人员:郭振吴文权刘占一
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1