The present invention provides a method for determining the transfer of topic points. The method includes: analyzing text topic points for text data, using the topic points obtained from the analysis to query the topic point transfer model in advance, and determining the transfer topic of the text data. In addition, the invention also provides a method for obtaining a reply text, which includes: obtaining text data, determining the transfer topic point of the text data, input the text data and the transfer topic point into a pre trained dialogue generation model, and obtain the number of text for the output of the dialogue generation model. According to the reply text. Through the technical proposal provided by the invention, a more abundant and accurate transfer point of view can be obtained, and the reply effect of text recovery can be enhanced.
【技术实现步骤摘要】
确定话题点转移以及获取回复文本的方法、装置
本专利技术涉及自然语言处理,尤其涉及一种确定话题点转移以及获取回复文本的方法、装置。
技术介绍
自然语言处理技术中涉及到一种新型的解析技术,即话题点转移。举个例子,当用户表达“我们去看电影吧”,现有技术中通常仅能够对该用户表达解析出其话题点为“看电影”,但实际上用户在表达“我们去看电影吧”时,已经出现了话题转移,其潜在话题点从“看电影”可能转移至“什么电影”、“约什么时间看电影”、“在哪看”等等。确定话题点转移能够更有效地理解用户的潜在意图,并广泛应用于搜索引擎、人机对话、自动问答等多种场景。但目前虽然存在多种文本话题点的解析方法,但往往仅限于文本本身的话题点分析,并不能有效地确定文本的话题点转移。因此,亟需提供一种能够准确确定话题点转移的方法。
技术实现思路
有鉴于此,本专利技术提供了一种确定话题点转移以及获取回复文本的方法、装置,用于实现更丰富准确地获取转移话题点,以及提升文本回复效果。本专利技术为解决技术问题所提供的技术方案是提供一种确定话题点转移的方法,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。根据本专利技术一优选实施例,所述针对文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。根据本专利技术一优选实施例,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确 ...
【技术保护点】
1.一种确定话题点转移的方法,其特征在于,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。
【技术特征摘要】
1.一种确定话题点转移的方法,其特征在于,所述方法包括:针对文本数据分析文本话题点;利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点。2.根据权利要求1所述的方法,其特征在于,所述针对文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。3.根据权利要求2所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。4.根据权利要求2所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出的语法结构内容进行组合,得到所述文本数据的话题点。5.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:获取对话文本对以及各对话文本的话题点;将各对话文本对中一个对话文本的话题点作为文本话题点,另一个对话文本的话题点作为所述文本话题点的转移话题点;利用所获取的各文本话题点以及与各文本话题点对应的转移话题点,建立所述话题点转移模型。6.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:获取训练数据,所述训练数据包括各话题点以及与各话题点对应的转移话题点;将各话题点作为输入,将与各话题点对应的转移话题点作为输出,训练神经网络模型,得到所述话题点转移模型。7.一种获取回复文本的方法,其特征在于,所述方法包括:获取文本数据;确定所述文本数据的转移话题点;将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本。8.根据权利要求7所述的方法,其特征在于,所述确定所述文本数据的转移话题点包括:针对所述文本数据分析文本话题点;利用所述文本话题点查询话题点转移模型,确定所述文本数据的转移话题点。9.根据权利要求8所述的方法,其特征在于,所述针对所述文本数据分析文本话题点包括:从所述文本数据中提取重要词;对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点。10.根据权利要求9所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。11.根据权利要求9所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:获取所述文本数据的语法树;根据所获取的语法树,确定与所述重要词相关的语法结构内容;将确定出...
【专利技术属性】
技术研发人员:郭振,吴文权,刘占一,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。