一种智能回复方法及终端技术

技术编号:35565741 阅读:14 留言:0更新日期:2022-11-12 15:49
本发明专利技术公开一种智能回复方法及终端,使用预设外部词向量模型和预设本地词向量模型确定待回复文本对应的联合词向量编码;将联合词向量编码输入至训练后的分类模型,输出得到待回复文本对应的文本主题;基于所述待回复文本进行关键词抽取,得到第二关键词;确定与所述文本主题对应的目标主题知识图谱,并根据所述第二关键词基于所述目标主题知识图谱确定与所述待回复文本对应的回复内容,有利于提升自然语言处理相关的后续任务的处理准确度,同时处理长文本的效果更好,提高了文本主题获取的精度,另外通过知识图谱与任务型对话模型的结合能够对大段文本生成对应的有效回复,且可移植到app、客服等场景中,从而针对大段文本实现准确地智能回复。准确地智能回复。准确地智能回复。

【技术实现步骤摘要】
一种智能回复方法及终端


[0001]本专利技术涉及自然语言处理
,尤其涉及一种智能回复方法及终端。

技术介绍

[0002]智能回复一般基于问答系统生成,使用一问一答形式精确地定位用户所需 要的提问知识,通过与用户进行交互,为用户提供个性化的信息服务。但是其 运用场景受限,运用于app、客服等用户输入大段文本,或者基于大段文本生成 回复的场景中往往达不到预期的效果。现有的智能回复主要分为两类,一类是 基于深度学习的端到端模型,根据历史语料进行训练实现根据对话文本做出及 时反应,但是由于对话生硬,导致人机交互体验不佳,无法实现开发性对话; 另一类是基于自然语言模型,根据LSTM(Long short

term memory,长短期记 忆)或者BERT模型(Bidirectional Encoder Representation from Transformers,预 训练的语言表征模型)按照上下文语境实现人机对话,相比端对端模型,自然 语言模型能够实现人机互动,但还是无法基于大段文本生成智能回复。

技术实现思路

[0003]本专利技术所要解决的技术问题是:提供一种智能回复方法及终端,能够针对 大段文本实现准确地智能回复。
[0004]为了解决上述技术问题,本专利技术采用的一种技术方案为:
[0005]一种智能回复方法,包括步骤:
[0006]获取待回复文本,并使用预设外部词向量模型和预设本地词向量模型确定 所述待回复文本对应的联合词向量编码;
[0007]将所述联合词向量编码输入至训练后的分类模型,输出得到所述待回复文 本对应的文本主题;
[0008]基于所述待回复文本进行关键词抽取,得到第二关键词;
[0009]确定与所述文本主题对应的目标主题知识图谱,并根据所述第二关键词基 于所述目标主题知识图谱确定与所述待回复文本对应的回复内容。
[0010]为了解决上述技术问题,本专利技术采用的另一种技术方案为:
[0011]一种智能回复终端,包括存储器、处理器及存储在存储器上并可在所述处 理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0012]获取待回复文本,并使用预设外部词向量模型和预设本地词向量模型确定 所述待回复文本对应的联合词向量编码;
[0013]将所述联合词向量编码输入至训练后的分类模型,输出得到所述待回复文 本对应的文本主题;
[0014]基于所述待回复文本进行关键词抽取,得到第二关键词;
[0015]确定与所述文本主题对应的目标主题知识图谱,并根据所述第二关键词基 于所述目标主题知识图谱确定与所述待回复文本对应的回复内容。
[0016]本专利技术的有益效果在于:通过使用预设外部词向量模型和预设本地词向量 模型确定获取的待回复文本对应的联合词向量编码,有利于提升自然语言处理 相关的后续任务的处理准确度,同时使用训练后的分类模型获取待回复文本对 应的文本主题,相较于BERT模型,处理长文本的效果更好,提高了文本主题 获取的精度,另外根据第二关键词基于目标主题知识图谱确定对应的回复内容, 通过知识图谱与任务型对话模型的结合能够对大段文本生成对应的有效回复, 且可移植到app、客服等场景中,从而针对大段文本实现准确地智能回复。
附图说明
[0017]图1为本专利技术实施例的一种智能回复方法的步骤流程图;
[0018]图2为本专利技术实施例的一种智能回复终端的结构示意图;
[0019]图3为本专利技术实施例智能回复方法中的智能回复流程图。
具体实施方式
[0020]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并 配合附图予以说明。
[0021]请参照图1,本专利技术实施例提供了一种智能回复方法,包括步骤:
[0022]获取待回复文本,并使用预设外部词向量模型和预设本地词向量模型确定 所述待回复文本对应的联合词向量编码;
[0023]将所述联合词向量编码输入至训练后的分类模型,输出得到所述待回复文 本对应的文本主题;
[0024]基于所述待回复文本进行关键词抽取,得到第二关键词;
[0025]确定与所述文本主题对应的目标主题知识图谱,并根据所述第二关键词基 于所述目标主题知识图谱确定与所述待回复文本对应的回复内容。
[0026]从上述描述可知,本专利技术的有益效果在于:通过使用预设外部词向量模型 和预设本地词向量模型确定获取的待回复文本对应的联合词向量编码,有利于 提升自然语言处理相关的后续任务的处理准确度,同时使用训练后的分类模型 获取待回复文本对应的文本主题,相较于BERT模型,处理长文本的效果更好, 提高了文本主题获取的精度,另外根据第二关键词基于目标主题知识图谱确定 对应的回复内容,通过知识图谱与任务型对话模型的结合能够对大段文本生成 对应的有效回复,且可移植到app、客服等场景中,从而针对大段文本实现准确 地智能回复。
[0027]进一步地,所述获取待回复文本之前包括步骤:
[0028]从互联网采集各类评论数据,并按照主题对所述各类评论数据进行分类, 得到分类后的评论数据;
[0029]根据所述分类后的评论数据生成对应的第一文本摘要;
[0030]根据所述第一文本摘要进行关键词抽取,得到第一关键词;
[0031]将所述第一关键词构建为实体,并将所述分类后的评论数据构建为所述实 体之间的关系;
[0032]根据所述实体和所述关系构建主题知识图谱,并使用Arangodb图数据库存 储所
述主题知识图谱。
[0033]由上述描述可知,根据采集的不同类型的评论数据构建不同主题的主题知 识图谱,便于后续从主题知识图谱中准确地查询对应的回复内容,且使用 Arangodb图数据库存储主题知识图谱,异于传统neo4j图数据库,Arangodb图 数据库能够在一个查询中组合不同的数据模型,使得其展示方式更直观和美观, 且具有更灵活的扩展性、更高的容错性、大容量的存储能力和更低的成本。
[0034]进一步地,所述获取待回复文本之前还包括步骤:
[0035]使用向量转换工具基于所述各类评论数据进行训练,得到预设本地词向量 模型。
[0036]由上述描述可知,完全采用现有的词向量模型不一定适用于当前语料,可 能存在一些单词没有对应的词向量,还有可能会引入噪声,导致后续任务的效 果大打折扣,因此,使用向量转换工具基于所述各类评论数据进行训练,得到 预设本地词向量模型,后续可与预设外部词向量模型实现可靠地联合词向量表 示。
[0037]进一步地,所述使用预设外部词向量模型和预设本地词向量模型确定所述 待回复文本对应的联合词向量编码包括:
[0038]将所述待回复文本输入至预设外部词向量模型,输出得到外部词向量表示;
[0039]将所述待回复文本输入至预设本地词向量模型,输出得到本地词向量表示;
[0040]获取所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能回复方法,其特征在于,包括步骤:获取待回复文本,并使用预设外部词向量模型和预设本地词向量模型确定所述待回复文本对应的联合词向量编码;将所述联合词向量编码输入至训练后的分类模型,输出得到所述待回复文本对应的文本主题;基于所述待回复文本进行关键词抽取,得到第二关键词;确定与所述文本主题对应的目标主题知识图谱,并根据所述第二关键词基于所述目标主题知识图谱确定与所述待回复文本对应的回复内容。2.根据权利要求1所述的一种智能回复方法,其特征在于,所述获取待回复文本之前包括步骤:从互联网采集各类评论数据,并按照主题对所述各类评论数据进行分类,得到分类后的评论数据;根据所述分类后的评论数据生成对应的第一文本摘要;根据所述第一文本摘要进行关键词抽取,得到第一关键词;将所述第一关键词构建为实体,并将所述分类后的评论数据构建为所述实体之间的关系;根据所述实体和所述关系构建主题知识图谱,并使用Arangodb图数据库存储所述主题知识图谱。3.根据权利要求2所述的一种智能回复方法,其特征在于,所述获取待回复文本之前还包括步骤:使用向量转换工具基于所述各类评论数据进行训练,得到预设本地词向量模型。4.根据权利要求1所述的一种智能回复方法,其特征在于,所述使用预设外部词向量模型和预设本地词向量模型确定所述待回复文本对应的联合词向量编码包括:将所述待回复文本输入至预设外部词向量模型,输出得到外部词向量表示;将所述待回复文本输入至预设本地词向量模型,输出得到本地词向量表示;获取所述预设外部词向量模型对应的第一权重以及所述预设本地词向量模型对应的第二权重;根据所述第一权重和所述第二权重对所述外部词向量表示与所述本地词向量表示进行加权平均,得到所述待回复文本对应的联合词向量编码。5.根据权利要求2所述的一种智能回复方法,其特征在于,所述获取待回复文本之前还包括步骤...

【专利技术属性】
技术研发人员:林志扬徐晓文薛健武
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1