一种智能会话方法、装置、计算机设备及介质制造方法及图纸

技术编号:31378060 阅读:22 留言:0更新日期:2021-12-15 11:18
本发明专利技术涉及人工智能领域,公开了一种智能会话方法、装置、计算机设备及介质,方法包括:接收来自客户端的描述信息,并基于描述信息生成待识别的目标文本;将目标文本输入预先训练的专题抽取模型中,输出描述信息的专题结果;专题抽取模型基于多个专题结果训练生成,每个专题结果基于多条文本数据中的最长公共字符串生成;查询与描述信息的专题结果所关联的问题集合,并将问题集合发送到所述客户端,以使客户端在显示界面进行展示;当接收到客户端返回的针对问题集合的选择指令时,基于选择指令确定出目标问题;查询目标问题的答案,并将答案发送到所述客户端,以使客户端展示至所述显示界面。本申可提升智能客服的可信度,并提升用户的体验度。用户的体验度。用户的体验度。

【技术实现步骤摘要】
一种智能会话方法、装置、计算机设备及介质


[0001]本专利技术涉及人工智能
,特别涉及一种智能会话方法、装置、计算机设备及介质。

技术介绍

[0002]近年来,智能客服或机器人客服发展的如火如荼,其中自然语言理解是智能客服或机器人客服最重要的一部分,让机器识别自然语言已经成为研究人员研究的热点。随着深度学习以及强化学习等技术的发展,研究人员越发渴望让机器能精确的识别自然语言。
[0003]现有技术中,智能客服或机器人客服主要基于关键词的匹配进行检索用户的问题,检索请求由用户以关键词的形式发出,而后匹配数据库中保存的问题,以关键词共现为命中条件返回检索结果。由于不同语义的语句中可能包含相同的关键词,从而使得检索到的答案与用户的问题出现不匹配情况,从而降低了机器理解自然语言的准确度。

技术实现思路

[0004]基于此,有必要针对机器理解自然语言的准确度低的问题,提供一种智能会话方法、装置、计算机设备及介质。
[0005]一种智能会话方法,方法包括:接收来自客户端的描述信息,并基于所述描述信息生成待识别的目标文本;将目标文本输入预先训练的专题抽取模型中,输出描述信息的专题结果;其中,专题抽取模型基于多个专题结果训练生成,每个专题结果基于多条文本数据中的最长公共字符串生成;查询与所述描述信息的专题结果所关联的问题集合,并将所述问题集合发送到所述客户端,以使所述客户端在显示界面进行展示;当接收到客户端返回的针对所述问题集合的选择指令时,基于所述选择指令确定出目标问题;查询所述目标问题的答案,并将所述答案发送到所述客户端,以使所述客户端展示至所述显示界面。
[0006]在其中一个实施例中,基于描述信息生成待识别的目标文本,包括:确定描述信息的目标语义;基于目标语义生成符合预设规则的标准描述文本,并将标准描述文本确定为待识别的目标文本。
[0007]在其中一个实施例中,描述信息包括文字信息或语音信息;确定描述信息的目标语义,包括:当描述信息为文字信息时,获取文字信息中每个文字的笔画图像后得到笔画图像集合;计算笔画图像集合中每个笔画图像的矩阵参数;根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量;基于每个笔画图像的语义向量确定出文字信息的目标语义;或者,当描述信息为语音信息时,将语音信息划分为多个音频数据段;逐一计算多个音频数据段中每个音频数据段对应的语义向量;基于每个音频数据段对应的语义向量确定出语音信息的目标语义。
[0008]在其中一个实施例中,按照以下步骤生成预先训练的专题抽取模型,包括:基于前缀树算法创建模型训练样本;采用卷积神经网络构建专题抽取模型;将模型训练样本数据输入专题抽取模型中进行训练,输出损失值;当损失值小于预设阈值时,生成专题抽取模
型。
[0009]在其中一个实施例中,基于前缀树算法创建模型训练样本,包括:采集历史文本样本;其中,历史文本样本中存在多条文本数据;采用前缀树算法针对多条文本数据进行建模生成目标前缀树;统计目标前缀树上子节点或组合子节点的出现频次;根据子节点或组合子节点的出现频次确定出最长公共字符串,并将最长公共字符串确定为专题结果;继续执行采集历史文本样本的步骤,直到专题结果的数量到达预设数量时生成专题结果集合;预处理专题结果集合后生成模型训练样本。
[0010]在其中一个实施例中,当损失值小于预设阈值时,生成专题抽取模型,包括:当损失值大于等于预设阈值时,继续执行将模型训练样本数据输入专题抽取模型中进行训练的步骤;直到损失值小于预设阈值时,停止训练。
[0011]在其中一个实施例中,查询与所述描述信息的专题结果所关联的问题集合,并将所述问题集合发送到所述客户端,以使所述客户端在显示界面进行展示,包括:采用关键字匹配算法从历史问题库中查询描述信息的专题结果所关联的问题集合;获取问题集合中各问题的优先级;基于优先级的高低顺序将各问题发送到所述客户端,以使所述客户端在显示界面进行展示;其中,获取问题集合中各问题的优先级,包括:获取问题集合中各问题指示的设置时刻;计算各问题指示的设置时刻与当前时刻的时长,得到各问题的设置时长;根据各问题的设置时长确定各问题的优先级。
[0012]一种智能会话装置,装置包括:目标文本生成模块,用于接收来自客户端的描述信息,并基于所述描述信息生成待识别的目标文本;专题结果输出模块,用于将目标文本输入预先训练的专题抽取模型中,输出描述信息的专题结果;其中,专题抽取模型基于多个专题结果训练生成,每个专题结果基于多条文本数据中的最长公共字符串生成;问题集合查询模块,用于查询与所述描述信息的专题结果所关联的问题集合,并将所述问题集合发送到所述客户端,以使所述客户端在显示界面进行展示;目标问题确定模块,用于当接收到客户端返回的针对所述问题集合的选择指令时,基于所述选择指令确定出目标问题;答案展示模块,用于查询所述目标问题的答案,并将所述答案发送到所述客户端,以使所述客户端展示至所述显示界面。
[0013]一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述智能会话方法的步骤。
[0014]一种存储有计算机可读指令的介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述智能会话方法的步骤。
[0015]上述智能会话方法、装置、设备和介质,智能会话装置首先接收来自客户端的描述信息,并基于所述描述信息生成待识别的目标文本,然后将目标文本输入预先训练的专题抽取模型中,输出描述信息的专题结果;其中,专题抽取模型基于多个专题结果训练生成,每个专题结果基于多条文本数据中的最长公共字符串生成;其次查询与所述描述信息的专题结果所关联的问题集合,并将所述问题集合发送到所述客户端,以使所述客户端在显示界面进行展示,再当接收到客户端返回的针对所述问题集合的选择指令时,基于所述选择指令确定出目标问题;最后查询所述目标问题的答案,并将所述答案发送到所述客户端,以使所述客户端展示至所述显示界面。由于本申请通过抽取出多条文本数据中公用的最长字符串作为专题结果进行模型训练,使得训练后的模型可以识别出待识别文本中的专题结
果,同时根据专题结果可以查询到多个相关联的问题集合提供给用户选择,通过用户主动的二次选择可以使得反馈给用户的答案更加符合实际要求,从而提升了智能客服的可信度,并提升了用户的体验度。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0017]图1为本申请一个实施例中提供的智能会话方法的实施环境图;
[0018]图2为本申请一个实施例中计算机设备的内部结构示意图;
[0019]图3为本申请一个实施例中提供的智能会话方法的方法示意图;
[0020]图4为本申请一个实施例中提供的将多条文本数据建模后生成前缀树的示意图;
[0021]图5是本申请实施例提供的一种智能会话装置的装置示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能会话方法,其特征在于,所述方法包括:接收来自客户端的描述信息,并基于所述描述信息生成待识别的目标文本;将所述目标文本输入预先训练的专题抽取模型中,输出所述描述信息的专题结果;其中,所述专题抽取模型基于多个专题结果训练生成,每个专题结果基于多条文本数据中的最长公共字符串生成;查询与所述描述信息的专题结果所关联的问题集合,并将所述问题集合发送到所述客户端,以使所述客户端在显示界面进行展示;当接收到客户端返回的针对所述问题集合的选择指令时,基于所述选择指令确定出目标问题;查询所述目标问题的答案,并将所述答案发送到所述客户端,以使所述客户端展示至所述显示界面。2.根据权利要求1所述的方法,其特征在于,所述基于所述描述信息生成待识别的目标文本,包括:确定所述描述信息的目标语义;基于所述目标语义生成符合预设规则的标准描述文本,并将所述标准描述文本确定为待识别的目标文本。3.根据权利要求2所述的方法,其特征在于,所述描述信息包括文字信息或语音信息;所述确定所述描述信息的目标语义,包括:当所述描述信息为文字信息时,获取所述文字信息中每个文字的笔画图像后得到笔画图像集合;计算所述笔画图像集合中每个笔画图像的矩阵参数;根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量;基于所述每个笔画图像的语义向量确定出所述文字信息的目标语义;或者,当所述描述信息为语音信息时,将所述语音信息划分为多个音频数据段;逐一计算所述多个音频数据段中每个音频数据段对应的语义向量;基于所述每个音频数据段对应的语义向量确定出所述语音信息的目标语义。4.根据权利要求1所述的方法,其特征在于,按照以下步骤生成预先训练的专题抽取模型,包括:基于前缀树算法创建模型训练样本;采用卷积神经网络构建专题抽取模型;将所述模型训练样本数据输入所述专题抽取模型中进行训练,输出损失值;当所述损失值小于预设阈值时,生成专题抽取模型。5.根据权利要求4所述的方法,其特征在于,所述基于前缀树算法创建模型训练样本,包括:采集历史文本样本;其中,所述历史文本样本中存在多条文本数据;采用前缀树算法针对所述多条文本数据进行建模生成目标前缀树;统计所述目标前缀树上子节点或组合子节点的出现频次;根据所述子节点或组合子节点的出现频次确定出最长公共字符串,并将所述最长公共
字符串确定为专题结果;继续执行所述采集...

【专利技术属性】
技术研发人员:齐秀
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1