一种基于在线聊天记录的表单生成方法和系统技术方案

技术编号:21200225 阅读:23 留言:0更新日期:2019-05-25 01:21
本申请提供一种基于聊天记录的表单生成方法和系统,所述方法包括:获取客户与客服之间的聊天记录;对所述聊天记录进行向量化;利用表单映射模型,将各向量化结果映射至表单项;根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。可以自动生成基于聊天记录的表单,省时、省力、有效地提高表单的生成效率;提高表单准确性。

A Form Generation Method and System Based on Online Chat Record

The application provides a form generation method and system based on chat record, which includes: acquiring chat record between customer and customer service; vectorizing chat record; mapping each vectorized result to form item using form mapping model; and generating a form based on chat record according to the chat record and corresponding form item. It can automatically generate forms based on chat records, save time, effort and effectively improve the efficiency of form generation and improve the accuracy of forms.

【技术实现步骤摘要】
一种基于在线聊天记录的表单生成方法和系统
本申请涉及通讯系统领域,尤其涉及一种基于在线聊天记录的表单生成方法和系统。
技术介绍
目前,客服人员在提供人工服务时,与客户进行语音或文字聊天,了解客户咨询的问题,为客户提供解决方案。在聊天结束后,基于上述问题创建表单。但是,传统的在线聊天系统形式的客服平台只保存聊天记录,这样做的缺点是:1.聊天记录中存在大量和客户咨询问题无关的内容,这些内容对分析客户问题毫无作用,会占用大量存储空间和质检人力;2.聊天结束后,客服需要手动创建表单来记录客户的问题和解决方案,费时、费力、生成效率较低;并且,客服填写的问题和解决方案可能与聊天记录冲突,表单准确性不好把控。
技术实现思路
本申请的多个方面提供一种基于在线聊天记录的表单生成方法和系统,用以提高表单生成的效率和准确性。本申请的一方面,提供一种基于在线聊天记录的表单生成方法,包括:获取客户与客服之间的聊天记录;对所述聊天记录进行向量化;利用表单映射模型,将各向量化结果映射至表单项;根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取客户与客服之间的聊天记录包括:对语音聊天记录中进行转换得到聊天文本信息;或,从文字聊天记录中抽取出聊天文本信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对所述聊天记录进行向量化包括:对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,利用表单映射模型,将各向量化结果映射至表单项包括:将各文本单位转化成的词频表示的向量输入至表单映射模型,获取表单映射模型输出的表单项。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单包括:利用聊天记录中的各文本单元对其对应的表单项进行填充,生成基于聊天记录的表单。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述表单映射模型采用以下方式预先训练得到:选取训练样本,所述训练样本包括:聊天文本信息的各文本单元、对应的表单项;将各文本单元的向量化结果作为原始深层神经网络的输入,对应的表单项作为所述原始深层神经网络的输出,训练所述原始深层神经网络,得到所述表单映射模型。根据本专利技术的另一方面,提供一种基于聊天记录的表单生成系统,包括:获取模块,用于获取客户与客服之间的聊天记录;向量化模块,用于对所述聊天记录进行向量化;表单映射模块,用于利用表单映射模型,将各向量化结果映射至表单项;表单生成模块,用于根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取模块具体用于:对语音聊天记录中进行转换得到聊天文本信息;或,从文字聊天记录中抽取出聊天文本信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述向量化模块具体用于:对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述表单映射模块具体用于:将各文本单位转化成的词频表示的向量输入至表单映射模型,获取表单映射模型输出的表单项。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述表单生成模块,具体用于:利用聊天记录中的各文本单元对其对应的表单项进行填充,生成基于聊天记录的表单。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述系统还包括表单映射模型训练模块,用于,聊天文本信息的各文本单元、对应的表单项;将各文本单元的向量化结果作为原始深层神经网络的输入,对应的表单项作为所述原始深层神经网络的输出,训练所述原始深层神经网络,得到所述表单映射模型。本专利技术的另一方面,提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。本专利技术的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。由所述技术方案可知,本申请实施例,提高了表单生成的效率和准确性。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的基于聊天记录的表单生成方法的流程示意图;图2为本申请一实施例提供的基于聊天记录的表单生成系统的结构示意图;图3示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器012的框图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的基于聊天记录的表单生成方法的流程示意图,如图1所示,包括以下步骤:步骤S11、获取客户与客服之间的在线聊天记录;步骤S12、对所述在线聊天记录进行向量化;步骤S13、利用表单映射模型,将各向量化结果映射至表单项;步骤S14、根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。在本实施例的一种实现方式中,对客户与客服的聊天记录进行统一处理。在步骤S11的一种优选实现方式中,若所述在线聊天记录为客户与客服之间的语音聊天记录,本实施例的基于在线聊天记录的表单生成装置接收每一客户与客服之间的语音聊天记录,并对所述语音聊天记录进行语音识别,转换为文字聊天记录,从文字聊天记录中抽取出聊天文本信息。若所述在线聊天记录为文字聊天记录,从文字聊天记录中抽取出聊天文本信息。在步骤S12的一种优选实现方式中,对所述在线聊天记录进行向量化包括对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。所述向量化包括如下步骤:步骤S121、对聊天文本信息进行分词处理,将聊天文本信息中的各文本单位,例如句子,转化为单词列表;步骤S122、根据所述单词列表进行词频统计,将聊天文本信息中的各文本单位,例如句子,转化成词频表示的向量,即每个句子的词向量组合作为这个句子的特征参数。其中,所述预先设置的词典包括:停用词词典、专有名词词典、分词生成的词典。在分词后的直接结果中,有大量的无效项,例如空格,逗号等等。因此,一般在分词以后,还要根据停用词词典进行预处理。例如去掉停用词(stopwords,指的是没什么意义的词,例如空格,逗号,句号,啊,呀,等等),去掉出现频率过低和过高的词等等。所述专有名词词典,可以包括覆盖客服针对的服务提供商的所有产品的提问以及解答方面的所有专有名词,聊天记录中的专有名词不会被切分。所述分词生成的词典,是根据在线客服的本文档来自技高网...

【技术保护点】
1.一种基于聊天记录的表单生成方法,如其特征在于,包括:获取客户与客服之间的聊天记录;对所述聊天记录进行向量化;利用表单映射模型,将各向量化结果映射至表单项;根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。

【技术特征摘要】
1.一种基于聊天记录的表单生成方法,如其特征在于,包括:获取客户与客服之间的聊天记录;对所述聊天记录进行向量化;利用表单映射模型,将各向量化结果映射至表单项;根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。2.根据权利要求1所述的方法,其特征在于,所述获取客户与客服之间的聊天记录包括:对语音聊天记录中进行转换得到聊天文本信息;或,从文字聊天记录中抽取出聊天文本信息。3.根据权利要求1所述的方法,其特征在于,对所述聊天记录进行向量化包括:对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。4.根据权利要求3所述的方法,其特征在于,利用表单映射模型,将各向量化结果映射至表单项包括:将各文本单位转化成的词频表示的向量输入至表单映射模型,获取表单映射模型输出的表单项。5.根据权利要求4所述的方法,其特征在于,根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单包括:利用聊天记录中的各文本单元对其对应的表单项进行填充,生成基于聊天记录的表单。6.根据权利要求1所述的方法,其特征在于,所述表单映射模型采用以下方式预先训练得到:选取训练样本,所述训练样本包括:聊天文本信息的各文本单元、对应的表单项;将各文本单元的向量化结果作为原始深层神经网络的输入,对应的表单项作为所述原始深层神经网络的输出,训练所述原始深层神经网络,得到所述表单映射模型。7.一种基于聊天记录的表单生成系统,其特征在于,包括:获取模块,用于获取客户与客服之间的聊天记录;向量化模块,用于对所述聊天记录...

【专利技术属性】
技术研发人员:刘昊骋
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1