基于大数据的信息获取方法、装置、设备及存储介质制造方法及图纸

技术编号:26650651 阅读:31 留言:0更新日期:2020-12-09 00:49
本发明专利技术涉及数据处理技术,揭露了一种基于大数据的信息获取方法,包括:获取目标人员的行为轨迹数据集,提取其中包含的多个历史问答数据特征;计算多个历史问答数据特征的特征权重,确定特征权重大于阈值的历史问答数据特征为目标人员的目标问答特征;获取问答数据集并进行分类,得到分类问答集;将分类问答集中与目标问答特征的问答类别对应的问答数据汇集为匹配数据集;将匹配数据集序列化为问答列表;获取在线问题,在问答列表中查询并获取与在线问题匹配的问答数据。本发明专利技术还提出一种基于大数据的信息获取系统、装置及介质。此外,本发明专利技术还涉及区块链技术,行为轨迹数据集可存储于区块链节点中。本发明专利技术可以提高在线问答的精确度与效率。

【技术实现步骤摘要】
基于大数据的信息获取方法、装置、设备及存储介质
本专利技术涉及大数据
,尤其涉及一种基于大数据的信息获取方法、装置、电子设备及计算机可读存储介质。
技术介绍
客服在线问答对前线员工开展业务时发挥着重大的作用,员工开展业务时会涉及到很多专业知识和公司相关制度解答,快速并专业的回答客户的问题对开展业务是否成功起着巨大的作用。传统的客服在线问答方法大多是将预先设定的问答预料存储在数据库中,当收到用户的问题时,基于用户问题在数据库中进行查询匹配,寻找与用户问题相应的问答结果。该方法中,当存在大量用户问答结果时,查询时间较长,从而导致根据用户问题在数据库中进行查询匹配的效率低下,无法及时获取用户问题对应的问答结果;同时由于数据库存储的问答结果较多,容易出现匹配到多个非用户问题对应的问答结果的情况,从而导问答结果的精度不高。因此,如何提高在线问答的精确度与效率,成为了亟待解决的问题。
技术实现思路
本专利技术提供一种基于大数据的信息获取方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高在线问答的精确度与效率。...

【技术保护点】
1.一种基于大数据的信息获取方法,其特征在于,所述方法包括:/n获取目标人员的行为轨迹数据集,提取所述行为轨迹数据集包含的多个历史问答数据特征;/n计算所述多个历史问答数据特征的特征权重,确定所述特征权重大于预设阈值的所述历史问答数据特征为所述目标人员的目标问答特征;/n获取问答数据集,利用预设聚类算法将所述问答数据集按照问答类别进行分类,得到分类问答集;/n将所述分类问答集中与所述目标问答特征的问答类别对应的问答数据汇集为匹配数据集;/n将所述匹配数据集序列化为问答列表;/n获取待处理的在线问题,在所述问答列表中查询并获取与所述在线问题匹配的问答数据。/n

【技术特征摘要】
1.一种基于大数据的信息获取方法,其特征在于,所述方法包括:
获取目标人员的行为轨迹数据集,提取所述行为轨迹数据集包含的多个历史问答数据特征;
计算所述多个历史问答数据特征的特征权重,确定所述特征权重大于预设阈值的所述历史问答数据特征为所述目标人员的目标问答特征;
获取问答数据集,利用预设聚类算法将所述问答数据集按照问答类别进行分类,得到分类问答集;
将所述分类问答集中与所述目标问答特征的问答类别对应的问答数据汇集为匹配数据集;
将所述匹配数据集序列化为问答列表;
获取待处理的在线问题,在所述问答列表中查询并获取与所述在线问题匹配的问答数据。


2.如权利要求1所述的基于大数据的信息获取方法,其特征在于,所述利用预设聚类算法将所述问答数据集按照问答类别进行分类,包括:
从所述问答数据集中随机选取问答数据作为目标问答数据;
计算所述目标问答数据与多个预设标准类别之间的差异值;
确定与所述目标问答数据的差异值最小的预设标准类别为所述目标问答数据的问答类别。


3.如权利要求2所述的基于大数据的信息获取方法,其特征在于,所述计算所述目标问答数据的问答类别与多个预设标准类别的差异值,包括:
利用如下差异算法计算所述目标问答数据的问答类别与预设标准类别的差异值d(x,y)2:
d(x,y)2=‖x-yi‖2
其中,x为目标问答数据的问答类别,yi为多个预设标准类别中的第i个标准类别。


4.如权利要求1所述的基于大数据的信息获取方法,其特征在于,所述将所述匹配数据集序列化为问答列表,包括:
获取多个序列化处理函数;
将所述多个序列化处理函数线性组合为构造函数;
利用所述构造函数构造序列化接口;
利用所述序列化接口对所述匹配数据集进行序列化处理,得到问答列表。


5.如权利要求1至4中任一项所述的基于大数据的信息获取方法,其特征在于,所述获取在线问题包括:
当检测到语音在线问题的语音输入信息时,持续检测所述语音输入信息的语音强度;
当所述语音强度小于分贝阈值时,确定所述语音强度小于分贝阈值时的语音输入信息为所述语音在线问题的语音终止输入信息;
利用语音识别模型将所述语音终止输入信息之前的语音输入信息转换为在线问题。


6.如权利要求1至4中任一项所述的基于大数据的信息获取方法,其特征在于,所述在所述问答列表中查询并获取与所述在线问题匹配的...

【专利技术属性】
技术研发人员:朱志强
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1