基于问答平台的数据处理方法、装置及相关设备制造方法及图纸

技术编号:30321805 阅读:24 留言:0更新日期:2021-10-09 23:46
本申请涉及数据处理技术,提供一种基于问答平台的数据处理方法、装置、计算机设备与存储介质,包括:调用问题检测模型检测目标文本集中是否包含问题文本;当检测结果为是时,获取问题文本集;获取每一问题文本对应的目标文档内容,并将问题文本与目标文档内容的相关度超过预设相关度阈值的问题文本作为目标问题文本;聚类分析每一目标问题文本,得到若干个问题簇;计算每一问题簇的目标指标值,并组合目标指标值,得到每一问题簇对应的目标特征值;将目标特征值输入至重要程度计算模型中,得到每一问题簇对应的重要程度;输出问题簇对应的答案。本申请能够提高基于问答平台的数据处理效率与准确性,促进智慧城市的快速发展。促进智慧城市的快速发展。促进智慧城市的快速发展。

【技术实现步骤摘要】
基于问答平台的数据处理方法、装置及相关设备


[0001]本申请涉及数据处理
,尤其涉及一种基于问答平台的数据处理方法、装置、计算机设备及介质。

技术介绍

[0002]问答平台是为用户提供的一个交流平台,用户可以在问答平台接受专家的帮助,同时也尽力给其他用户提供有效的帮助。问答平台大多涉及在线互动,如举手、提问、刷屏及弹幕等操作。对于用户的提问,需尽快进行相应解答,若仅依靠专家人工应付问答平台的提问,问答处理的效率与准确率均无法保证。
[0003]在实现本申请的过程中,专利技术人发现现有技术存在如下技术问题:现有的问答平台采用任务助手的方式,采集用户输出的问题,并根据问题与答案的相关性为用户匹配相应的答案。然而,在高频高并发的问答场景中,用户数量多,每个用户输出的问题数量也多,若仅是采用相关性匹配的方法,无法满足有效时间内尽可能多的正确回答用户提问的需求,导致问答处理的效率与准确性较低。
[0004]因此,有必要提供一种基于问答平台的数据处理方法,能够提高问答处理的效率与准确性。

技术实现思路
r/>[0005]鉴本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于问答平台的数据处理方法,其特征在于,所述基于问答平台的数据处理方法包括:采集目标文本集,并调用预先训练好的问题检测模型检测所述目标文本集中是否包含问题文本;当检测结果为所述目标文本集中包含问题文本时,获取所述目标文本集中的问题文本,得到问题文本集;获取所述问题文本集中每一问题文本对应的目标文档内容,并将所述问题文本与所述目标文档内容的相关度超过预设相关度阈值的问题文本作为目标问题文本,得到目标问题文本集;聚类分析所述目标问题文本集中的每一所述目标问题文本,得到若干个问题簇;计算每一所述问题簇的目标指标值,并按照预设数据格式组合所述目标指标值,得到每一所述问题簇对应的目标特征值;将所述目标特征值输入至预先训练好的重要程度计算模型中,得到每一所述问题簇对应的重要程度;按照所述重要程度的顺序输出所述问题簇对应的答案。2.根据权利要求1所述的基于问答平台的数据处理方法,其特征在于,在所述调用预先训练好的问题检测模型检测所述目标文本集中是否包含问题文本之前,所述方法还包括:获取携带预设问题标签的文本样本集,并拆分所述文本样本集为文本训练集与文本测试集,其中,所述预设问题标签用于标记所述文本样本集中的问题文本;将所述文本训练集输入至初始神经网络模型中进行训练,得到问题检测模型;将所述文本测试集输入至所述问题检测模型中,计算模型的准确率,并在所述准确率超过预设准确率阈值时,确定所述问题检测模型训练完成。3.根据权利要求1所述的基于问答平台的数据处理方法,其特征在于,所述获取所述问题文本集中每一问题文本对应的目标文档内容包括:获取所述问题文本集中每一问题文本携带的时间戳;确定所述时间戳对应的目标时间段;根据所述目标时间段遍历预先设置的时间段与目标文档内容的映射关系,得到所述目标时间段对应的目标文档内容。4.根据权利要求1所述的基于问答平台的数据处理方法,其特征在于,所述将所述问题文本与所述目标文档内容的相关度超过预设相关度阈值的问题文本作为目标问题文本,得到目标问题文本集包括:向量化处理所述问题文本,得到问题文本向量;向量化处理所述目标文档内容,得到文档内容向量;按照预设相关度计算模型计算所述问题文本向量与所述文档内容向量的相关度;检测所述相关度是否超过预设相关度阈值;当检测结果为所述相关度超过所述预设相关度阈值时,确定所述相关度超过所述预设相关度阈值的问题文本为目标问题文本;组合所述目标问题文本,得到目标问题文本集。5.根据权利要求1所述的基于问答平台的数据处理方法,其特征在于,所述聚类分析所
述目标问题文本集中的每一所述目标问题文本,得到若干个问题簇包括:从所述目标问题文本集中随机选取预设数量的第一目标问题文本,并将所述第一目标问题文本作为初始簇中心;计算与所述初始簇中心的距离最近的第二目标问题文本,并由所...

【专利技术属性】
技术研发人员:陈聪舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1