一种基于互联网AI外呼的数据抽取方法与系统技术方案

技术编号:34696052 阅读:14 留言:0更新日期:2022-08-27 16:31
本方案公开了一种基于互联网AI外呼的数据抽取方法,包括:从互联网AI外呼过程中产生的全部对话信息和数据中,获取所需的对话数据;将获取的所述对话数据,与数据库中数据进行数据比对和筛选,确定所述互联网AI外呼系统运行过程中的对话数据与所述数据库中数据的匹配度;从数据库中提取所述匹配度达到要求的所有数据,组成最终返回数据集,返回互联网AI外呼系统的对话系统中,作为下一步对话的参考数据供互联网AI外呼系统使用。本申请通过合理有效的数据处理和数据提取方法,提高了互联网AI外呼系统的数据处理效率和数据提取准确性。AI外呼系统的数据处理效率和数据提取准确性。AI外呼系统的数据处理效率和数据提取准确性。

【技术实现步骤摘要】
一种基于互联网AI外呼的数据抽取方法与系统


[0001]本专利技术属于计算机数据处理及人工智能
,特别涉及一种基于互联网AI外呼的数据抽取方法与系统。

技术介绍

[0002]随着我国经济的高速发展,人力、场地设备等成本不断上涨,传统外呼服务的竞争压力越来越大,大量重复且机械的工作占据了客服的绝大多数时间,复杂案例则变得无暇顾及。互联网AI(人工智能)外呼系统因此应运而生,其可协助完成重复任务,提升外呼效率,从而能够节省更多投入的人力物力成本。
[0003]互联网AI外呼系统,作为平台性的AI技术,是一种重要的AI入口,向下可实现AI底层运算能力的调用,向上则可以与不同的应用场景所融合。已在个人用户领域,以及金融、医疗、教育、智能家具等行业市场得到广泛应用,可承担在线客服、电子病历转录、个人助理等多种功能,推动人机交互,显著提升工作效率。虽然互联网AI外呼系统的应用广泛,但是仍然存在着在实际外呼过程中,与用户对话时的数据提取效率低,失误率高,无法获得准确性较高的数据等问题。
[0004]因此,通过合理有效的技术手段提升互联网AI外呼系统的数据处理效率和提取数据的准确性,是目前需要解决的问题。

技术实现思路

[0005]鉴于以上问题,本申请提供一种基于互联网AI外呼的数据抽取方法、系统及装置,以解决上述技术问题。
[0006]本申请提供了以下技术方案:
[0007]第一方面,本申请提供了一种基于互联网AI外呼的数据抽取方法,所述方法包括:
[0008]从互联网AI外呼过程中产生的全部对话信息和数据中,获取所需的对话数据;
[0009]将获取的所述对话数据,与数据库中数据进行数据比对和筛选,确定所述互联网AI外呼系统运行过程中的对话数据与所述数据库中数据的匹配度;
[0010]从数据库中提取所述匹配度达到要求的所有数据,组成最终返回数据集,返回互联网AI外呼系统的对话系统中,作为下一步对话的参考数据供互联网AI外呼系统使用。
[0011]所述互联网AI外呼系统运行过程中产生的全部对话信息和数据,为互联网AI外呼系统中,AI与用户进行交流互动时,产生的全部对话信息和数据;
[0012]所述匹配度,用于表征数据库中数据在经过比对和筛选后得出的数据,与所述对话数据相比的匹配程度,即关联性的高低;所述数据库,为图数据库,且至少包括互联网AI外呼系统的本地数据,以及可搜索的互联网数据;
[0013]本申请的数据提取过程,是在从数据库中提取匹配度达到要求的所有数据之前,先将数据库中数据经过筛选,再在筛选的基础上确定待提取数据的匹配度,最后将匹配度符合要求的数据提取出来,这样通过层层筛选再提取数据的方式,既能够提高数据提取的
准确性和效率,也可以减轻数据流处理的负荷。
[0014]进一步的,所述从互联网AI外呼过程中产生的全部对话信息和数据中,获取所需的对话数据,包括:
[0015]从互联网AI外呼系统中产生的全部的对话信息和数据中,选取第一对话集,再从所述第一对话集中提取第一数据集;
[0016]所述第一对话集,为包括用户和互联网AI外呼系统之间的至少最近一次对话的所有数据;
[0017]所述第一数据集,为将第一对话集中的与确定核心语义无关的数据过滤之后,筛选出的能够完整反映语义的核心数据,包括的数据类型为节点和关系;
[0018]进一步的,所述将获取的所述对话数据,与数据库中数据进行数据比对和筛选,确定所述互联网AI外呼系统运行过程中的对话数据与所述数据库中数据的匹配度,包括:
[0019]将第一数据集中的数据与数据库中的数据进行比对,并进行第一数据筛选,筛选出的所有数据组,组成第一返回数据集;
[0020]所述第一数据筛选,是将第一数据集中的数据,与数据库中的数据进行数据比对之后,若数据库中数据的节点属性与第一数据集中的节点属性相比,两者的相似度大于等于第一相似度阈值,则提取与该节点相关的所有数据组,作为第一数据筛选过程的筛选结果;所述第一返回数据集,包括经过第一数据筛选过程所筛选出的所有数据组;
[0021]确定第一返回数据集中的各数据组与第一数据集中的数据之间的匹配度,即每个数据组均对应一个相对于第一数据集的第一匹配度,并进行匹配度的排序;
[0022]所述第一匹配度,用于表示第一返回数据集中的各数据组与第一数据集中的数据,两者之间的匹配程度,即关联性的高低,第一匹配度越高,表示关联性越高;
[0023]进一步的,所述确定第一返回数据集中的各数据组与第一数据集中的数据之间的匹配度,即确定第一匹配度,为通过将第一返回数据集中的各数据组中的各数据参数,包括节点的数量、节点属性的相似度、关系的数量,以及关系属性的相似度,进行综合计算后获得每一个数据组所对应的第一匹配度;
[0024]进一步的,所述第一匹配度,利用第一匹配度关系模型进行计算得到;
[0025]其中,所述第一匹配度关系模型包括:
[0026][0027]其中,K1为数据组的第一匹配度;
[0028]i为数据组中的所有节点中第i个节点;
[0029]n为数据组中的所有节点的数量;
[0030]s
i
为数据组中的所有节点中第i个节点,与第一数据集中的节点相比,两者之间的节点属性的相似度,即第i个节点的节点属性相似度;
[0031]为数据组中的所有节点,其节点属性相似度的均值;
[0032]s
m1
为数据组中第一节点的节点属性相似度;
[0033]s
01
为第一相似度阈值;
[0034]为数据组中节点属性相似度的偏离阈值;
[0035]g
r
为数据组中的第一关系与第一数据集中的关系相比,两者之间的关系属性相似度;
[0036]所述第一关系,为数据组,与第一节点直接连接的关系;
[0037]所述第一节点,为数据组的所有节点,与第一数据集中的节点相比,两者之间的节点属性的相似度为最高的节点,即节点属性相似度为最大值的节点;
[0038]以上参数中所述的数据组,均为第一返回数据集中的同一数据组;
[0039]进一步的,所述从数据库中提取匹配度达到要求的所有数据,组成最终返回数据集,包括:
[0040]将第一返回数据集中第一匹配度大于等于第一提取阈值的所有数据组进行提取,并将提取出的所有数据组,组成最终返回数据集。
[0041]所述第一提取阈值,为满足最终返回数据集对第一匹配度要求的阈值;
[0042]进一步的,所述将第一返回数据集中第一匹配度达到要求的所有数据组进行提取,并将提取出的所有数据组,组成最终的返回数据集,还包括:
[0043]若第一返回数据集中至少有一个数据组的第一匹配度大于等于第一提取阈值,则将第一返回数据集中第一匹配度大于等于第一提取阈值的所有数据组进行提取,并组成最终返回数据集。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于互联网AI外呼的数据抽取方法,其特征在于,所述方法包括:从互联网AI外呼过程中产生的全部对话信息和数据中,获取所需的对话数据;将获取的所述对话数据,与数据库中数据进行数据比对和筛选,确定所述互联网AI外呼系统运行过程中的对话数据与所述数据库中数据的匹配度;从数据库中提取所述匹配度达到要求的所有数据,组成最终返回数据集,返回互联网AI外呼系统的对话系统中,作为下一步对话的参考数据供互联网AI外呼系统使用;所述互联网AI外呼系统运行过程中产生的全部对话信息和数据,为互联网AI外呼系统中,AI与用户进行交流互动时,产生的全部对话信息和数据;所述匹配度,用于表征数据库中数据在经过比对和筛选后得出的数据,与所述对话数据相比的关联性的高低;所述数据库,为图数据库,且至少包括互联网AI外呼系统的本地数据,以及可搜索的互联网数据。2.根据权利要求1所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述从互联网AI外呼过程中产生的全部对话信息和数据中,获取所需的对话数据,包括:从互联网AI外呼系统中产生的全部的对话信息和数据中,选取第一对话集,再从所述第一对话集中提取第一数据集;所述第一对话集,为包括用户和互联网AI外呼系统之间的至少最近一次对话的所有数据;所述第一数据集,为将第一对话集中的与确定核心语义无关的数据过滤之后,筛选出的能够完整反映语义的核心数据,包括的数据类型为节点和关系。3.根据权利要求2所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述将获取的所述对话数据,与数据库中数据进行数据比对和筛选,确定所述互联网AI外呼系统运行过程中的对话数据与所述数据库中数据的匹配度,包括:将第一数据集中的数据与数据库中的数据进行比对,并进行第一数据筛选,筛选出的所有数据组,组成第一返回数据集;所述第一数据筛选,是将第一数据集中的数据,与数据库中的数据进行数据比对之后,若数据库中数据的节点属性与第一数据集中的节点属性相比,两者的相似度大于等于第一相似度阈值,则提取与该节点相关的所有数据组,作为第一数据筛选过程的筛选结果;所述第一返回数据集,包括经过第一数据筛选过程所筛选出的所有数据组;确定第一返回数据集中的各数据组与第一数据集中的数据之间的匹配度,即每个数据组均对应一个相对于第一数据集的第一匹配度,并进行匹配度的排序;所述第一匹配度,用于表示第一返回数据集中的各数据组与第一数据集中的数据,两者之间的匹配程度,即关联性的高低,第一匹配度越高,表示关联性越高。4.根据权利要求3所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述确定第一返回数据集中的各数据组与第一数据集中的数据之间的匹配度,即确定第一匹配度,为通过将第一返回数据集中的各数据组中的各数据参数,包括节点的数量、节点属性的相似度、关系的数量,以及关系属性的相似度,进行综合计算后获得每一个数据组所对应的第一匹配度。5.根据权利要求3所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述第一匹配度,利用第一匹配度关系模型进行计算得到;
其中,所述第一匹配度关系模型包括:其中,K1为数据组的第一匹配度;i为数据组中的所有节点中第i个节点;n为数据组中的所有节点的数量;s
i
为数据组中的所有节点中第i个节点,与第一数据集中的节点相比,两者之间的节点属性的相似度,即第i个节点的节点属性相似度;为数据组中的所有节点,其节点属性相似度的均值;s
m1
为数据组中第一节点的节点属性相似度;s
01
为第一相似度阈值;为数据组中节点属性相似度的偏离阈值;g
r
为数据组中的第一关系与第一数据集中的关系相比,两者之间的关系属性相似度;所述第一关系,为数据组,与第一节点直接连接的关系;所述第一节点,为数据组的所有节点,与第一数据集中的节点相比,两者之间的节点属性的相似度为最高的节点,即节点属性相似度为最大值的节点;以上参数中所述的数据组,均为第一返回数据集中的同一数据组。6.根据权利要求3所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述从数据库中提取匹配度达到要求的所有数据,组成最终返回数据集,包括:将第一返回数据集中第一匹配度大于等于第一提取阈值的所有数据组进行提取,并将提取出的所有数据组,组成最终返回数据集;所述第一提取阈值,为满足最终返回数据集对第一匹配度要求的阈值。7.根据权利要求6所述的基于互联网AI外呼的数据抽取方法,其特征在于,所述将第一返回数据集中第一匹配度达到要求的所有数据组进行提取,并将提取出的所有数据组,组成最终的返回数据集...

【专利技术属性】
技术研发人员:李春树苌龙张鑫王福星王志伟
申请(专利权)人:湖南华威金安企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1