声控数据分析方法、装置、终端设备及存储介质制造方法及图纸

技术编号:32483367 阅读:17 留言:0更新日期:2022-03-02 09:47
本申请适用于语音控制技术领域,提供了一种声控数据分析方法、装置、终端设备及存储介质。将语音信息转换为文本信息,对文本信息进行过滤,得到词汇集合;将词汇集合中各个词汇对应的向量带入到预设模型,得到第一输出结果;将语料库中各个语料对应的向量带入预设模型,得到多个第二输出结果;在多个第二输出结果中确定与第一输出结果相似度最高的目标输出结果,对与目标输出结果对应的语料进行编码,得到组合序列;利用抽象语法树对组合序列解码,得到SQL语句;将SQL语句发送至SQL数据库中查询数据,得到数据结果,将数据结果发送至数据大屏的前端页面,以使前端页面根据数据结果更新显示数据,由此实现用户与数据大屏智能化交互。化交互。化交互。

【技术实现步骤摘要】
声控数据分析方法、装置、终端设备及存储介质


[0001]本申请属于语音控制
,尤其涉及一种声控数据分析方法、装置、终端设备及存储介质。

技术介绍

[0002]大数据时代,最常听到的一句话就是“用数据说话”。但数据本身是冰冷的数字,很难直接告诉我们哪些数据是有价值的信息。只有通过合适的可视化工具来进行数据的展示表达,才可以使传递给使用者的感受更加直观,也更容易获得其中价值。
[0003]数据大屏就是一种有效的数据可视化工具,它可以将业务的关键指标以可视化的方式展示到一块或多块LED大屏上,不仅可以让业务人员快速、直接地从繁杂的业务数据中找到重要数据,还可以对决策人员起到辅助作用。
[0004]但是目前市面上的可视化大屏功能比较单一,展示的数据量有限,缺乏交互性,数据大屏在程序员开发完成上线后,它所展示的内容和界面已经定了,无法再改变。如果对展示的数据、格式、图像不满意,只能进行二次开发、测试、然后重新上线。一个需求的改变和增加将耗费数天的时间,这是目前数据大屏普遍的弊端。

技术实现思路

[0005]本申请实施例提供了一种声控数据分析方法、装置、终端设备及存储介质,可以解决数据大屏缺乏交互性的问题。
[0006]第一方面,本申请实施例提供了一种声控数据分析方法,包括:
[0007]将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合;
[0008]确定所述词汇集合中各个词汇的向量,并将各个所述词汇对应的向量带入到预设模型,得到第一输出结果;
>[0009]确定语料库中各个语料的向量,并将各个所述语料对应的向量带入所述预设模型,得到多个第二输出结果;
[0010]在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列;
[0011]利用抽象语法树对所述组合序列进行解码,得到SQL语句;
[0012]将所述SQL语句发送至SQL数据库中查询数据,得到数据结果,将所述数据结果发送至数据大屏的前端页面,以使所述前端页面根据所述数据结果更新显示数据。
[0013]在第一方面的一种可能的实现方式中,所述对所述文本信息进行过滤,得到词汇集合,包括:
[0014]去除所述文本信息中的非文本内容;
[0015]对去除非文本内容的文本信息进行分词处理,得到多个词汇;
[0016]对每个词汇进行词性标注;
[0017]去除停用词,得到所述词汇集合。
[0018]在第一方面的一种可能的实现方式中,所述预设模型为word2vec模型、one

hot模型或TF

IDF模型。
[0019]在第一方面的一种可能的实现方式中,所述在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列,包括:
[0020]计算每个所述第二输出结果与所述第一输出结果的相似度;
[0021]确定与所述第一输出结果相似度最高的第二输出结果,记作为所述目标输出结果;
[0022]在语料库中获取与所述目标输出结果对应的目标语料,并根据所述目标语料得到query、table和column在数据库中的表达方式;
[0023]对query、table和column进行联合编码,得到所述组合序列。
[0024]在第一方面的一种可能的实现方式中,所述利用抽象语法树对所述组合序列进行解码,得到SQL语句,包括:
[0025]将所述组合序列进行语法解析,得到目标抽象语法树;
[0026]根据预设规则对所述目标抽象语法树中各个节点上的语料进行转换;
[0027]根据转换后的所述目标抽象语法树,得到所述SQL语句。
[0028]在第一方面的一种可能的实现方式中,在所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合之前,还包括:
[0029]提取所述语音信息的特征信息,并根据所述特征信息识别所述语音信息对应的身份;
[0030]在所述语音对应的身份为主讲人时,执行所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合步骤;
[0031]在所述语音信息的身份为非主讲人时,则不执行所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合步骤。
[0032]在第一方面的一种可能的实现方式中,所述提取所述语音信息的特征信息,并根据所述特征信息识别所述语音信息对应的身份之前,还包括:
[0033]当接收到预设指令后,获取主讲人的语音信息;
[0034]提取所述语音信息的特征信息,并将该特征信息作为标准特征信息。
[0035]第二方面,本申请实施例提供了一种声控数据分析装置,包括:
[0036]文本处理模块,用于将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合;
[0037]第一计算模块,用于确定所述词汇集合中各个词汇的向量,并将各个所述词汇对应的向量带入到预设模型,得到第一输出结果;
[0038]第二计算模块,用于确定语料库中各个语料的向量,并将各个所述语料对应的向量带入所述预设模型,得到多个第二输出结果;
[0039]编码模块,用于在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列;
[0040]解码模块,用于利用抽象语法树对所述组合序列进行解码,得到SQL语句;
[0041]发送模块,用于将所述SQL语句发送至SQL数据库中查询数据,得到数据结果,将所
述数据结果发送至数据大屏的前端页面,以使所述前端页面根据所述数据结果更新显示数据。
[0042]第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述的方法。
[0043]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法。
[0044]第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的方法。
[0045]本申请实施例与现有技术相比存在的有益效果是:
[0046]使用数据大屏时,获取用户的语音信息,将语音信息转换为文本信息,并对文本信息进行过滤,得到词汇集合。确定词汇集合中各个词汇的向量,并将各个词汇对应的向量带入到预设模型,得到第一输出结果。确定语料库中各个语料的向量,并将各个语料对应的向量带入预设模型,得到多个第二输出结果。在多个第二输出结果中确定与第一输出结果相似度最高的目标输出结果,对与目标输出结果对应的语料本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声控数据分析方法,其特征在于,包括:将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合;确定所述词汇集合中各个词汇的向量,并将各个所述词汇对应的向量带入到预设模型,得到第一输出结果;确定语料库中各个语料的向量,并将各个所述语料对应的向量带入所述预设模型,得到多个第二输出结果;在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列;利用抽象语法树对所述组合序列进行解码,得到SQL语句;将所述SQL语句发送至SQL数据库中查询数据,得到数据结果,将所述数据结果发送至数据大屏的前端页面,以使所述前端页面根据所述数据结果更新显示数据。2.根据权利要求1所述的声控数据分析方法,其特征在于,所述对所述文本信息进行过滤,得到词汇集合,包括:去除所述文本信息中的非文本内容;对去除非文本内容的文本信息进行分词处理,得到多个词汇;对每个词汇进行词性标注;去除停用词,得到所述词汇集合。3.根据权利要求1所述的声控数据分析方法,其特征在于,所述预设模型为word2vec模型、one

hot模型或TF

IDF模型。4.根据权利要求1所述的声控数据分析方法,其特征在于,所述在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列,包括:计算每个所述第二输出结果与所述第一输出结果的相似度;确定与所述第一输出结果相似度最高的第二输出结果,记作为所述目标输出结果;在语料库中获取与所述目标输出结果对应的目标语料,并根据所述目标语料得到query、table和column在数据库中的表达方式;对query、table和column进行联合编码,得到所述组合序列。5.根据权利要求1所述的声控数据分析方法,其特征在于,所述利用抽象语法树对所述组合序列进行解码,得到SQL语句,包括:将所述组合序列进行语法解析,得到目标抽象语法树;根据预设规则对所述目标抽象语法树中各个节点上的语料进行转换;根据转换后的所...

【专利技术属性】
技术研发人员:李保雷孙旭东宋占亮
申请(专利权)人:如果科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1