一种语音图谱系统检测方法和电子装置制造方法及图纸

技术编号:26597850 阅读:25 留言:0更新日期:2020-12-04 21:20
本文公开了一种语音图谱系统检测方法,所述语音图谱系统用于根据语音提取知识图谱;所述方法包括:获取待检测的语音图谱系统对图谱样本数据的图谱提取结果,根据所述图谱提取结果和所述图谱样本数据对应的标准知识图谱确定提取的准确度;根据所提取的准确度,确定所述语音图谱系统的准确度。

【技术实现步骤摘要】
一种语音图谱系统检测方法和电子装置
本公开涉及但不限于计算机
,尤其涉及一种语音图谱系统检测方法、存储介质和电子装置。
技术介绍
语音图谱系统为根据语音提取知识图谱的系统,主要实现采集声音,转换成文字后抽取信息组成知识图谱的功能。针对已有的语音图谱系统,没有对应相关的检测方法来确定其系统准确度,无法确定其薄弱环节,进而针对性地提升所述语音图谱系统的准确度。“HAO图谱”是明略数据推出的语音图谱系统,是语音到图谱的实时生成系统。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本公开提供了一种语音图谱系统检测方法、存储介质和电子装置,能够针对语音图谱系统的关键指标进行检测,最终确定所述语音图谱系统的准确度。本公开提供了一种语音图谱系统检测方法,所述语音图谱系统用于根据语音提取知识图谱;所述方法包括:获取待检测的语音图谱系统对图谱样本数据的图谱提取结果,根据所述图谱提取结果和所述图谱样本数据对应的标准知识图谱确定提取的准确度;>根据所提取的准确度本文档来自技高网...

【技术保护点】
1.一种语音图谱系统检测方法,所述语音图谱系统用于根据语音提取知识图谱;其特征在于,所述方法包括:/n获取待检测的语音图谱系统对图谱样本数据的图谱提取结果,根据所述图谱提取结果和所述图谱样本数据对应的标准知识图谱确定提取的准确度;/n根据所提取的准确度,确定所述语音图谱系统的准确度。/n

【技术特征摘要】
1.一种语音图谱系统检测方法,所述语音图谱系统用于根据语音提取知识图谱;其特征在于,所述方法包括:
获取待检测的语音图谱系统对图谱样本数据的图谱提取结果,根据所述图谱提取结果和所述图谱样本数据对应的标准知识图谱确定提取的准确度;
根据所提取的准确度,确定所述语音图谱系统的准确度。


2.根据权利要求1所述的方法,其特征在于,
确定所述语音图谱系统的准确度之前,所述方法还包括:
对于待检测的语音图谱系统还执行至少以下检测步骤之一获得对应的准确度:
获取所述待检测的语音图谱系统对语音样本的识别结果,根据所述识别结果和所述语音样本对应的标准文本确定语音识别的准确度;
获取所述待检测的语音图谱系统对文字样本的标点预测结果,根据所述标点预测结果和所述文字样本对应的带标点文本确定标点补齐的准确度;
获取所述待检测的语音图谱系统对多对句子对样本的话题相关性的预测结果,根据所述话题相关性预测结果和所述多对句子对样本的实际话题相关性确定话题识别的准确度;
其中,所述根据提取的准确度,确定所述语音图谱系统的准确度,包括:
根据预设的检测结果的权重、执行上述至少一个检测步骤所得到的准确度和所述提取的准确度,确定所述语音图谱系统的准确度。


3.根据权利要求2所述的方法,其特征在于,
所述根据所述识别结果和所述语音样本对应的标准文本确定语音识别的准确度,包括:
根据所述识别结果和所述语音样本对应的标准文本确定需替换的字数、需插入的字数和需删除的字数;
根据需替换的字数、需插入的字数、需删除的字数的总和,与所述语音样本对应的标准文本所包含的字数的比较结果得到语音识别的准确度。


4.根据权利要求2所述的方法,其特征在于,
所述根据所述标点预测结果和所述文字样本对应的带标点文本确定标点补齐的准确度,包括:
根据所述标点预测结果,对所述文字样本的每一个字标注其后的标点类别标签,将带标签的全部文字组成预测标签集;其中,所述标点类别标签包括:有标点符号标签和无标点标签;
根据所述文字样本对应的带标点文本,对所述文字样本的每一个字标注其后的标点类别标签,将带标签的全部文字组成实际标签集;
根据所述预测标签集包含的有标点符号标签的类型和所述实际标签集包含的有标点符号标签的类型,确定所述文字样本的第一标点符号集合;
对所述第一标点符号集合中的每一类标点符号分别计算每一类标点符号的补齐的准确度;
根据第一标点符号标签集合中全部类型符号的补齐的准确度计算平均值,确定所述标点补齐的准确度;
其中,计算一类标点符号的补齐的准确度,包括:
根据该类标点符号的预测标签集子集和实际标签集子集的交集与该类标点符号的预测标签集子集的比较结果得到该类标点符号的第一预测精确率;
根据该类标点符号的预测标签集子集和实际标签集子集的交集与所述实际标签集子集的比较结果得到该类标点符号的第一预测召回率;
根据该类标点符号的第一预测精确率和该类标点符号的第一预测召回率确定该类标点符号的补齐的准确度。


5.根据权利要求4所述的方法,其特征在于,
所述有标点符号标签包括以下标签中的一个或多个:逗号、句号和问号。


6.根据权利要求1所述的方法,其特征在于,
所述根据所述图谱提取结果和所述图谱样本数据对应的标准知识图谱确定提取的准确度,包括:
根据提取结果中三元组和/或二元组信息,确定每个节点的度,全部节点的度组成提取结果特征向量;
根据图谱样本数据对应的标准知识图谱中的三元组和/或二元组信息,...

【专利技术属性】
技术研发人员:李嘉琛付骁弈
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1