The invention provides a sound data management method, a system and a storage medium. The method includes: acquiring sound data; sending sound data to multiple evaluators and receiving descriptive tags from multiple evaluators; determining the label set according to descriptive tags; sorting the label elements in the label set by frequency to get the label sequence sorted by frequency from high to low; and extracting the first N labels from the label sequence as the gateway of sound data. Key tags, where N is a positive integer, use key tags to store and index sound data. The above scheme extracts key tags from descriptive tags of voice data by multiple evaluators as voice features, so that a large number of voice data can be managed according to voice features. Users can select the corresponding sound data according to different voice characteristics. As a result, the practicability of voice data has been greatly improved, which provides a rich choice of voice sources for voice processing technology.
【技术实现步骤摘要】
一种声音数据管理方法、系统及存储介质
本专利技术涉及语音数据处理领域,更具体地涉及一种声音数据管理方法、系统及存储介质。
技术介绍
随着科技的发展,语音数据处理越来越多地应用于各种应用领域。但目前的语音数据处理通常仅涉及少数几种声音,不能满足用户的多种需求。例如,语音合成技术是将文本转换成语音的技术。通过让机器发声可以实现人机交互。对于语音合成系统,可以预先对一个特定发音人的声音进行模型训练。利用训练好的模型和音库等数据,可以通过语音合成系统实现语音合成。随着物联网及人工智能技术的发展,越来越多的设备有了语音交互的需求。为了让不同设备或者产品具有自己的人设特点,往往需要采用不同特色的声音进行信息表达。目前大部分语音合成解决方案都只能提供少数几个声音,未能提供丰富的声音供用户进行挑选来实现更好的与产品角色匹配的声音效果。而即便有了丰富的声音数据或者拥有丰富的音色可供选择,由于声音无法用类似图片的方式进行展示,用户也难以进行快速有效的选择。因此,亟需一种新的声音数据管理技术,以解决上述问题。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种声音数据管理方法、系统及存储介质。根据本专利技术一方面,提供了一种声音数据管理方法,包括:获取声音数据;将所述声音数据发送给多个评价者并接收所述多个评价者对所述声音数据的描述标签;根据所述描述标签确定标签集合;对所述标签集合中的标签元素进行频度排序,以得到按频度由高到低排序的标签序列;从所述标签序列中提取前N个标签作为所述声音数据的关键标签,其中,N为正整数;利用所述关键标签对所述声音数据进行存储和索引管理。 ...
【技术保护点】
1.一种声音数据管理方法,包括:获取声音数据;将所述声音数据发送给多个评价者并接收所述多个评价者对所述声音数据的描述标签;根据所述描述标签确定标签集合;对所述标签集合中的标签元素进行频度排序,以得到按频度由高到低排序的标签序列;从所述标签序列中提取前N个标签作为所述声音数据的关键标签,其中,N为正整数;利用所述关键标签对所述声音数据进行存储和索引管理。
【技术特征摘要】
1.一种声音数据管理方法,包括:获取声音数据;将所述声音数据发送给多个评价者并接收所述多个评价者对所述声音数据的描述标签;根据所述描述标签确定标签集合;对所述标签集合中的标签元素进行频度排序,以得到按频度由高到低排序的标签序列;从所述标签序列中提取前N个标签作为所述声音数据的关键标签,其中,N为正整数;利用所述关键标签对所述声音数据进行存储和索引管理。2.如权利要求1所述方法,其中,所述根据所述描述标签确定标签集合包括:将所述描述标签作为标签元素加入所述标签集合;针对每个描述标签,以该描述标签为知识点对声音标签知识库进行检索,以获取与所述描述标签相关联的知识点作为扩展标签,并把所述扩展标签作为标签元素也加入所述标签集合。3.如权利要求2所述方法,其中,所述方法还包括:利用所述描述标签更新所述声音标签知识库。4.如权利要求3所述方法,其中,所述利用所述描述标签更新所述声音标签知识库包括:针对每个描述标签,确定所述声音标签知识库中是否包含该描述标签;对于所述声音标签知识库中没有包含该描述标签的情况,以该描述标签为知识点更新所述声音标签知识库。5.如权利要求4所述方法,其中,所述以该描述标签为知识点更新所述声音标签知识库包括:在所述声音标签知识库中增加该描述标签为知识点;建立该描述标签与所述声音标签知识库中的其他知识点的关联关系。6.如权利要求5所述方法,其中,所述建立该描述标签与所述声音标签知识库中的其他知识点的关联关系包括:针对所述声音标签知识库中的其他知识点中的每个知识点,利用自然语言处理技术确定该描述标签与该知识点的语义相似度;对于所述语义相似度大于相似阈值的情况,建立该描述标签与该知识点的关联关...
【专利技术属性】
技术研发人员:李舒扬,
申请(专利权)人:标贝深圳科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。