The invention provides a processing method, device and system for voice data. The method first obtains the current voice data and converts it into the current text data; participle data is obtained by natural language participle segmentation of the current text data; whether the participle data has special semantics is judged; if so, the semantics of the participle data is denoised; and the number of participle words after denoising is judged. Whether the semantics of the current text data is related to the semantics of the previous text data or not; if there is a connection, the semantics corresponding information of the current text data can be obtained according to the semantics corresponding information of the previous text data; if there is no connection, the phrases of the segmentation data can be compared with the phrases in the preset standard database, and the segmentation data can be determined according to the results of the comparison. The information corresponding to the phrase; finally, the information is returned to the client. The invention improves the search efficiency by processing voice data, and intelligently analyses the data.
【技术实现步骤摘要】
语音数据的处理方法、装置及系统
本专利技术涉及语音数据处理
,尤其是涉及语音数据的处理方法、装置及系统。
技术介绍
现有技术中通过浏览器或手机App登录到指标报表查询页面,找到要查询的报表或指标的菜单目录,输入要查询的地区、时间等查询条件进行查询,然而对于电信行业数千张报表和KPI(KeyPerformanceIndicator,关键绩效指标)来说,菜单目录多,查找比较困难;而且随报表或指标的增加,需要频繁增加报表查询菜单,操作步骤复杂,菜单维护开发工作量大;同时,传统的数据结果的智能化程度较低,难以实现数据的多样化分析。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种语音数据的处理方法、装置及系统,以提高数据处理的效率和数据智能分析能力。第一方面,本专利技术实施例提供了一种语音数据的处理方法,该方法应用于服务器,该服务器与客户端通信连接;该方法包括:获取当前的语音数据;将当前的语音数据转换为当前文本数据;对当前文本数据进行自然语言分词,得到分词数据;判断分词数据是否有特殊语义,如果有特殊语义,对分词数据的语义进行去噪处理;判断去噪后的分词数据的语义或者当前文本数据的语义与前一个文本数据的语义是否有联系;如果有联系,根据前一个文本数据的语义对应的信息,获取当前文本数据的语义对应的信息;如果没有联系,将分词数据的词组与预设的标准数据库中的词组进行比对,根据比对结果确定分词数据的词组对应的信息;标准数据库中保存有预先设定的词组;将当前文本数据的语义对应的信息或者分词数据的词组对应的信息返回至客户端。进一步,上述方法还包括:通过ALS算法分析用户信息查询 ...
【技术保护点】
1.一种语音数据的处理方法,其特征在于,所述方法应用于服务器,所述服务器与客户端通信连接;所述方法包括:获取当前的语音数据;将所述当前的语音数据转换为当前文本数据;对所述当前文本数据进行自然语言分词,得到分词数据;判断所述分词数据是否有特殊语义,如果有特殊语义,对所述分词数据的语义进行去噪处理;判断去噪后的所述分词数据的语义或者所述当前文本数据的语义与前一个文本数据的语义是否有联系;如果有联系,根据所述前一个文本数据的语义对应的信息,获取所述当前文本数据的语义对应的信息;如果没有联系,将所述分词数据的词组与预设的标准数据库中的词组进行比对,根据比对结果确定所述分词数据的词组对应的信息;所述标准数据库中保存有预先设定的词组;将所述当前文本数据的语义对应的信息或者所述分词数据的词组对应的信息返回至客户端。
【技术特征摘要】
1.一种语音数据的处理方法,其特征在于,所述方法应用于服务器,所述服务器与客户端通信连接;所述方法包括:获取当前的语音数据;将所述当前的语音数据转换为当前文本数据;对所述当前文本数据进行自然语言分词,得到分词数据;判断所述分词数据是否有特殊语义,如果有特殊语义,对所述分词数据的语义进行去噪处理;判断去噪后的所述分词数据的语义或者所述当前文本数据的语义与前一个文本数据的语义是否有联系;如果有联系,根据所述前一个文本数据的语义对应的信息,获取所述当前文本数据的语义对应的信息;如果没有联系,将所述分词数据的词组与预设的标准数据库中的词组进行比对,根据比对结果确定所述分词数据的词组对应的信息;所述标准数据库中保存有预先设定的词组;将所述当前文本数据的语义对应的信息或者所述分词数据的词组对应的信息返回至客户端。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过ALS算法分析用户信息查询的喜好,以使不同的用户在登录客户端后,获得不同的推荐查询的信息。3.根据权利要求1所述的方法,其特征在于,将所述当前的语音数据转换为当前文本数据的步骤,包括:通过调用DeepSpeech的API接口,将所述当前的语音数据转换为当前文本数据。4.根据权利要求1所述的方法,其特征在于,对所述当前文本数据进行自然语言分词,得到分词数据的步骤,包括:采用jieba分词技术,以及预设的标准数据库中词组出现的权重,对当前文本数据进行分词,得到所述当前文本数据的分词数据;所述词组出现的权重根据当前行业领域,通过Trie树结构训练得到。5.根据权利要求1所述的方法,其特征在于,根据所述前一个文本数据的语义对应的信息,获取所述当前文本数据的语义对应的信息的步骤,包括:采用遗传算法对所述当前文本数据的语义和所述前一个文本数据的语义进行解析;获取所述当前文本数据的语义和所述前一个文本数据的语义的维度;如果所述当前文本数据的语义的维度与所述前一个文本数据的语义的维度相同,根据所述前一个文本数据的语义对应的信息的查找范围,查找所述当前文本数据的语义对应的信息;如果所述当前文本数据的语义的维度少于所述前一个文本数据的语义的维度,生成提示信息,以提示输入缺少的维度;当接收到缺少的维度后,根据所述前一个文本数据的语义对应的信息的查找范围,查找当...
【专利技术属性】
技术研发人员:黄哲,沈鹏程,刘树权,张祖齐,
申请(专利权)人:南京星邺汇捷网络科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。