一种语音文件检索系统及其检索方法技术方案

技术编号:24173648 阅读:23 留言:0更新日期:2020-05-16 03:49
本发明专利技术公开了一种一种语音文件检索系统及其检索方法,所述检索系统包括语音接收模块,用以接收并存储语音文件;语音识别模块,用以将语音文件解析为文本信息并提取出特征词信息;数据记录模块,用以存储语音识别模块的处理结果;用户检索模块,用以根据检索词调用数据记录模块并进行数据匹配。所述检索方法包括获取用户发送的语音文件;将语音文件解析为文本信息,并提取出特征词;根据特征词调取其对应的语音文件的属性信息;将用户提供的检索词与特征词进行数据匹配,并将匹配结果反馈给用户。本发明专利技术的检索系统及其检索方法不仅提高了语音文件的检索精确度,而且提高了检索效率。

A voice file retrieval system and its retrieval method

【技术实现步骤摘要】
一种语音文件检索系统及其检索方法
本专利技术涉及语音信号处理领域,尤其涉及一种语音文件检索系统及其检索方法。
技术介绍
语音是一种特殊类型的音频,它可以转化成语音文件存储在电脑或者手机等智能设备中。一方面随着QQ、微信等聊天软件的大规模使用及网络技术的普及,语音文件在智能设备或者互联网上所占的比例逐渐变大,如何快速准确地找出这些语音文件逐渐变得重要起来,另一方面随着云技术的快速发展,各种各样的数据库建立了起来,如何通过网络快速找到存储在这些数据库里的语音文件逐渐成为互联网时代的技术难题。现有的语音文件检索系统主要是根据语音文件名称初步匹配用户输入的检索词或者在检索时识别语音文件的内容来匹配用户输入的检索词,但这种方式检索的准确度较低,而且每次检索同一份语音文件时,都需要重新识别语音文件的内容,效率较慢。
技术实现思路
为克服上述缺点,本专利技术的目的在于提供一种语音文件检索系统及其检索方法,不仅提高了语音文件的检索精确度,而且提高了检索效率。为了达到以上目的,本专利技术采用的技术方案之一是:一种语音文件检索系统,包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块。所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器;所述套接字端口用于接收用户发送的语音文件,所述存储器用于存储所述套接字端口接收的语音文件。所述语音识别模块包括语音解析单元、信息提取单元,所述语音解析单元用于将语音文件解析为文本信息,所述信息提取单元用于提取所述文本信息内的特征词信息。所述数据记录模块用以存储所述语音识别模块生成的文本信息及特征词信息。所述用户检索模块包括互联网接口、检索单元、显示单元;所述互联网接口用于供用户输入检索词,所述检索单元用于根据检索词调用所述数据记录模块并进行数据匹配;所述显示单元用于显示所述检索单元检索的匹配结果。通过语音接收模块获取并存储待检索的语音文件,再通过语音识别模块将语音文件解析为文本信息并提取出表征该文本信息的特征词信息,再通过数据记录模块存储语音识别模块的处理结果;当用户在互联网接口中输入检索词时,检索单元只需调用数据记录模块并将检索词与特征词信息进行数据匹配(即文本与文本匹配),然后再通过显示单元显示其匹配结果。本专利技术的有益效果在于:本专利技术的检索系统通过套接字端口与互联网接口的配合提高了互联网中语音文件的检索速度;通过语音识别模块将语音文件转换成能表征其特征的特征词,再通过数据记录模块存储特征词的相关信息;在检索时只需将检索词与特征词进行数据匹配即可快速获取与检索词匹配的特征词信息,从而获取特征词所对应的语音文件信息;通过检索词与特征词的数据匹配大大提高了检索的准确度,而且通过数据记录模块存储特征词的相关信息使得下次检索同份语音文件时能直接获取其特征词信息,提高检索效率。进一步来说,所述信息提取单元包括分词子单元、置信度评估子单元、信息提取子单元;所述分词子单元用于将文本信息拆分为多个词组,所述置信度评估子单元用于对所述分词子单元拆分的多个词组进行置信度评估并滤除无用词组,以得到能表征文本信息的特征词;所述信息提取子单元用于根据所述特征词调取其对应的语音文件的属性信息。进一步来说,所述属性信息包括语音文件的文件名称、语音文件的创建时间、特征词在语音文件中的位置。进一步来说,所述用户检索模块还包括同义解析单元,所述同义解析单元用于解析检索词并生成与所述检索词语义近似的同义检索词。进一步来说,所述检索单元还包括根据同义检索词调用所述数据记录模块并进行数据匹配。本专利技术采用的技术方案之二是:一种语音文件的检索方法,包括如下步骤:S1获取用户发送的语音文件,并存储到存储器中;S2将语音文件解析为文本信息,并提取出能表征所述文本信息的特征词;S3根据特征词调取其对应的语音文件的属性信息;S4将用户提供的检索词与特征词进行数据匹配,并将匹配结果反馈给用户。本专利技术的有益效果在于:本专利技术的检索方法将待检索的语音文件解析为文本信息并提取出能表征文本信息的特征词及特征词所对应的语音文件的属性信息,当需要检索时,只需将检索词与特征词进行数据匹配即可获取与检索词匹配的语音文件信息。通过特征词与检索词的数据匹配能大大提高检索的准确度,而且提高了检索效率。进一步来说,S2中,提取表征所述文本信息的特征词的步骤包括:将文本信息拆分为多个词组,对多个词组分别进行置信度评估并滤除无用词组。进一步来说,S3中,所述属性信息包括语音文件的文件名称、语音文件的创建时间、特征词在语音文件中的位置。进一步来说,S3、S4之间还包括对检索词进行同义解析以生成与所述检索词语义近似的同义检索词。进一步来说,S1中,所述语音文件通过至少一个互联网套接字端口获取。附图说明图1为本专利技术实施例的检索系统的结构框架图;图2为本专利技术实施例的语音解析单元的工作原理图;图3为本专利技术实施例的检索方法的流程图。具体实施方式下面结合附图对本专利技术的较佳实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。实施例参见附图1所示,本专利技术的一种语音文件检索系统,包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块。所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器;所述套接字端口用于接收用户发送的语音文件,所述存储器用于存储所述套接字端口接收的语音文件。所述语音识别模块包括语音解析单元、信息提取单元,所述语音解析单元用于将语音文件解析为文本信息,所述信息提取单元用于提取所述文本信息内的特征词信息。参见附图2所示,所述语音解析单元能实时监控语音文件在创建过程中的状态,并能存储的语音文件进行解析以判断其是否包含语音文件内容的文字描述。当语音文件内容有文字描述时,直接读取该文字描述audioDis;当语音文件内容没有文字描述时,则读取语音文件的Header数据、音频数据AudioSource,并获取文字描述数据Subtitle,计算其长度SutitleSize,随后写入Header数据,修改Header数据中的数据长度标识,其写入的Header数据的长度为Hength+SutitleSize,再依次写入SubtitleSource、SubTitleSize和AudioSource。所述信息提取单元包括分词子单元、置信度评估子单元、信息提取子单元。所述分词子单元用于根据分词模型将文本信息拆分为多个词组。所述置信度评估子单元用于对所述分词子单元拆分的多个词组进行置信度评估并滤除无用词组,以得到能表征文本信息的特征词。所述信息提取子单元用于根据所述特征词调取其对应的语音文件的属性信息。所述属性信息包括语音文件的文件名称、语音文件的创建时间、特征词在语音文件中的位置。其中,分词模型是由若干个标准词组组成的本文档来自技高网...

【技术保护点】
1.一种语音文件检索系统,其特征在于:包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块;/n所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器;所述套接字端口用于接收用户发送的语音文件,所述存储器用于存储所述套接字端口接收的语音文件;/n所述语音识别模块包括语音解析单元、信息提取单元,所述语音解析单元用于将语音文件解析为文本信息,所述信息提取单元用于提取所述文本信息内的特征词信息;/n所述数据记录模块用以存储所述语音识别模块生成的文本信息及特征词信息;/n所述用户检索模块包括互联网接口、检索单元、显示单元;所述互联网接口用于供用户输入检索词,所述检索单元用于根据检索词调用所述数据记录模块并进行数据匹配;所述显示单元用于显示所述检索单元检索的匹配结果。/n

【技术特征摘要】
1.一种语音文件检索系统,其特征在于:包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块;
所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器;所述套接字端口用于接收用户发送的语音文件,所述存储器用于存储所述套接字端口接收的语音文件;
所述语音识别模块包括语音解析单元、信息提取单元,所述语音解析单元用于将语音文件解析为文本信息,所述信息提取单元用于提取所述文本信息内的特征词信息;
所述数据记录模块用以存储所述语音识别模块生成的文本信息及特征词信息;
所述用户检索模块包括互联网接口、检索单元、显示单元;所述互联网接口用于供用户输入检索词,所述检索单元用于根据检索词调用所述数据记录模块并进行数据匹配;所述显示单元用于显示所述检索单元检索的匹配结果。


2.根据权利要求1所述的检索系统,其特征在于:所述信息提取单元包括分词子单元、置信度评估子单元、信息提取子单元;所述分词子单元用于将文本信息拆分为多个词组,所述置信度评估子单元用于对所述分词子单元拆分的多个词组进行置信度评估并滤除无用词组,以得到能表征文本信息的特征词;所述信息提取子单元用于根据所述特征词调取其对应的语音文件的属性信息。


3.根据权利要求2所述的检索系统,其特征在于:所述属性信息包括语音文件的文件名称、语音文件的创建时间、特征词在语音文件中的位置。
<...

【专利技术属性】
技术研发人员:刘鹤君项升高树才
申请(专利权)人:苏州欧孚网络科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1