一种语音文件检索系统及其检索方法技术方案

技术编号：24173648 阅读：23 留言：0更新日期：2020-05-16 03:49

本发明专利技术公开了一种一种语音文件检索系统及其检索方法，所述检索系统包括语音接收模块，用以接收并存储语音文件；语音识别模块，用以将语音文件解析为文本信息并提取出特征词信息；数据记录模块，用以存储语音识别模块的处理结果；用户检索模块，用以根据检索词调用数据记录模块并进行数据匹配。所述检索方法包括获取用户发送的语音文件；将语音文件解析为文本信息，并提取出特征词；根据特征词调取其对应的语音文件的属性信息；将用户提供的检索词与特征词进行数据匹配，并将匹配结果反馈给用户。本发明专利技术的检索系统及其检索方法不仅提高了语音文件的检索精确度，而且提高了检索效率。

A voice file retrieval system and its retrieval method

全部详细技术资料下载

【技术实现步骤摘要】
一种语音文件检索系统及其检索方法
本专利技术涉及语音信号处理领域，尤其涉及一种语音文件检索系统及其检索方法。
技术介绍
语音是一种特殊类型的音频，它可以转化成语音文件存储在电脑或者手机等智能设备中。一方面随着QQ、微信等聊天软件的大规模使用及网络技术的普及，语音文件在智能设备或者互联网上所占的比例逐渐变大，如何快速准确地找出这些语音文件逐渐变得重要起来，另一方面随着云技术的快速发展，各种各样的数据库建立了起来，如何通过网络快速找到存储在这些数据库里的语音文件逐渐成为互联网时代的技术难题。现有的语音文件检索系统主要是根据语音文件名称初步匹配用户输入的检索词或者在检索时识别语音文件的内容来匹配用户输入的检索词，但这种方式检索的准确度较低，而且每次检索同一份语音文件时，都需要重新识别语音文件的内容，效率较慢。
技术实现思路
为克服上述缺点，本专利技术的目的在于提供一种语音文件检索系统及其检索方法，不仅提高了语音文件的检索精确度，而且提高了检索效率。为了达到以上目的，本专利技术采用的技术方案之一是：一种语音文件检索系统，包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块。所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器；所述套接字端口用于接收用户发送的语音文件，所述存储器用于存储所述套接字端口接收的语音文件。所述语音识别模块包括语音解析单元、信息提取单元，所述语音解析单元用于将语音文件解析为文本信息，所述信息提取单元用于提取...

【技术保护点】
1.一种语音文件检索系统，其特征在于：包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块；/n所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器；所述套接字端口用于接收用户发送的语音文件，所述存储器用于存储所述套接字端口接收的语音文件；/n所述语音识别模块包括语音解析单元、信息提取单元，所述语音解析单元用于将语音文件解析为文本信息，所述信息提取单元用于提取所述文本信息内的特征词信息；/n所述数据记录模块用以存储所述语音识别模块生成的文本信息及特征词信息；/n所述用户检索模块包括互联网接口、检索单元、显示单元；所述互联网接口用于供用户输入检索词，所述检索单元用于根据检索词调用所述数据记录模块并进行数据匹配；所述显示单元用于显示所述检索单元检索的匹配结果。/n

【技术特征摘要】
1.一种语音文件检索系统，其特征在于：包括通讯互连的语音接收模块、语音识别模块、数据记录模块、用户检索模块；
所述语音接收模块包括至少一个互联网套接字端口以及与所述套接字端口通讯连接的存储器；所述套接字端口用于接收用户发送的语音文件，所述存储器用于存储所述套接字端口接收的语音文件；
所述语音识别模块包括语音解析单元、信息提取单元，所述语音解析单元用于将语音文件解析为文本信息，所述信息提取单元用于提取所述文本信息内的特征词信息；
所述数据记录模块用以存储所述语音识别模块生成的文本信息及特征词信息；
所述用户检索模块包括互联网接口、检索单元、显示单元；所述互联网接口用于供用户输入检索词，所述检索单元用于根据检索词调用所述数据记录模块并进行数据匹配；所述显示单元用于显示所述检索单元检索的匹配结果。

2.根据权利要求1所述的检索系统，其特征在于：所述信息提取单元包括分词子单元、置信度评估子单元、信息提取子单元；所述分词子单元用于将文本信息拆分为多个词组，所述置信度评估子单元用于对所述分词子单元拆分的多个词组进行置信度评估并滤除无用词组，以得到能表征文本信息的特征词；所述信息提取子单元用于根据所述特征词调取其对应的语音文件的属性信息。

3.根据权利要求2所述的检索系统，其特征在于：所述属性信息包括语音文件的文件名称、语音文件的创建时间、特征词在语音文件中的位置。
<...

【专利技术属性】
技术研发人员：刘鹤君，项升，高树才，
申请(专利权)人：苏州欧孚网络科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人