一种基于语音识别的房产专业语音搜索系统及方法技术方案

技术编号:22076024 阅读:27 留言:0更新日期:2019-09-12 14:14
本发明专利技术提供一种基于语音识别的房产专业语音搜索系统及方法,包括语音识别引擎、解析器与搜索引擎系统,其特征在于:解析器分别与语音识别引擎以及搜索引擎系统连接;语音识别引擎内设有语音识别技术,用于将用户在移动设备上输入的语音转换为文字,并将转换得到的文字输入解析器;解析器内设有词典,词典内设有若干字符串,解析器用于将从语音识别引擎获得的文字中与字符串匹配的词汇以及新词提取出来,并将提取的词汇按照分类构造出分类‑词汇的映射并将映射传递至搜索引擎系统;搜索引擎系统根据映射查询符合相应条件的房源数据并将其以图形化的方式展示数据至客户。

A Speech Recognition-Based Speech Search System and Method for Real Estate Professionals

【技术实现步骤摘要】
一种基于语音识别的房产专业语音搜索系统及方法
本专利技术应用于房产领域,具体涉及一种基于语音识别的房产专业语音搜索系统及方法。
技术介绍
近年来,语音识别技术取得了长足的进步。语音识别技术已经能够较好地完成让计算机听懂人类语音,将语音中包含的文字信息提取出来的任务。在实现了语音转文字这第一个目标后,如何利用语音中包含的文字信息解决生产生活中的问题就成了下一个目标。目前,语音识别技术的应用在通用领域中使用得较多,如智能家居,智能手机,智能家电等。但在各个行业领域、专业领域中,语音识别技术使用得还不够广泛;目前中文分词技术主要分三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法,其中基于理解的分词方法还处在试验阶段。基于字符串匹配的分词方法在初始化阶段需要准备一个词汇量充分大的词典;基于倒排索引的搜索引擎技术已经较为成熟并且在互联网领域得到了广泛使用。用户在进行搜索行为时通常需要借助键盘鼠标或是移动设备的触摸屏输入关键词、点击选择筛选条件。这类输入行为在计算机上通常不会存在太大问题,但随着人们对移动设备的日益依赖,用户每天使用移动设备的时间行为正逐步超越传统计算机,在此背景下,传统的输入模式在移动设备上开始显示出弊端,例如在九宫格或是虚拟键盘上进行文字的输入,在有限大小的屏幕上进行点选筛选条件,存在较大的误操作概率,使用体验并不好。
技术实现思路
本专利技术的目的是提供一种基于语音识别的房产专业语音搜索系统及方法,借助语音识别技术和中文分词技术,扩展了搜索引擎的输入方式,在传统输入模式的基础上向用户额外提供语音输入模式,实现语音搜索功能。本专利技术提供了如下的技术方案:一种基于语音识别的房产专业语音搜索系统及方法,包括语音识别引擎、解析器与搜索引擎系统,其特征在于:所述解析器分别与所述语音识别引擎以及所述搜索引擎系统连接;所述语音识别引擎内设有语音识别技术,用于将用户在移动设备上输入的语音转换为文字,并将转换得到的文字输入所述解析器;所述解析器内设有词典,所述词典内设有若干字符串,所述解析器用于将从所述语音识别引擎获得的所述文字中与所述字符串匹配的词汇以及新词提取出来,并将提取的所述词汇按照分类构造出分类-词汇的映射并将所述映射传递至搜索引擎系统;所述搜索引擎系统根据所述映射查询符合相应条件的房源数据并将其以图形化的方式展示所述数据至客户。优选的,一种基于语音识别的房产专业语音搜索系统及方法的搜索方法,包括以下步骤:S1、启动搜索引擎与解析器并对所述解析器进行初始化,得到初始词典,设定新词学习规则;S2、用户在移动设备上输入语音,语音识别引擎通过语音识别技术将所述语音转换为文字并将所述文字传递至所述解析器;S3、所述解析器根据所述初始词典以及所述新词学习规则提取所述文字中的对应词汇,并根据分类构造出对应的分类-词汇的映射并将所述映射传递至搜索引擎系统;S4、所述搜索引擎系统根据所述映射查询符合相应条件的房源数据并展现搜索结果。优选的,所述解析器通过读取业务数据库,将行政区属、街道、地铁站、小区名、价格和户型在内的基础数据加载至所述初始词典内,并设置相对应的权重。优选的,所述新词学习规则包括以下步骤:A1、所述解析器对从所述语音识别引擎中提取的新词与所述初始词典中的词汇进行比较,通过计算所述新词与所述初始词典中的词汇之间的编辑距离;A2、对所述编辑距离进行降序排列,得到与所述新词最接近的所述原始词典中的词汇,保存所述新词与所述词典词汇之间的映射关系,并将所述新词加载到所述原始词典中。优选的,所述搜索引擎系统基于倒排索引技术。优选的,所述搜索结果以图形化形式展现。优选的,所述解析器采用中文分词技术。本专利技术的有益效果是:将语音识别技术应用在房产这一专业领域,服务于房产相关的语音搜索;解析器在初始化时,从业务数据库中加载行政区划、街道、地铁站、小区名、价格、户型等基础数据并设置权重,同时解析器带有新词学习能力,可以根据用户输入的词汇匹配与其最接近的原始词典中的词汇,将其加载入词典中并建立分类-词汇映射,避免了初始词典中词汇量覆盖不全面的问题;借助语音识别技术和中文分词技术,扩展了搜索引擎的输入方式,在传统输入模式的基础上向用户额外提供语音输入模式,实现语音搜索功能。具体实施方式一种基于语音识别的房产专业语音搜索系统及方法,包括语音识别引擎、解析器与搜索引擎系统,解析器分别与语音识别引擎以及搜索引擎系统连接;语音识别引擎内设有语音识别技术,用于将用户在移动设备上输入的语音转换为文字,并将转换得到的文字输入解析器,扩展了搜索引擎的输入方式,在传统输入模式的基础上向用户额外提供语音输入模式,实现语音搜索功能。解析器内设有词典,词典内设有若干字符串,解析器用于将从语音识别引擎获得的文字中与字符串匹配的词汇以及新词提取出来,并将提取的词汇按照分类构造出分类-词汇的映射并将映射传递至搜索引擎系统;具体的,解析器在初始化时,从业务数据库中加载行政区划、街道、地铁站、小区名、价格、户型等基础数据并设置权重,同时解析器带有新词学习能力,可以根据用户输入的词汇匹配与其最接近的原始词典中的词汇,将其加载入词典中并建立分类-词汇映射,避免了初始词典中词汇量覆盖不全面的问题;搜索引擎系统根据映射查询符合相应条件的房源数据并将其以图形化的方式展示数据至客户。一种基于语音识别的房产专业语音搜索系统及方法的搜索方法如下:首先,启动搜索引擎与解析器并对解析器进行初始化,得到初始词典,设定新词学习规则,具体的,解析器通过读取业务数据库,将行政区属、街道、地铁站、小区名、价格和户型在内的基础数据加载至初始词典内,并设置相对应的权重;新词学习规则如下:解析器对从语音识别引擎中提取的新词与初始词典中的词汇进行比较,通过计算新词与初始词典中的词汇之间的编辑距离,再对编辑距离进行降序排列,得到与新词最接近的原始词典中的词汇,保存新词与词典词汇之间的映射关系,并将新词加载到原始词典中;搜索时,用户在移动设备上输入语音,语音识别引擎通过语音识别技术将语音转换为文字并将文字传递至解析器;解析器根据初始词典使用字符串(词汇)匹配的分词方法,将匹配的词汇提取出来,使用基于统计的分词方法将文字中的新词提取出来,并根据新词学习规则加载之原始词典中,并分类构造出对应的分类-词汇的映射并将映射传递至搜索引擎系统;最后,基于倒排索引技术的搜索引擎系统根据映射拼接查询语句,查询符合相应条件的房源数据并以图形化的形式展现搜索结果。以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种基于语音识别的房产专业语音搜索系统,包括语音识别引擎、解析器与搜索引擎系统,其特征在于:所述解析器分别与所述语音识别引擎以及所述搜索引擎系统连接;所述语音识别引擎内设有语音识别技术,用于将用户在移动设备上输入的语音转换为文字,并将转换得到的文字输入所述解析器;所述解析器内设有词典,所述词典内设有若干字符串,所述解析器用于将从所述语音识别引擎获得的所述文字中与所述字符串匹配的词汇以及新词提取出来,并将提取的所述词汇按照分类构造出分类‑词汇的映射并将所述映射传递至搜索引擎系统;所述搜索引擎系统根据所述映射查询符合相应条件的房源数据并将其以图形化的方式展示所述数据至客户。

【技术特征摘要】
1.一种基于语音识别的房产专业语音搜索系统,包括语音识别引擎、解析器与搜索引擎系统,其特征在于:所述解析器分别与所述语音识别引擎以及所述搜索引擎系统连接;所述语音识别引擎内设有语音识别技术,用于将用户在移动设备上输入的语音转换为文字,并将转换得到的文字输入所述解析器;所述解析器内设有词典,所述词典内设有若干字符串,所述解析器用于将从所述语音识别引擎获得的所述文字中与所述字符串匹配的词汇以及新词提取出来,并将提取的所述词汇按照分类构造出分类-词汇的映射并将所述映射传递至搜索引擎系统;所述搜索引擎系统根据所述映射查询符合相应条件的房源数据并将其以图形化的方式展示所述数据至客户。2.根据权利要求1所述的一种基于语音识别的房产专业语音搜索方法,其特征在于,包括以下步骤:S1、启动搜索引擎与解析器并对所述解析器进行初始化,得到初始词典,设定新词学习规则;S2、用户在移动设备上输入语音,语音识别引擎通过语音识别技术将所述语音转换为文字并将所述文字传递至所述解析器;S3、所述解析器根据所述初始词典以及所述新词学习规则提取所述文字中的对应词汇,并根据分类构造出对应的分类-词汇的映射并将所述映射传递至搜索引...

【专利技术属性】
技术研发人员:陆洋
申请(专利权)人:江苏三六五网络股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1