通讯录人名的语言模型建立方法、语音搜索方法及其系统技术方案

技术编号：7837831 阅读：381 留言：0更新日期：2012-10-12 02:40

本发明专利技术提供了一种通讯录人名的语言模型建立方法、语音搜索方法及其系统，从文本搜索的搜索日志中搜集人名信息；获取对搜集到的人名信息进行的音节标注；利用对人名信息进行的音节标注训练人名音节语言模型。还可以进一步将人名音节语言模型和数字概率模型进行合并，且设置音节到数字、数字到音节的概率为0，得到最终语言模型。客户端接收用户的语音请求，将语音请求发送给服务器；服务器利用人名音节语言模型或者最终语言模型对语音请求进行识别，将识别得到的人名音节返回给客户端；客户端利用服务器返回的人名音节到本地通讯录中进行匹配，得到匹配结果展现给用户。通过本发明专利技术能够提高通讯录的语音搜索准确率。

全部详细技术资料下载

【技术实现步骤摘要】
通讯录人名的语言模型建立方法、语音搜索方法及其系统
本专利技术涉及计算机应用
，特别涉及一种通讯录人名的语言模型建立方法、语音搜索方法及其系统。
技术介绍
随着语音识别技术的快速发展，对常见语音的识别已经能够达到较高的准确率，由于人名基本不具有语言学信息，很难作为“字对”，因此对于人名的语音识别一直是该领域的难点。智能手机终端的流行使得通过智能手机终端随时随地实现语音搜索成为可能，为用户操作带来了便捷，其中通讯录的语音查询是用户希望输入人名的语音时，能够查询到该人名对应的通讯录信息，但正是由于人名的语音识别的实现难度，使得通讯录的语音搜索一直不能具有较好的准确率。
技术实现思路
本专利技术提供了一种通讯录人名的语言模型建立方法、语音搜索方法及其系统，以便于提高通讯录的语音搜索准确率。具体技术方案如下一种通讯录人名的语言模型建立方法，该方法包括SI、从文本搜索的搜索日志中搜集人名信息；S2、获取对搜集到的人名信息进行的音节标注；S3、利用对人名信息进行的音节标注训练人名音节语言模型，所述人名音节语言模型包括在人名信息中音节之间的概率关系。根据本专利技术一优选实施例，在所述步骤SI中，通过人工的方式从文本搜索的搜索日志中搜集人名信息；或者，基于预设的人名提取规则从文本搜索的搜索日志中搜集人名信息；或者，采用与输入法的人名库进行匹配的方式从文本搜索的搜索日志中搜集人名信息。根据本专利技术一优选实施例，在人名信息中音节之间的概率关系通过

【技术保护点】

【技术特征摘要】
1.一种通讯录人名的语言模型建立方法，其特征在于，该方法包括 S1、从文本搜索的搜索日志中搜集人名信息； S2、获取对搜集到的人名信息进行的音节标注； S3、利用对人名信息进行的音节标注训练人名音节语言模型，所述人名音节语言模型包括在人名信息中音节之间的概率关系。2.根据权利要求I所述的方法，其特征在于，在所述步骤SI中，通过人工的方式从文本搜索的搜索日志中搜集人名信息；或者，基于预设的人名提取规则从文本搜索的搜索日志中搜集人名信息；或者，采用与输入法的人名库进行匹配的方式从文本搜索的搜索日志中搜集人名信息。3.根据权利要求I所述的方法，其特征在于，在人名信息中音节之间的概率关系通过4.根据权利要求I所述的方法，其特征在于，该方法进一步包括 S4、将所述人名音节语言模型和数字概率模型进行合并，且设置音节到数字、数字到音节的概率为O，得到最终语言模型；其中所述数字概率模型包括在电话号码中数字之间的概率关系。5.一种语音搜索方法，其特征在于，该方法包括 Al、客户端接收用户的语音请求，将所述语音请求发送给服务器； A2、所述服务器利用由权利要求I至4任一权项所述语言模型建立方法训练得到的人名音节语言模型或者由权利要求4所述语言模型建立方法得到的最终语言模型对所述语音请求进行识别，将识别得到的人名音节返回给所述客户端； A3、所述客户端利用所述服务器返回的所述人名音节到本地通讯录中进行匹配，得到匹配结果展现给用户。6.根据权利要求5所述的语音搜索方法，其特征在于，当由权利要求4所述语言模型建立方法得到最终语言模型时，所述语音搜索方法还包括 BI、客户端接收用户的语音请求，将所述语音请求发送给服务器； B2、所述服务器利用所述最终语言模型对语音请求进行识别，将识别得到的数字串返回给所述客户端； B3、所述客户端利用所述服务器返回的数字串到本地通讯录中进行匹配，得到匹配结果展现给用户。7.—种通讯录人名的语言模型建立系统，其特征在于，该系统包括人名搜集单元，用于从文本搜索的搜索日志中搜集人名信息；音节标注单元，用于获取对搜集到的人名信息进行的音节标注；模型训练单元，用...

【专利技术属性】
技术研发人员：曹立新，万广鲁，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人