用于识别音频中的关键短语的方法、装置、设备和介质制造方法及图纸

技术编号：20160555 阅读：33 留言：0更新日期：2019-01-19 00:13

本公开的实施例提供了用于识别音频中的关键短语的方法、装置、设备和计算机可读存储介质。一种用于识别音频中的关键短语的方法包括获取待识别的音频数据。该方法还包括利用经训练的关键短语识别模型来识别音频数据中的关键短语。该关键短语识别模型基于第一训练数据和第二训练数据而被训练，其中第一训练数据标识第一训练文本中的词语的特征信息并且第二训练数据标识第二训练文本中的关键短语。以此方式，本公开的实施例能够准确且高效地识别音频数据中的关键信息。

全部详细技术资料下载

【技术实现步骤摘要】
用于识别音频中的关键短语的方法、装置、设备和介质
本公开的实施例总体涉及数据处理领域，并且更具体地，涉及用于识别音频中的关键短语的方法、装置、设备和计算机可读存储介质。
技术介绍
随着计算机技术的发展和智能终端的普及，人们越来越多地使用智能手机或智能音箱等终端设备来收听各种有声节目，诸如有声小说、儿童故事、培训课程等等。由于有声资源的提供方通常仅将录制好的音频数据上传至服务器并配以简单的标题和文字说明，当用户针对这些资源进行检索时，系统通常仅根据标题及文字说明进行检索。由于不能够全面快速地理解音频数据的内容，这样的检索效果可能无法满足用户需求。例如，当用户发出的查询命令中的关键词未被包括在音频数据的标题或文字说明中时，该音频数据将不会被检索到。
技术实现思路
根据本公开的示例实施例，提供了用于识别音频中的关键短语的方案。在本公开的第一方面中，提供了一种用于训练关键短语识别模型的方法。该方法包括获取第一训练数据，第一训练数据标识第一训练文本中的词语的特征信息。该方法还包括获取第二训练数据，第二训练数据标识第二训练文本中的关键短语。该方法还包括基于第一训练数据和第二训练数据来训练关键短语识别模型，以用于识别音频数据中的关键短语。在本公开的第二方面中，提供了一种用于识别音频中的关键短语的方法。该方法包括获取待识别的音频数据。该方法还包括利用经训练的关键短语识别模型来识别音频数据中的关键短语。该关键短语识别模型基于第一训练数据和第二训练数据而被训练，其中第一训练数据标识第一训练文本中的词语的特征信息并且第二训练数据标识第二训练文本中的关键短语。在本公开的第三方面中，提...

【技术保护点】
1.一种用于训练关键短语识别模型的方法，包括：获取第一训练数据，所述第一训练数据标识第一训练文本中的词语的特征信息；获取第二训练数据，所述第二训练数据标识第二训练文本中的关键短语；以及基于所述第一训练数据和所述第二训练数据来训练关键短语识别模型，以用于识别音频数据中的关键短语。

【技术特征摘要】
1.一种用于训练关键短语识别模型的方法，包括：获取第一训练数据，所述第一训练数据标识第一训练文本中的词语的特征信息；获取第二训练数据，所述第二训练数据标识第二训练文本中的关键短语；以及基于所述第一训练数据和所述第二训练数据来训练关键短语识别模型，以用于识别音频数据中的关键短语。2.根据权利要求1所述的方法，其中获取第一训练数据包括：获取所述第一训练文本；以及通过对所述第一训练文本进行预处理来生成所述第一训练数据。3.根据权利要求2所述的方法，其中获取所述第一训练文本包括：获取用于训练所述关键短语识别模型的第一音频样本；以及利用语音识别技术将所述第一音频样本转换成所述第一训练文本。4.根据权利要求2所述的方法，其中对所述第一训练文本进行预处理包括：将所述第一训练文本拆分成至少一个句子；以及利用自然语言处理技术来确定所述至少一个句子中的所述词语的所述特征信息。5.根据权利要求4所述的方法，其中所述特征信息包括所述词语的文本、词性、语义和语法信息中的至少一项。6.根据权利要求1所述的方法，其中获取所述第二训练数据包括：获取所述第二训练文本；以及通过对所述第二训练文本进行预处理来生成所述第二训练数据。7.根据权利要求6所述的方法，其中获取所述第二训练文本包括：获取用于训练所述关键短语识别模型的第二音频样本；以及利用语音识别技术将所述第二音频样本转换成所述第二训练文本。8.根据权利要求6所述的方法，其中对所述第二训练文本进行预处理包括：将所述第二训练文本拆分成至少一个句子；以及利用多个标签来标识所述至少一个句子中的所述关键短语。9.根据权利要求8所述的方法，其中利用多个标签来标识所述至少一个句子中的所述关键短语包括：利用第一标签来标识所述关键短语的起始字符；利用第二标签来标识所述关键短语的后续字符，所述后续字符在所述起始字符之后；以及利用第三标签来标识所述至少一个句子中不属于所述关键短语的字符。10.一种用于识别音频中的关键短语的方法，包括：获取待识别的音频数据；以及利用经训练的关键短语识别模型来识别所述音频数据中的关键短语，其中所述关键短语识别模型基于第一训练数据和第二训练数据而被训练，所述第一训练数据标识第一训练文本中的词语的特征信息并且所述第二训练数据标识第二训练文本中的关键短语。11.根据权利要求10所述的方法，其中识别所述音频数据中的关键短语包括：利用语音识别技术将所述音频数据转换成与所述音频数据相对应的文本；将所述文本拆分成至少一个句子；利用所述关键短语识别模型来确定所述至少一个句子中的字符的相应标签；以及基于所述相应标签来识别所述音频数据中的关键短语。12.根据权利要求11所述的方法，其中所述相应标签包括以下之一：第一标签，其指示所述字符为所述关键短语的起始字符；第二标签，其指示所述字符为所述关键短语的后续字符，其中所述后续字符在所述起始字符之后；以及第三标签，其指示所述字符不属于所述关键短语。13.根据权利要求12所述的方法，其中基于所述相应标签来识别所述音频数据中的关键短语包括：将由所述第一标签标识的所述起始字符和由所述第二标签标识的所述后续字符的集合识别为所述关键短语。14.一种用于训练关键短语识别模型的装置，包括：第一获取模块，被配置为获取第一训练数据，所述第一训练数据标识第一训练文本中的词语的特征信息；第二获取模块，被配置为获取第二训练数据，所述第二训练数据标识第二训练文本中的关键短语；以及模型训练模块，被配置为基于所述第一训练数据和所述第二训练数据来训练关键短语识别模型，以用于识别音频数据中的关键短语。15.根据权利要求14所述的装置，其中所述第一获取模块包括：第一获取单元，被配置为获取所述第一训...

【专利技术属性】
技术研发人员：王志华，杨天行，伍志鹏，彭彬，赵程缘，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人