多意图识别方法、装置、设备及介质制造方法及图纸

技术编号:32570701 阅读:32 留言:0更新日期:2022-03-09 16:57
本申请涉及一种多意图识别方法,包括:获取用户语音,提取所述用户语音的音频特征,以及获取所述用户语音对应的语音文本;根据所述语音文本和所述音频特征构建所述用户语音的意图矩阵;对所述意图矩阵中的元素进行多次随机采样,得到所述意图矩阵的多个子集矩阵;将所述多个子集矩阵中每个子集矩阵与预设多种意图标签进行匹配,根据匹配结果确定所述用户语音的多种意图。此外,本申请还涉及一种多意图识别装置、设备及介质。本申请可解决进行意图识别时,难以识别出多个意图的问题。难以识别出多个意图的问题。难以识别出多个意图的问题。

【技术实现步骤摘要】
多意图识别方法、装置、设备及介质


[0001]本申请涉及音频分析领域,尤其涉及一种多意图识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的不断发展,越来越多的智能产品应用到日常生活中,例如智能音箱、智能客服、智能电话销售、私人手机助理Siri等。为了让智能产品更好地理解用户的表达,进而对用户的问题作出正确应答,自然语言理解(Natural Language Understanding,NLU)起到了重要的作用,而意图识别是自然语言理解的子模块,也是智能对话系统构成的关键。
[0003]现有的意图识别主要为单意图识别,即根据用户语料识别出单一的用户意图,但很多时候用户表达的一句话中不仅含有一个意图,而是多种意图,若仅进行单意图识别,会导致识别结果的不精确,例如,用户说:“我不喜欢吃街角的那家甜品店的糕点,它太甜了”。这句话同时表达了用户的不喜欢街角的甜品店和对甜品店糕点的甜度不满意的意图。因此,如何实现对用户语料中多意图的识别,成为了亟待解决的问题。

技术实现思路

[0004]本申请提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多意图识别方法,其特征在于,所述方法包括:获取用户语音,提取所述用户语音的音频特征,以及获取所述用户语音对应的语音文本;根据所述语音文本和所述音频特征构建所述用户语音的意图矩阵;对所述意图矩阵中的元素进行多次随机采样,得到所述意图矩阵的多个子集矩阵;将所述多个子集矩阵中每个子集矩阵与预设多种意图标签进行匹配,根据匹配结果确定所述用户语音的多种意图。2.根据权利要求1所述的多意图识别方法,其特征在于,所述提取所述用户语音的音频特征,包括:对所述用户语音进行分帧加窗,得到多个语音帧,并从所述多个语音帧中逐个选取其中一个语音帧为目标语音帧;将所述目标语音帧映射为语音时域图,统计所述语音时域图的峰值、幅值、均值和过零率,根据所述幅值计算帧能量,并将所述峰值、所述幅值、所述均值、所述帧能量及所述过零率汇集为时域特征;利用预设滤波器将所述用户语音转换为谱域图,统计所述谱域图的谱域密度、谱熵和共振峰参数,得倒谱域特征;通过傅里叶逆变换将所述谱域图转换为倒谱域图,统计所述倒谱域图的倒谱域密度、倒谱熵和倒谱周期,得到所述倒谱域特征;将所述时域特征、所述谱域特征和所述倒谱域特征汇集为语音特征。3.根据权利要求1所述的多意图识别方法,其特征在于,所述根据所述语音文本和所述音频特征构建所述用户语音的意图矩阵,包括:将所述语音文本拆分为文本分词,并将所述文本分词转换为词向量;根据所述音频特征和所述词向量构建所述用户语音的意图矩阵。4.根据权利要求3所述的多意图识别方法,其特征在于,所述将所述语音文本拆分为文本分词,并将所述文本分词转换为词向量,包括:删除所述语音文本中的无义词,得到标准文本;将所述标准文本按照不同的长度在预设的标准词典中进行检索,并将可在所述标准词典中检索到的内容汇集为文本分词;从预设的字向量表中查询所述文本分词中每个字的字向量;按照所述文本分词中每一个字的顺序将所述字向量拼接为所述文本分词的词向量。5.根据权利要求3所述的多意图识别方法,其特征在于,所述根据所述音频特征和所述词向量构建所述用...

【专利技术属性】
技术研发人员:刘轶黄石磊程刚汪雪
申请(专利权)人:深圳市北科瑞声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1