【技术实现步骤摘要】
基于语义增强的智能语音对话方法、装置、设备及介质
本申请涉及到人工智能
,特别是涉及到一种基于语义增强的智能语音对话方法、装置、设备及介质。
技术介绍
智能语音对话能够实时将客户输入的语音转换为文本,进而根据转换得到的文本识别出客户意图,根据客户意图进行针对性话术,其具有广泛的应用场景,比如,智能语音对话用于智能助手、售前咨询、售后服务以及产品销售等。当客户通过输入语音与智能语音对话系统交互时,如果客户在输入语音时出现噪声大或吐字说话不清等情况,将降低语音转换文本的正确率低,这就使得基于语音转换得到的文本的意图识别模型的效果一般,进而影响智能语音对话系统的使用效果和客户体验。现有技术的语音转换为文本的模型都是基于自左向右的单向语言模型,前面的词决定后面生成的词,这样忽略了句子的整体意思,导致生成的文本存在一定的错误。
技术实现思路
本申请的主要目的为提供一种基于语义增强的智能语音对话方法、装置、设备及介质,旨在解决现有技术的语音转换为文本的模型都是基于自左向右的单向语言模型,因忽略了句子的整体意思, ...
【技术保护点】
1.一种基于语义增强的智能语音对话方法,其特征在于,所述方法包括:/n获取待识别的语音数据;/n将所述待识别的语音数据输入预设的语音识别模型进行语音转换文本,得到待分析的文本数据;/n将所述待分析的文本数据输入语义增强文本纠错模型进行语义增强和纠错处理,得到纠错后的文本数据,其中,所述语义增强文本纠错模型是基于Bert模型和全连接层训练得到的模型;/n将所述纠错后的文本数据输入预设的意图识别模型进行意图识别,得到意图识别结果;/n获取意图与话术知识库,根据所述意图识别结果和所述意图与话术知识库进行匹配,得到目标回答文本数据;/n将所述目标回答文本数据输入预设的语音合成模型进 ...
【技术特征摘要】
1.一种基于语义增强的智能语音对话方法,其特征在于,所述方法包括:
获取待识别的语音数据;
将所述待识别的语音数据输入预设的语音识别模型进行语音转换文本,得到待分析的文本数据;
将所述待分析的文本数据输入语义增强文本纠错模型进行语义增强和纠错处理,得到纠错后的文本数据,其中,所述语义增强文本纠错模型是基于Bert模型和全连接层训练得到的模型;
将所述纠错后的文本数据输入预设的意图识别模型进行意图识别,得到意图识别结果;
获取意图与话术知识库,根据所述意图识别结果和所述意图与话术知识库进行匹配,得到目标回答文本数据;
将所述目标回答文本数据输入预设的语音合成模型进行文本转换语音,得到目标回答语音数据。
2.根据权利要求1所述的基于语义增强的智能语音对话方法,其特征在于,所述将所述待分析的文本数据输入语义增强文本纠错模型进行语义增强和纠错处理,得到纠错后的文本数据的步骤之前,还包括:
获取多个训练文本,所述多个训练文本中每个训练文本包括:文本样本数据、文本标定值和意图标定值,所述文本样本数据是语音转换文本得到的数据;
从所述多个训练文本中获取一个所述训练文本作为目标训练文本;
将所述目标训练文本的所述文本样本数据输入初始模型进行文本预测和意图预测,得到所述目标训练文本对应的文本预测值和意图预测值,所述初始模型包括:文本预测模块和意图预测模块,所述文本预测模块是基于所述Bert模型得到的模块,所述意图预测模块是基于所述全连接层得到的模块;
将所述目标训练文本对应的所述文本标定值、所述意图标定值、所述文本预测值和所述意图预测值输入目标损失函数进行损失值计算,得到目标损失值,根据所述目标损失值更新所述初始模型的参数,将更新参数后的所述初始模型用于下一次计算所述文本预测值和所述意图预测值;
重复执行所述从所述多个训练文本中获取一个所述训练文本作为目标训练文本的步骤,直至满足预设的模型训练结束条件,将满足所述预设的模型训练结束条件的所述初始模型的所述文本预测模块作为所述语义增强文本纠错模型。
3.根据权利要求2所述的基于语义增强的智能语音对话方法,其特征在于,所述训练文本中的文本样本数据的语音转换文本错误率小于错误率阈值。
4.根据权利要求2所述的基于语义增强的智能语音对话方法,其特征在于,所述将所述目标训练文本的所述文本样本数据输入初始模型进行文本预测和意图预测,得到所述目标训练文本对应的文本预测值和意图预测值的步骤,包括:
获取编码字典;
根据所述编码字典对所述目标训练文本的所述文本样本数据进行编码序列化处理,得到目标编码序列;
将所述目标编码序列输入所述初始模型进行文本预测,得到所述目标训练文本对应的所述文本预测值;
采用所述初始模型,对所述文本预测值...
【专利技术属性】
技术研发人员:钱先洋,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。