语音无法理解说法数据的分流处理方法、系统及存储介质技术方案

技术编号：27471638 阅读：8 留言：0更新日期：2021-03-02 17:37

本发明专利技术公开了一种语音无法理解说法数据的分流处理方法、系统及存储介质，包括：第一步、建立数据库,将不能理解的用户说法收集并存储到数据库中；第二步、对不能理解的用户说法数据根据预设置信规则进行置信度标注，并给出置信度评估值；第三步、将置信度分为多个等级，根据置信度评估值及等级对不能理解的用户说法数据进行分流；第四步、对每一等级分流的数据设置不同的处理流程，对分流后的数据按照对应的处理流程进行处理；第五步、将分流处理的数据更新优化到语义引擎中。本发明专利技术能够减少人力投入，节省清洗数据时间，快速上线，能够实现理解的能力提升。现理解的能力提升。现理解的能力提升。

全部详细技术资料下载

【技术实现步骤摘要】
语音无法理解说法数据的分流处理方法、系统及存储介质

[0001]本专利技术属于语音交互
，具体涉及一种语音无法理解说法数据的分流处理方法、系统及存储介质。

技术介绍

[0002]当前语音交互产品已经广泛普及，用户意图理解的正确与否直接影语音执行结果及产品体验。由于汉语语法的高灵活性，句式的高复杂性以及各地方说话习惯不一等因素导致用户同一意图有多种不同说法，特别是非常规说法、地方说法不能正确识别理解的问题。行业针对不能理解的用户意图的普遍处理方法为：通过对这部分数据进行人工清洗，只将常用的无法理解的说法进行维护更新到语义引擎。这种处理方式需要大量人工对数据清洗，工作时间长，语义理解引擎更新慢，更新内容有限。
[0003]因此，有必要开发一种新的语音无法理解说法数据的分流处理方法、系统及存储介质。

技术实现思路

[0004]本专利技术的目的是提供一种语音无法理解说法数据的分流处理方法、系统及存储介质，能减少人力投入，节省清洗数据时间，快速上线，以实现理解的能力提升。
[0005]第一方面，本专利技术所述的一种语音无法理解说法数据的分流处理方法，包括以下步骤：第一步、建立数据库,将不能理解的用户说法收集并存储到数据库中；第二步、对不能理解的用户说法数据根据预设置信规则进行置信度标注，并给出置信度评估值；第三步、将置信度分为多个等级，根据置信度评估值及等级对不能理解的用户说法数据进行分流；第四步、对每一等级分流的数据设置不同的处理流程，对分流后的数据按照对应的处理流程进行处理，并将分流处...

【技术保护点】

【技术特征摘要】
1.一种语音无法理解说法数据的分流处理方法，其特征在于，包括以下步骤：第一步、建立数据库,将不能理解的用户说法收集并存储到数据库中；第二步、对不能理解的用户说法数据根据预设置信规则进行置信度标注，并给出置信度评估值；第三步、将置信度分为多个等级，根据置信度评估值及等级对不能理解的用户说法数据进行分流；第四步、对每一等级分流的数据设置不同的处理流程，对分流后的数据按照对应的处理流程进行处理，并将分流处理的数据更新优化到语义引擎中。2.根据权利要求1所述的语音无法理解说法数据的分流处理方法，其特征在于，所述第二步中：所述预设置信规则为：按照有动作有对象、有对象无动作、无对象有动作和无对象无动作进行分类。3.根据权利要求2所述的语音无法理解说法数据的分流处理方法，其特征在于：所述第三步中：将置信度分为四个等级，从高到低依次为自动级、引导级、澄清级和人工级；对不能理解的用户说法数据进行识别判断，若为有动作有对象，则分流至自动级，若为有对象无动作，则分流至引导级，若为无对象...

【专利技术属性】
技术研发人员：计超，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人