一种基于正则和文本截断的对话内容分析方法技术

技术编号:29134013 阅读:17 留言:0更新日期:2021-07-02 22:29
本发明专利技术公开一种基于正则和文本截断的对话内容分析方法,本方案能够带来以下好处:该方案以作为插件的形式放入工作手机来进行工作,能够做到多机互换通用;通过人工对话,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,能够减少人工成本,避免不必要的重复劳动;通过人机对话,避免纯人工的对话造成误判等问题,减少对话内容分析来说可能造成误差;通过人机对话,提高对话效率,解决了人工对话内容分析无法较快的反馈系统从而介入到对话,避免对对话进行干涉;在对话内容分析的交互体验、对话分析速度和准确度上进行大大提高。

【技术实现步骤摘要】
一种基于正则和文本截断的对话内容分析方法
本专利技术属于软件领域,涉及一种基于正则和文本截断的对话内容分析方法。
技术介绍
目前,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,对于人力消耗上成本较高,而且对质检员来说,重复的劳动没有很好的实现个人价值,也容易造成身心的疲惫。纯人工的对话内容分析可能偏主观,容易造成误判等,对于对话内容分析来说可能造成误差。人工对话内容分析无法较快的反馈系统从而介入到对话,对对话进行干涉。综上,现有方案在对话内容分析的交互体验、对话分析速度和准确度上仍有待提高。
技术实现思路
鉴于现有技术中所存在的问题,本专利技术采用的技术方案是一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则;步骤二,将输入的对话音频文件或者音频流转换为对话文本内容;步骤三,获取对话分析规则中的正则规则,按顺序采用第一组正则规则对对话文本进行遍历,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历。<br>作为本专利技术的一种优选方案,所述对话音频文件或者音频流通过asr转换为对话文本内容。作为本专利技术的一种优选方案,所述的界面为展示对话的交互界面或前端界面。作为本专利技术的一种优选方案,所述对话的音频流或者音频文件经过格式转换后,同步或异步进行对话内容分析,并通过接口同步返回或者接口推送异步返回记录。本专利技术的有益效果:本方案能够带来以下好处:1.该方案以作为插件的形式放入工作手机来进行工作,能够做到多机互换通用;2.通过人工对话,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,能够减少人工成本,避免不必要的重复劳动;3.通过人机对话,避免纯人工的对话造成误判等问题,减少对话内容分析来说可能造成误差;4.通过人机对话,提高对话效率,解决了人工对话内容分析无法较快的反馈系统从而介入到对话,避免对对话进行干涉;5.在对话内容分析的交互体验、对话分析速度和准确度上进行大大提高。附图说明图1为本实用的流程图。具体实施方式如图1所示,本专利技术公开了一种基于正则和文本截断的对话内容分析方法,采用的技术方案是,一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则,所述的界面为展示对话的交互界面或前端界面;步骤二,将输入的对话音频文件或者音频流转换为对话文本内容,所述对话音频文件或者音频流通过asr转换为对话文本内容,所述对话的音频流或者音频文件经过格式转换后,同步或异步进行对话内容分析,并通过接口同步返回或者接口推送异步返回记录;步骤三,获取对话分析规则中的正则规则,所述正则规则为不同的选择性法规的规则列表,按顺序采用第一组正则规则对对话文本进行遍历,确认是否存在句子命中正则规则中的第一条规则,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,直至命中语句或者非命中语句到末尾的文本,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历,完成后对所有结果进行统计分析,之后输出。现有对话双方A和B的以下一段对话:A:你好。B:你好,我是xxx。A:你好,我这边是xx的客服,xxx。A:xxxx。B:不需要。A:您可以再考虑下。这样一段对话文本,一组正则规则为A:*.客服。B:你好。当A的正则命中后,需要把上文的[A:你好,我这边是xx的客服,xxx]这一句的后一句到文本结尾截取出来,否则B:你好,这个正则从头开始遍历也能在B的第一句话命中,这样对话顺序就不是正则规则需要的顺序了然后非命中语句说话人指的是上文中[A:你好,我这边是xx的客服,xxx]这一句命中了,A为命中语句的说话人B为非命中语句的说话人,这里从B的不需要开始截取而不是从A的[A:你好,我这边是xx的客服,xxx]这里截取是因为示例正则中下一次判断对象为B的说话内容,所以不需要对A的其他语句再做遍历)。本文中未详细说明的部件为现有技术。上述虽然对本专利技术的具体实施例作了详细说明,但是本专利技术并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本专利技术宗旨的前提下做出各种变化,而不具备创造性劳动的修改或变形仍在本专利技术的保护范围以内。本文档来自技高网...

【技术保护点】
1.一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:/n步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则;/n步骤二,将输入的对话音频文件或者音频流转换为对话文本内容;/n步骤三,获取对话分析规则中的正则规则,按顺序采用第一组正则规则对对话文本进行遍历,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;/n步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历。/n

【技术特征摘要】
1.一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:
步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则;
步骤二,将输入的对话音频文件或者音频流转换为对话文本内容;
步骤三,获取对话分析规则中的正则规则,按顺序采用第一组正则规则对对话文本进行遍历,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;
步骤四,下...

【专利技术属性】
技术研发人员:董金杰
申请(专利权)人:浙江百应科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1