一种从销售会话中自动识别关键事件的方法及系统技术方案

技术编号:32515299 阅读:16 留言:0更新日期:2022-03-02 11:08
本发明专利技术涉及一种从销售会话中自动识别关键事件的方法及系统,属于自然语言处理领域技术领域,解决了现有关键事件识别方法存在的上述一种或多种缺陷。方法包括:获取每一待识别关键事件的事件规则;切分销售会话,获得多个标识会话角色的文本格式的会话语句;将包含关键词的会话语句作为待识别语句,将每一事件规则与每一待识别语句进行初步匹配,得到各事件规则初步匹配的若干条待识别语句;对于初步匹配的各事件规则,均执行:判断该事件规则是否包含其他可选项,若否,将该事件规则初步匹配的待识别语句识别为关键事件;若是,将该事件规则与该事件规则初步匹配的待识别语句进行再次匹配,将再次匹配通过的待识别语句识别为关键事件。关键事件。关键事件。

【技术实现步骤摘要】
一种从销售会话中自动识别关键事件的方法及系统


[0001]本专利技术涉及自然语言处理领域
,尤其涉及一种从销售会话中自动识别关键事件的方法及系统。

技术介绍

[0002]销售会话中包含了一系列的关键事件,标志了销售介绍的产品属性、客户对产品表达的态度、销售应对客户异议的话术、是否提及竞品公司、是否成功约定下一步安排等。从海量会话中识别关键事件,对于分析会话质量、评估客户意向、发现商机风险、复盘销售问题、提炼优秀案例等方面均有不小的帮助。
[0003]采用人工方式识别关键事件的效率较低,无法应对海量会话的分析处理。现有的关键事件识别技术通常为关键词匹配技术和分类模型技术。具体的实现过程如下:先获取销售会话语音文件,将语音文件转换成相应的文本,通过关键词或分类模型对文本进行预测,从中提取出关键事件。然而,在实施现有的关键词匹配技术和分类模型的过程中,会遇到以下问题:
[0004]第一、未进行上下文信息关联,导致关键事件召回率低、事件偏差大。
[0005]销售会话属于口语交流会话,销售和客户之间的沟通存在较多的问答式对话。单纯对某一方说的话进行关键事件识别,会漏掉交互式的事件。当一方向另一方提问时,回答可能仅包含简单的词汇,问题中包含的问题主体词常常被忽略,这种情况会被漏识别或错误识别,从而导致召回率低,关键事件的识别产生偏差。例如,客户提到价格便宜,无法直接判断出客户认为什么东西的价格便宜,只有联系上下文才能知道,他们讨论的是销售正在介绍的产品,还是销售在向客户提问说,客户认为竞品与他们的产品相比有什么优势。
[0006]第二、关键词匹配局限性较大,导致关键事件识别准确率低。
[0007]仅依靠关键词、命名实体进行事件匹配,容易产生很多识别错误的情况。例如一方说“我这边是中国移动”,可以被认为是他在进行“自我介绍”,但如果说的话是“我这边是中国移动的网”,则他只是在介绍自己正在用的网络类型,被识别为“自我介绍”就有问题。
[0008]第三、分类模型在实际使用中的效率较低。
[0009]使用分类模型提取关键事件,一般采用二分类模型,输入一段话,判断是否包含某个事件,当需要识别的事件数量变多后,则一般采用多类分类模型。若以对话中的自然断句为粒度,逐句输入模型进行判断,运算效率相对较低,而若是考虑不同的上下文对,运算规模更是平方级的增长,无法应用于实际生产环境中。即使模型仅针对少数几个关键事件进行迭代更新,当希望对大量历史数据进行重新优化分析时,也会对所有事件一并产生影响,并且仍需进行全量数据的运行,效率比较低。
[0010]综上,传统的关键事件识别方法存在准确率和召回率较低、运行效率低及实际应用效果不好等缺陷。

技术实现思路

[0011]鉴于上述的分析,本专利技术实施例旨在提供一种从销售会话中自动识别关键事件的方法及系统,用以解决现有关键事件识别方法存在的上述一种或多种缺陷。
[0012]一方面,本专利技术公开了一种从销售会话中自动识别关键事件的方法,包括:
[0013]获取每一待识别关键事件的事件规则;在事件规则中,必选项为关键词,可选项包括以下一项或多项:指定类型的命名实体、关键词及命名实体在会话语句的位置关系、排除词、会话语句位置及会话角色;
[0014]切分所述销售会话,获得多个标识会话角色的文本格式的会话语句;
[0015]将包含关键词的会话语句作为待识别语句,基于每一待识别语句的关键词、排除词、会话语句位置及会话角色,将每一事件规则与每一待识别语句进行初步匹配,得到各事件规则初步匹配的若干条待识别语句;
[0016]对于初步匹配的各事件规则,均执行:判断该事件规则是否包含其他可选项,若否,将该事件规则初步匹配的待识别语句识别为关键事件;若是,基于事件规则的其他可选项,将该事件规则与该事件规则初步匹配的待识别语句进行再次匹配,将再次匹配通过的待识别语句识别为关键事件。
[0017]在上述方案的基础上,本专利技术还做出了如下改进:
[0018]进一步,在执行再次匹配的过程中,对所述事件规则的其他可选项进行一一匹配,若所有的其他可选项均匹配成功,则再次匹配通过;同时,所述其他可选项的匹配顺序优先级从高到低依次为:指定类型的命名实体、关键词及命名实体在会话语句的位置关系。
[0019]进一步,所述事件规则的可选项还包括句法结构,所述句法结构用于限定识别为关键事件的会话语句需满足的词性和修饰关系要求;
[0020]在执行再次匹配的过程中,句法结构的匹配顺序优先级在所述关键词及命名实体在会话语句的位置关系之后。
[0021]进一步,所述事件规则的可选项还包括上下文结构,所述上下文结构用于以当前会话语句为基准、在设定的上下文范围内寻找设定的句式,所述设定的句式的结构与所述事件规则相同;
[0022]在执行再次匹配的过程中,所述上下文结构的匹配顺序优先级在所述句法结构之后。
[0023]进一步,所述事件规则中的排除词包括强排除词和弱排除词;其中,强排除词表示排除会话语句是关键事件的词;弱排除词表示匹配过程中忽略不计的词;
[0024]通过执行以下操作进行初步匹配:
[0025]获取每一待识别语句的关键词、排除词、会话语句位置及会话角色,不存在的规则项内容为空;
[0026]每获取一个事件规则和一个待识别语句,均执行:
[0027]判断该待识别语句是否命中该事件规则中的强排除词,若命中,则该待识别语句与该事件规则不匹配;
[0028]忽略该待识别语句中的弱排除词,并判断该待识别语句的关键词、会话语句位置及会话角色是否均与该事件规则中的相应内容对应匹配,若对应匹配,则该事件规则与该待识别语句初步匹配。
[0029]进一步,通过执行以下操作获取每一待识别语句的关键词及排除词:
[0030]将每一会话语句与关键词字典树进行匹配,将命中关键词字典树中的任意关键词的会话语句作为待识别语句;所述关键词字典树通过汇总每一事件规则的关键词得到;
[0031]将每一待识别语句与排除词字典树进行匹配,并存储匹配到的关键词、排除词及其在相应待识别语句中的位置;排除词字典树通过汇总每一事件规则的排除词得到。
[0032]进一步,在执行再次匹配的过程中,
[0033]通过执行以下操作判断命名实体是否匹配通过:
[0034]识别待识别语句的命名实体,并判断识别的命名实体的类型是否为当前事件规则中命名实体的指定类型,若是,则命名实体匹配通过;
[0035]通过执行以下操作判断所述关键词及命名实体在会话语句的位置关系是否匹配通过:
[0036]获取待识别语句中关键词及命名实体在当前待识别语句中的位置,并判断所获取的位置是否满足当前事件规则中定义的关键词及命名实体在会话语句的位置关系,若满足,则所述关键词及命名实体在会话语句的位置关系匹配通过。
[0037]进一步,在执行再次匹配的过程中,还通过执行以下操作判断句法结构是否本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种从销售会话中自动识别关键事件的方法,其特征在于,包括:获取每一待识别关键事件的事件规则;在事件规则中,必选项为关键词,可选项包括以下一项或多项:指定类型的命名实体、关键词及命名实体在会话语句的位置关系、排除词、会话语句位置及会话角色;切分所述销售会话,获得多个标识会话角色的文本格式的会话语句;将包含关键词的会话语句作为待识别语句,基于每一待识别语句的关键词、排除词、会话语句位置及会话角色,将每一事件规则与每一待识别语句进行初步匹配,得到各事件规则初步匹配的若干条待识别语句;对于初步匹配的各事件规则,均执行:判断该事件规则是否包含其他可选项,若否,将该事件规则初步匹配的待识别语句识别为关键事件;若是,基于事件规则的其他可选项,将该事件规则与该事件规则初步匹配的待识别语句进行再次匹配,将再次匹配通过的待识别语句识别为关键事件。2.根据权利要求1所述的从销售会话中自动识别关键事件的方法,其特征在于,在执行再次匹配的过程中,对所述事件规则的其他可选项进行一一匹配,若所有的其他可选项均匹配成功,则再次匹配通过;同时,所述其他可选项的匹配顺序优先级从高到低依次为:指定类型的命名实体、关键词及命名实体在会话语句的位置关系。3.根据权利要求2所述的从销售会话中自动识别关键事件的方法,其特征在于,所述事件规则的可选项还包括句法结构,所述句法结构用于限定识别为关键事件的会话语句需满足的词性和修饰关系要求;在执行再次匹配的过程中,句法结构的匹配顺序优先级在所述关键词及命名实体在会话语句的位置关系之后。4.根据权利要求3所述的从销售会话中自动识别关键事件的方法,其特征在于,所述事件规则的可选项还包括上下文结构,所述上下文结构用于以当前会话语句为基准、在设定的上下文范围内寻找设定的句式,所述设定的句式的结构与所述事件规则相同;在执行再次匹配的过程中,所述上下文结构的匹配顺序优先级在所述句法结构之后。5.根据权利要求1所述的从销售会话中自动识别关键事件的方法,其特征在于,所述事件规则中的排除词包括强排除词和弱排除词;其中,强排除词表示排除会话语句是关键事件的词;弱排除词表示匹配过程中忽略不计的词;通过执行以下操作进行初步匹配:获取每一待识别语句的关键词、排除词、会话语句位置及会话角色,不存在的规则项内容为空;每获取一个事件规则和一个待识别语句,均执行:判断该待识别语句是否命中该事件规则中的强排除词,若命中,则该待识别语句与该事件规则不匹配;忽略该待识别语句中的弱排除词,并判断该待识别语句的关键词、会话语句位置及会话角色是否均与该事件规则中的相应内容对应匹配,若对应匹配,则该事件规则与该待识别语句初步匹配。6.根据权利要求5所述的从销售会话中自动识别关键事件的方法,其特征在于,通过执行以下操作获取每一待识别语句的关键词及排除词:
将每一会话语句与关键词字典树进行匹配,将命中关键词字典树中的任意关键词的会话语句作为待识别语句;所述关键词字典树通过汇总每...

【专利技术属性】
技术研发人员:陈竑韩三普杨晨
申请(专利权)人:北京深维智信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1