一种基于有限状态机的新顾客识别方法及装置制造方法及图纸

技术编号：31822442 阅读：25 留言：0更新日期：2022-01-12 12:38

本发明专利技术是关于一种基于有限状态机的新顾客识别方法及装置。该方法包括：获取顾客和销售的对话文本；将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机，以确定所述销售对话对应的状态；根据确定的状态对所述对话文本进行分段，以区分所述对话文本中上下文的不同顾客。本发明专利技术提供的技术方案，依赖于自定义的有限状态机来实现新顾客的识别，易于拓展、精度可保障，且对标注数据依赖度低，便于业务场景的迁移。便于业务场景的迁移。便于业务场景的迁移。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于有限状态机的新顾客识别方法及装置

[0001]本专利技术涉及文本处理领域，尤其涉及一种基于有限状态机的新顾客识别方法及装置。

技术介绍

[0002]在线下销售场景当中，在不侵犯顾客隐私的前提下完成销售员和顾客的对话数据采集，有助于销售方自我管理的迭代升级，更好地服务客户。其中，数据采集一般是通过销售员佩戴的语音工牌硬件等录音设备进行录音，获取到对话数据，再结合自动语音识别、自然语言处理等AI技术进行处理分析总结。
[0003]然而，当录音时间较短，声纹信息不完全时，很难从一天或者半天的语音当中区分出不同顾客，尤其是在工牌硬件需要控制成本的时候。如何通过自然语言技术从一整段语音文本当中如何将顾客进行区分成为一个亟待解决的问题。
[0004]针对这一问题，现有技术通过训练机器学习模型，对每句话进行二分类判断，即是开始句和不是开始句的分类，从而实现对语音文本当中顾客的区分，这种方式需要依赖于特征工程的构建，耗时长；同时在业务场景当中精度较低，比如，在化妆品导购场景当中，会存在大量顾客试用产品的场景，这时会存在等待时间，也会有类似“你好”的等待语对二分类模型进行强干扰。

技术实现思路

[0005]为克服相关技术中存在的问题，本专利技术提供一种基于有限状态机的新顾客识别方法及装置。
[0006]根据本专利技术实施例的第一方面，提供一种基于有限状态机的新顾客识别方法，包括：
[0007]获取顾客和销售的对话文本；
[0008]将所述对话文本中的销售对话按照时间先后顺...

【技术保护点】

【技术特征摘要】
1.一种基于有限状态机的新顾客识别方法，其特征在于，包括：获取顾客和销售的对话文本；将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机，以确定所述销售对话对应的状态；根据确定的状态对所述对话文本进行分段，以区分所述对话文本中上下文的不同顾客。2.根据权利要求1所述的方法，其特征在于，所述将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机，以确定所述销售对话对应的状态，具体包括：根据所述销售对话的发生时间和文本内容确定该销售对话对应的有限状态机中定义的事件，其中，所述有限状态机中的事件被配置为根据上下两句销售对话的发生时间之间的时间间隔以及预设的目标词来进行定义；根据确定的事件确定该销售对话对应的有限状态机中定义的动作；确定所述动作执行完毕后的状态，其中，所述有限状态机中定义的状包括表示“新顾客开始”的第一状态和“非新顾客开始”的第二状态。3.根据权利要求2所述的方法，其特征在于，所述目标词包括在对话开头且表示衔接语义的特殊词、表示对话开始语义的开始词、表示对话结束语义的结束词和在对话中间且表示衔接语义的中间词；所述有限状态机中定义的状态包括第一状态和第二状态；定义的事件包括：第一事件、第二事件、第三事件和第四事件，所述第一事件包括第一子事件和第二子事件，所述第一子事件被定义为当前销售对话与上一句销售对话的时间间隔超过第一阈值，所述第二子事件被定义为当前销售对话与上一句销售对话的时间间隔超过第二阈值，但不符合所述第二事件的情况；所述第二事件被定义为和上一句间隔超过所述第二阈值，但不超过所述第一阈值，并且，当前销售对话的开头为特殊词或者上一句销售对话中有开始词；所述第三事件被定义为当前销售对话和上一句销售对话的时间间隔不超过所述第二阈值，并且符合以下两个条件之一：(1)上一句销售对话没有开始词，并且当前销售对话有开始词，(2)当前销售对话没有开始词，并且上一句销售对话有结束词；所述第四事件被定义为当前销售对话的中间包含有中间词；所述根据所述销售对话的发生时间和其中的目标词确定该销售对话对应的有限状态机中定义的事件，具体包括：判断当前销售对话是否满足所述第四事件；如果不满足所述第四事件，则判断当前销售对话与上一句销售对话的时间间隔是否满足所述第一子事件；如不满足所述第一子事件，则根据所述时间间隔判断当前销售对话是否满足所述第二事件或第三事件；若所述时间间隔满足所述第二事件，则进一步判断所述销售对话的文本内容是否满足所述第二事件；若所述时间间隔满足所述第三事件，则进一步判断所述销售对话的文本内容是否满足所述第三事件；按照时间顺序对每一句销售对话进行如上步骤的循环遍历。4.根据权利要求3所述的方法，其特征在于，所述根据确定的事件确定该销售对话对应
的有限状态机中定义的动作，具体包括：若当前销售对话属于所述第一事件中的第一子事件或第二子事件，则该销售对话保持在所述第一状态；若当前销售对话属于所述第二事件，则该销售对话由所述第一状态迁移到所述第二状态；若当前销售对话属于所述第三事件，则该销售对话由所述第二状态迁移到所述第一状态；若当前销售对话属于所述第四事件，则该销售对话保持在所述第一状态。5.一种基于有限状态机的新顾客识别装置，其特征在于，包括：对话获取模块，用于获取顾客和销售的对话文本；状态确定模块，用于将所述对话文本中的销售对话按照时间先后顺序输...

【专利技术属性】
技术研发人员：邓礼志，袁杰，于皓，张杰，吴信东，吴明辉，
申请(专利权)人：秒针信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人