一种基于有限状态机的新顾客识别方法及装置制造方法及图纸

技术编号:31822442 阅读:25 留言:0更新日期:2022-01-12 12:38
本发明专利技术是关于一种基于有限状态机的新顾客识别方法及装置。该方法包括:获取顾客和销售的对话文本;将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机,以确定所述销售对话对应的状态;根据确定的状态对所述对话文本进行分段,以区分所述对话文本中上下文的不同顾客。本发明专利技术提供的技术方案,依赖于自定义的有限状态机来实现新顾客的识别,易于拓展、精度可保障,且对标注数据依赖度低,便于业务场景的迁移。便于业务场景的迁移。便于业务场景的迁移。

【技术实现步骤摘要】
一种基于有限状态机的新顾客识别方法及装置


[0001]本专利技术涉及文本处理领域,尤其涉及一种基于有限状态机的新顾客识别方法及装置。

技术介绍

[0002]在线下销售场景当中,在不侵犯顾客隐私的前提下完成销售员和顾客的对话数据采集,有助于销售方自我管理的迭代升级,更好地服务客户。其中,数据采集一般是通过销售员佩戴的语音工牌硬件等录音设备进行录音,获取到对话数据,再结合自动语音识别、自然语言处理等AI技术进行处理分析总结。
[0003]然而,当录音时间较短,声纹信息不完全时,很难从一天或者半天的语音当中区分出不同顾客,尤其是在工牌硬件需要控制成本的时候。如何通过自然语言技术从一整段语音文本当中如何将顾客进行区分成为一个亟待解决的问题。
[0004]针对这一问题,现有技术通过训练机器学习模型,对每句话进行二分类判断,即是开始句和不是开始句的分类,从而实现对语音文本当中顾客的区分,这种方式需要依赖于特征工程的构建,耗时长;同时在业务场景当中精度较低,比如,在化妆品导购场景当中,会存在大量顾客试用产品的场景,这时会存在等待时间,也会有类似“你好”的等待语对二分类模型进行强干扰。

技术实现思路

[0005]为克服相关技术中存在的问题,本专利技术提供一种基于有限状态机的新顾客识别方法及装置。
[0006]根据本专利技术实施例的第一方面,提供一种基于有限状态机的新顾客识别方法,包括:
[0007]获取顾客和销售的对话文本;
[0008]将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机,以确定所述销售对话对应的状态;
[0009]根据确定的状态对所述对话文本进行分段,以区分所述对话文本中上下文的不同顾客。
[0010]根据本专利技术实施例的第二方面,提供一种基于有限状态机的新顾客识别系统,包括:
[0011]对话获取模块,用于获取顾客和销售的对话文本;
[0012]状态确定模块,用于将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机,以确定所述销售对话对应的状态;
[0013]对话分段模块,用于根据所述状态确定模块确定的状态对所述对话文本进行分段,以区分所述对话文本中上下文的不同顾客。
[0014]根据本专利技术实施例的第三方面,提供一种终端设备,包括:
[0015]处理器;以及
[0016]存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
[0017]根据本专利技术实施例的第四方面,提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
[0018]本专利技术的实施例提供的技术方案可以包括以下有益效果:
[0019]依赖于自定义的有限状态机来实现新顾客的识别,易于拓展、精度可保障,且对标注数据依赖度低,便于业务场景的迁移。
[0020]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0021]通过结合附图对本专利技术示例性实施方式进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显,其中,在本专利技术示例性实施方式中,相同的参考标号通常代表相同部件。
[0022]图1是根据本专利技术一示例性实施例示出的一种基于有限状态机的新顾客识别方法的流程示意图;
[0023]图2是本专利技术实施例提供的有限状态机的原理示意图;
[0024]图3是根据本专利技术示例性实施例示出的一种基于有限状态机的新顾客识别装置的结构框图;
[0025]图4是根据本专利技术一示例性实施例示出的一种计算设备的结构示意图。
具体实施方式
[0026]下面将参照附图更详细地描述本专利技术的优选实施方式。虽然附图中显示了本专利技术的优选实施方式,然而应该理解,可以以各种形式实现本专利技术而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本专利技术更加透彻和完整,并且能够将本专利技术的范围完整地传达给本领域的技术人员。
[0027]在本专利技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0028]应当理解,尽管在本专利技术可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本专利技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0029]本专利技术是基于有限状态机来实现新顾客识别的,为便于读者理解,下面首先对有
限状态机的相关知识作简要说明。
[0030]有限状态机是一种用来进行对象行为建模的工具,其作用主要是描述对象在它的生命周期内所经历的状态序列,以及如何响应来自外界的各种事件。状态机可归纳为4个要素,即现态、条件、动作、次态。“现态”和“条件”是因,“动作”和“次态”是果。详解如下:
[0031]①
现态:是指当前所处的状态。
[0032]②
条件:又称为“事件”。当一个条件被满足,将会触发一个动作,或者执行一次状态的迁移。
[0033]③
动作:条件满足后执行的动作。动作执行完毕后,可以迁移到新的状态,也可以仍旧保持原状态。动作不是必需的,当条件满足后,也可以不执行任何动作,直接迁移到新状态。
[0034]④
次态:条件满足后要迁往的新状态。“次态”是相对于“现态”而言的,“次态”一旦被激活,就转变成新的“现态”了。
[0035]以下结合附图详细描述本专利技术实施例的技术方案。
[0036]图1是根据本专利技术一示例性实施例示出的一种基于有限状态机的新顾客识别方法的流程示意图。
[0037]参见图1,该方法包括:
[0038]110、获取顾客和销售的对话文本;
[0039]具体的,可通过销售佩戴的语音工牌采集顾客和销售的对话录音,再通过ASR(Automatic Speech Recognition,自动语音识别技术)将对话录音转成对话文本,生成一段按照时间顺序排列的对话。
[0040]并且,为便于进行后续分析,需要先标记出对话文本中属于销售的销售对话以及属于顾客的顾客对话,具体的,可预先采集销售的声音文本来训练声纹识别模型,再通过该模型识别并标记出销售对话,其他对话则统一标记为顾客对话。
[0041]120、将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于有限状态机的新顾客识别方法,其特征在于,包括:获取顾客和销售的对话文本;将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机,以确定所述销售对话对应的状态;根据确定的状态对所述对话文本进行分段,以区分所述对话文本中上下文的不同顾客。2.根据权利要求1所述的方法,其特征在于,所述将所述对话文本中的销售对话按照时间先后顺序输入预先建立的有限状态机,以确定所述销售对话对应的状态,具体包括:根据所述销售对话的发生时间和文本内容确定该销售对话对应的有限状态机中定义的事件,其中,所述有限状态机中的事件被配置为根据上下两句销售对话的发生时间之间的时间间隔以及预设的目标词来进行定义;根据确定的事件确定该销售对话对应的有限状态机中定义的动作;确定所述动作执行完毕后的状态,其中,所述有限状态机中定义的状包括表示“新顾客开始”的第一状态和“非新顾客开始”的第二状态。3.根据权利要求2所述的方法,其特征在于,所述目标词包括在对话开头且表示衔接语义的特殊词、表示对话开始语义的开始词、表示对话结束语义的结束词和在对话中间且表示衔接语义的中间词;所述有限状态机中定义的状态包括第一状态和第二状态;定义的事件包括:第一事件、第二事件、第三事件和第四事件,所述第一事件包括第一子事件和第二子事件,所述第一子事件被定义为当前销售对话与上一句销售对话的时间间隔超过第一阈值,所述第二子事件被定义为当前销售对话与上一句销售对话的时间间隔超过第二阈值,但不符合所述第二事件的情况;所述第二事件被定义为和上一句间隔超过所述第二阈值,但不超过所述第一阈值,并且,当前销售对话的开头为特殊词或者上一句销售对话中有开始词;所述第三事件被定义为当前销售对话和上一句销售对话的时间间隔不超过所述第二阈值,并且符合以下两个条件之一:(1)上一句销售对话没有开始词,并且当前销售对话有开始词,(2)当前销售对话没有开始词,并且上一句销售对话有结束词;所述第四事件被定义为当前销售对话的中间包含有中间词;所述根据所述销售对话的发生时间和其中的目标词确定该销售对话对应的有限状态机中定义的事件,具体包括:判断当前销售对话是否满足所述第四事件;如果不满足所述第四事件,则判断当前销售对话与上一句销售对话的时间间隔是否满足所述第一子事件;如不满足所述第一子事件,则根据所述时间间隔判断当前销售对话是否满足所述第二事件或第三事件;若所述时间间隔满足所述第二事件,则进一步判断所述销售对话的文本内容是否满足所述第二事件;若所述时间间隔满足所述第三事件,则进一步判断所述销售对话的文本内容是否满足所述第三事件;按照时间顺序对每一句销售对话进行如上步骤的循环遍历。4.根据权利要求3所述的方法,其特征在于,所述根据确定的事件确定该销售对话对应
的有限状态机中定义的动作,具体包括:若当前销售对话属于所述第一事件中的第一子事件或第二子事件,则该销售对话保持在所述第一状态;若当前销售对话属于所述第二事件,则该销售对话由所述第一状态迁移到所述第二状态;若当前销售对话属于所述第三事件,则该销售对话由所述第二状态迁移到所述第一状态;若当前销售对话属于所述第四事件,则该销售对话保持在所述第一状态。5.一种基于有限状态机的新顾客识别装置,其特征在于,包括:对话获取模块,用于获取顾客和销售的对话文本;状态确定模块,用于将所述对话文本中的销售对话按照时间先后顺序输...

【专利技术属性】
技术研发人员:邓礼志袁杰于皓张杰吴信东吴明辉
申请(专利权)人:秒针信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1