一种对语音文件内容进行标记的方法及装置制造方法及图纸

技术编号:17100505 阅读:30 留言:0更新日期:2018-01-21 11:52
本发明专利技术适用于语音文件处理技术领域,提供了一种对语音文件内容进行标记的方法及装置。其中,一种对语音文件内容进行标记的方法包括:识别语音文件中的关键语段,并获取该关键语音段对应的语音参数,再根据预设参数阈值与语音参数的比较结果判断关键语音段是否为目标语音段,如果关键语音段为目标语音段,在语音文件中基于关键语音段进行标记,使得在对若干通话录音进行抽查时,能够根据标记选择播放对应的语音段,无需播放语音文件的全部内容,避免了抽查人员在抽查过程中,因疲劳或抵触心理对服务质量评分的造成的影响,提高了语音文件抽查效率。

A method and device for marking the content of a voice file

The invention is suitable for the technical field of speech file processing, and provides a method and device for marking the content of a voice file. Among them, including a method for marking the voice file content: critical discourse recognition in speech files, voice parameters and obtain the key speech segment, according to the preset parameter threshold and speech parameters comparison results to determine whether the target key speech speech, if key speech segments as target speech segments. Mark the voice file based on the key speech segment in checks on some recordings, according to the marker selection speech segments corresponding to the play, all without the need to play audio files, to avoid sampling personnel in the sampling process, due to fatigue or psychological conflict on the service quality score of the impact improve the efficiency of the voice file checks.

【技术实现步骤摘要】
一种对语音文件内容进行标记的方法及装置
本专利技术属于语音文件处理
,尤其涉及一种对语音文件内容进行标记的方法及装置。
技术介绍
在对呼叫中心的客服人员进行专业考核时,需要对客服人员的通话录音进行抽查。例如,从客服人员在某个季度内处理的所有来电中筛选若干通话录音进行抽查,以对客服人员的服务质量做出评价。目前,抽查过程中需要抽查人员听完所有被抽查的通话录音,进而给出服务质量评分。然而,抽查人员听了一段时间的通话录音后,容易疲劳和产生抵触心理,即容易影响服务质量评分的客观性和准确性,降低了语音文件抽查效率。
技术实现思路
有鉴于此,本专利技术实施例提供了一种对语音文件内容进行标记的方法及装置,以解决现有技术中的问题。本专利技术实施例的第一方面提供了一种对语音文件内容进行标记的方法,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,在所述语音文件中基于所述关键语音段进行标记。本专利技术实施例的第二方面提供了一种对语音文件内容进行标记的装置,包括用于执行第一方面所述方法的单元。本专利技术实施例的第三方面提供了一种终端,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现上述第一方案所述方法的步骤。本专利技术实施例通过识别语音文件中的关键语段,并获取该关键语音段对应的语音参数,再根据预设参数阈值与语音参数的比较结果判断关键语音段是否为目标语音段,如果关键语音段为目标语音段,在语音文件中基于关键语音段进行标记,使得在对若干通话录音进行抽查时,能够根据标记选择播放对应的语音段,无需播放语音文件的全部内容,避免了抽查人员在抽查过程中,因疲劳或抵触心理对服务质量评分的造成的影响,提高了语音文件抽查效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种对语音文件内容进行标记的方法的实现流程示意图;图2是本专利技术另一实施例提供的一种对语音文件内容进行标记的方法的实现流程示意图;图3是本专利技术实施例提供的一种对语音文件内容进行标记的装置的结构示意图;图4是本专利技术另一实施例提供的一种对语音文件内容进行标记的装置的结构示意图;图5是本专利技术实施例提供的终端的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。参见图1,是本专利技术实施例提供一种对语音文件内容进行标记的方法的实现流程图,如图1所示对语音文件内容进行标记的方法可包括:S110:识别语音文件中的关键语音段。在步骤S110中,语音文件是对呼叫方和被叫方的通话过程进行录音得到的文件。关键语音段用于描述语音文件中有可能被作为服务质量测评参考的语音内容。需要说明的是,在本实施例中,识别语音文件中的关键语音段,具体可以是通过调用语音识别工具,将语音文件转换成文本文件,从文本文件中的内容识别出目标文字内容,根据该目标文字内容确定对应的关键语音段。还可以是将语音文件按照时间间隔进行分割和提取,进而识别出与目标时间段对应的关键语音段。可以理解的是,识别语音文件中的关键语音段可以是只包含被叫方语音的语音段,也可以是只包含主叫方语音的语音段,还可以是同时包含被叫方语音和主叫方语音的语音段。容易理解的是,当客户呼入时,客户为主叫方,客服为被叫方;当客服主动呼出时,客服为主叫方,客户为被叫方。至于何时识别语音文件中的关键语音段,可以包含但不仅限于以下三种场景。场景1:若检测到对语音业务进行服务质量抽查的预设操作,则识别所述语音文件中的关键语音段。例如,当检测到语音业务抽查方从目标数据库中获取语音文件时,识别所述语音文件中的关键语音段,其中,所述语音文件作为对语音业务进行服务质量抽查的依据。场景2:若检测到对语音文件进行抽查标记的操作指令,则识别所述语音文件中的关键语音段。例如,当检测到将该语音文件标记为对语音业务进行服务质量抽查的依据之一时,识别所述语音文件中的关键语音段。场景3:若检测到语音文件生成,则识别所述语音文件中的关键语音段。例如,在办理语音业务过程中对通话进行录音,并在语音业务结束后生成语音文件,当检测到语音文件生成时,则识别所述语音文件中的关键语音段;其中,是否检测到语音文件生成可以通过获取语音文件的默认名称或编号进行确定。需要说明的是,在检测到语音文件生成后,立即识别语音文件中的关键语音段,进而将识别过程分散化,避免集中识别导致的延时现象。可以理解的是,识别语音文件中的关键语音段还可以对语音文件进行语音内容分离,即,将主叫方的语音内容与被叫方的语音内容进行分离,分别从主叫方的语音内容中和被叫方的语音内容中识别出关键语音段。S120:获取所述关键语音段对应的语音参数。在步骤S120中,语音参数用于描述关键语音段的声学特征,获取语音参数可以通过获取关键语音段的声学波形图,通过对声学波形图进行参数提取,可以得到关键语音段对应的语音参数。需要说明的是,在本实施例中,由于关键语音段可以为一帧语音信号、两帧语音信号或者多帧语音信号组成的内容。例如,当关键语音段为关键字语音段时,获取所述关键语音段对应的语音参数可以是获取该关键语音段对应的一帧语音信号的语音参数。再例如,当关键语音段为关键词语音段或关键句语音段时,获取所述关键语音段对应的语音参数可以是获取该关键语音段对应的两帧语音信号或者多帧语音信号的语音参数。S130:根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段。在步骤S130中,目标语音段用于描述语音文件中作为服务质量测评参考的语音内容。需要说明的是,当语音参数比预设参数阈值大时,判断关键语音段为目标语音段。在语音文件中可能存在不和谐的语音内容,目标语音段包含所有不和谐的语音内容,预设参数阈值作为将该部分不和谐的语音内容筛选出来的标准,用于描述不和谐语音内容的具体特征参数。在本实施例中,根据预设参数阈值与语音参数的比较结果,判断关键语音段是否为目标语音段,即判断关键语音段是否为不和谐的语音内容。可以理解的是,当选择的语音参数不同时,预设参数阈值也不同,即预设参数阈值与语音参数类型一一对应。S140:若所述关键语音段为目标语音段,在所述语音文件中基于所述关键语音段进行标记。在步骤S140中,在所述语音文件中基于所述关键语音段进行标记,可以根据不同的标记模式在语音文件中以关键语音段的语音参数为依据进行标记。需要说明的是,作为可能实现的方式之一本文档来自技高网...
一种对语音文件内容进行标记的方法及装置

【技术保护点】
一种对语音文件内容进行标记的方法,其特征在于,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,则在所述语音文件中基于所述关键语音段进行标记。

【技术特征摘要】
1.一种对语音文件内容进行标记的方法,其特征在于,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,则在所述语音文件中基于所述关键语音段进行标记。2.如权利要求1所述的方法,其特征在于,所述识别语音文件中的关键语音段,包括:对所述语音文件进行文本识别,得到与所述语音文件对应的文本文件;从所述文本文件的内容中查找关键信息;将所述关键信息对应的语音段识别为所述关键语音段。3.如权利要求1所述的方法,其特征在于,所述识别语音文件中的关键语音段,包括:识别所述语音文件的语音起始时间点、语音中间时间点以及语音终止时间点;根据所述语音起始时间点、所述语音中间时间点以及所述语音终止时间点分别确定起始语音段、中间语段以及终止语段;将所述起始语音段、所述中间语段以及所述终止语段识别为所述关键语音段。4.如权利要求1至3任一项所述的方法,其特征在于,所述语音参数包括所述关键语音段的语音振幅平均值和/或语速值;所述获取所述关键语音段对应的语音参数,包括:获取所述关键语音段对应的语音振幅平均值和/或语速值;所述根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段,包括:若所述关键语音段的语音振幅平均值和/或语速值等于或大于所述预设参数阈值,则将所述关键语音段识别为目标语音段;若所述关键语音段的语音振幅平均值和/或语速值小于所述预设参数阈值,则不做任何操作。5.如权利要求3所述的方法,其特征在于,所述语音参数包括振幅差值的绝对值和/或振幅比值,其中,所述振幅差值的绝对值为所述起始语音段对应的第一振幅平均值与所述中间语段对应的第二振幅平均值或者所述终止语段对应的第三...

【专利技术属性】
技术研发人员:刘华松
申请(专利权)人:深圳市买买提乐购金融服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1