The invention is suitable for the technical field of speech file processing, and provides a method and device for marking the content of a voice file. Among them, including a method for marking the voice file content: critical discourse recognition in speech files, voice parameters and obtain the key speech segment, according to the preset parameter threshold and speech parameters comparison results to determine whether the target key speech speech, if key speech segments as target speech segments. Mark the voice file based on the key speech segment in checks on some recordings, according to the marker selection speech segments corresponding to the play, all without the need to play audio files, to avoid sampling personnel in the sampling process, due to fatigue or psychological conflict on the service quality score of the impact improve the efficiency of the voice file checks.
【技术实现步骤摘要】
一种对语音文件内容进行标记的方法及装置
本专利技术属于语音文件处理
,尤其涉及一种对语音文件内容进行标记的方法及装置。
技术介绍
在对呼叫中心的客服人员进行专业考核时,需要对客服人员的通话录音进行抽查。例如,从客服人员在某个季度内处理的所有来电中筛选若干通话录音进行抽查,以对客服人员的服务质量做出评价。目前,抽查过程中需要抽查人员听完所有被抽查的通话录音,进而给出服务质量评分。然而,抽查人员听了一段时间的通话录音后,容易疲劳和产生抵触心理,即容易影响服务质量评分的客观性和准确性,降低了语音文件抽查效率。
技术实现思路
有鉴于此,本专利技术实施例提供了一种对语音文件内容进行标记的方法及装置,以解决现有技术中的问题。本专利技术实施例的第一方面提供了一种对语音文件内容进行标记的方法,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,在所述语音文件中基于所述关键语音段进行标记。本专利技术实施例的第二方面提供了一种对语音文件内容进行标记的装置,包括用于执行第一方面所述方法的单元。本专利技术实施例的第三方面提供了一种终端,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现上述第一方案所述方法的步骤。本专利技术实施例通过识别语音文件中的关键语段,并获取该关键语音段对应的 ...
【技术保护点】
一种对语音文件内容进行标记的方法,其特征在于,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,则在所述语音文件中基于所述关键语音段进行标记。
【技术特征摘要】
1.一种对语音文件内容进行标记的方法,其特征在于,包括:识别语音文件中的关键语音段;获取所述关键语音段对应的语音参数;根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段;若所述关键语音段为目标语音段,则在所述语音文件中基于所述关键语音段进行标记。2.如权利要求1所述的方法,其特征在于,所述识别语音文件中的关键语音段,包括:对所述语音文件进行文本识别,得到与所述语音文件对应的文本文件;从所述文本文件的内容中查找关键信息;将所述关键信息对应的语音段识别为所述关键语音段。3.如权利要求1所述的方法,其特征在于,所述识别语音文件中的关键语音段,包括:识别所述语音文件的语音起始时间点、语音中间时间点以及语音终止时间点;根据所述语音起始时间点、所述语音中间时间点以及所述语音终止时间点分别确定起始语音段、中间语段以及终止语段;将所述起始语音段、所述中间语段以及所述终止语段识别为所述关键语音段。4.如权利要求1至3任一项所述的方法,其特征在于,所述语音参数包括所述关键语音段的语音振幅平均值和/或语速值;所述获取所述关键语音段对应的语音参数,包括:获取所述关键语音段对应的语音振幅平均值和/或语速值;所述根据预设参数阈值与所述语音参数的比较结果,判断所述关键语音段是否为目标语音段,包括:若所述关键语音段的语音振幅平均值和/或语速值等于或大于所述预设参数阈值,则将所述关键语音段识别为目标语音段;若所述关键语音段的语音振幅平均值和/或语速值小于所述预设参数阈值,则不做任何操作。5.如权利要求3所述的方法,其特征在于,所述语音参数包括振幅差值的绝对值和/或振幅比值,其中,所述振幅差值的绝对值为所述起始语音段对应的第一振幅平均值与所述中间语段对应的第二振幅平均值或者所述终止语段对应的第三...
【专利技术属性】
技术研发人员:刘华松,
申请(专利权)人:深圳市买买提乐购金融服务有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。