谎言识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:22076129 阅读:56 留言:0更新日期:2019-09-12 14:16
本申请公开了一种谎言识别方法及装置、存储介质、计算机设备,该方法包括:获取样本音频文件以及与样本音频文件对应的标签;将样本音频文件转换为文本文件;对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件;根据句子文本文件,构建句子文本文件对应的特征矩阵;根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的样本音频文件对应的标签;根据训练后的谎言识别模型,对待识别音频文件进行识别,得出与待识别音频文件对应的识别结果。本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别。

Lie Recognition Method and Device, Storage Media, Computer Equipment

【技术实现步骤摘要】
谎言识别方法及装置、存储介质、计算机设备
本申请涉及谎言识别
,尤其是涉及到一种谎言识别方法及装置、存储介质、计算机设备。
技术介绍
一直以来,如何识别一个人是否在说谎,在日常的生活生产中都是一个重要的问题。例如在银行、证券、保险、P2P等金融机构中,通过配备质检人员对服务人员与客户之间的通话内容进行监控识别,通过客户是否说谎以确定客户是否正在进行欺诈行为,以起到反欺诈目的。目前谎言识别领域中,对基于说话内容的谎言识别的研究尚在探索阶段,通常是通过这种人工质检的方式识别客户是否在进行欺诈作为,处理过程效率低,且需配备专业的质检人员,人工成本高。
技术实现思路
有鉴于此,本申请提供了一种谎言识别方法及装置、存储介质、计算机设备,能够依据说话者的说话内容,判断说话者是否说谎。根据本申请的一个方面,提供了一种获取样本音频文件以及与所述样本音频文件对应的标签;将所述样本音频文件转换为文本文件;对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。根据本申请的另一方面,提供了一种样本获取模块,用于获取样本音频文件以及与所述样本音频文件对应的标签;文件转换模块,用于将所述样本音频文件转换为文本文件;句子分割模块,用于对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;矩阵构建模块,用于根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;训练模块,用于根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;识别模块,用于根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述谎言识别方法。依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述谎言识别方法。借由上述技术方案,本申请提供的一种谎言识别方法及装置、存储介质、计算机设备,首先对样本音、视频文件进行文本文件转换,并对文本文件进行句子分割,从而构建每个句子的特征矩阵作为模型训练样本,然后利用得到的特征矩阵训练谎言识别模型,最后通过谎言识别模型对待识别的音频文件进行识别,判断待识别音频文件中的说话内容是否为谎言。本申请通过利用样本音频文件,构建句子特征矩阵,从而根据句子特征矩阵训练谎言识别模型实现谎言识别,相比于现有技术中的人工检验方式,本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别,识别效果更好,识别精度更高。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1示出了本申请实施例提供的一种谎言识别方法的流程示意图;图2示出了本申请实施例提供的另一种谎言识别方法的流程示意图;图3示出了本申请实施例提供的一种谎言识别装置的结构示意图;图4示出了本申请实施例提供的另一种谎言识别装置的结构示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。在本实施例中提供了一种谎言识别方法,如图1所示,该方法包括:步骤101,获取样本音频文件以及与样本音频文件对应的标签。本申请实施例通过谎言识别模型进行谎言识别,模型需要通过谎言样本进行训练,因此,为了建立训练样本,首先获取样本音频文件,及其对应的标签,标签具体可以包括谎言标签和非谎言标签,另外,除了音频文件外,样本文件还可以是视频文件。步骤102,将样本音频文件转换为文本文件。人在说谎时,说话内容、面部表情、肢体语言以及声音情绪等方面与说真话时都会有所区别,本申请实施例针对说话内容进行谎言的识别。获取到样本音频文件(或样本视频文件)后,将其转换为文本文件,以供后续利用样本文件中的说话内容以及对应的标签信息进行谎言模型的训练。步骤103,对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件。在本实施例中,按照文本文件中的标点信息,对文本文件进行句子分割处理,实现对文本文件的拆分,使得一份文本文件变为若干个句子文本文件,需要说明的是,每个句子文本文件对应的标签可以与其对应的文本文件的标签一致。另外,每个句子文本文件的标签也可以是专业人员参考样本音频文件的标签,对每个句子文本文件进行重新标注得到的。步骤104,根据句子文本文件,构建句子文本文件对应的特征矩阵。利用将文本文件拆分后得到的句子文本文件,分别对每个句子文本文件构建相应的特征矩阵,特征矩阵用以表达该句子的特征。步骤105,根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的谎言样本音频文件对应的标签。将句子文本文件的特征矩阵以及相应的标签信息作为训练样本,训练谎言识别模型,从而利用训练后的谎言识别模型实现谎言识别。步骤106,根据训练后的谎言识别模型,对待识别音频文件进行识别,得出与待识别音频文件对应的识别结果。针对待识别音频文件(或视频文件),可以按照上述的步骤102至步骤104中利用样本音频文件构建特征矩阵的方法,将待识别音频文件进行文本转换以及进一步的进行句子分割和句子特征矩阵,然后将句子特征矩阵分别输入至训练后的谎言识别模型中,根据待识别音频文件对应的每个句子的句子特征矩阵的识别结果,分析待识别音频文件是否为谎言。通过应用本实施例的技术方案,首先对样本音、视频文件进行文本文件转换,并对文本文件进行句子分割,从而构建每个句子的特征矩阵作为模型训练样本,然后利用得到的特征矩阵训练谎言识别模型,最后通过谎言识别模型对待识别的音频文件进行识别,判断待识别音频文件中的说话内容是否为谎言。本申请通过利用样本音频文件,构建句子特征矩阵,从而根据句子特征矩阵训练谎言识别模型实现谎言识别,相比于现有技术中,对说话内容中出现的词语进行分析判断说话内容是否为谎言,本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别,识别效果更好。进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种谎言识别方法,如图2所示,该方法包括:步骤201,获取样本音频文件以及与样本音频文件对应的标签。步骤202,解析样本音频文件,得到按照时间顺本文档来自技高网...

【技术保护点】
1.一种谎言识别方法,其特征在于,包括:获取样本音频文件以及与所述样本音频文件对应的标签;将所述样本音频文件转换为文本文件;对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。

【技术特征摘要】
1.一种谎言识别方法,其特征在于,包括:获取样本音频文件以及与所述样本音频文件对应的标签;将所述样本音频文件转换为文本文件;对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。2.根据权利要求1所述的方法,其特征在于,所述将所述谎言样本音频文件转换为文本文件,具体包括:解析所述样本音频文件,得到按照时间顺序排列的非空音频和空白音频;检测每一段所述空白音频的持续时长,并根据所述持续时长确定与每一段所述空白音频对应的空白标记;将每一段所述非空音频转换成对应的文本,并按照所述时间顺序将每一段所述非空音频对应的文本和每一段所述空白音频对应的空白标记进行排列,得到所述样本音频文件对应的所述文本文件。3.根据权利要求2所述的方法,其特征在于,所述根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵,具体包括:根据所述句子文本文件,提取所述句子文本文件对应的特征词以及所述空白标记;根据与所述特征词对应的特征词向量以及与所述空白标记对应的空白标记向量,构建所述句子文本文件的特征矩阵,其中,所述特征词向量与所述空白标记向量为预设向量维度。4.根据权利要求3所述的方法,其特征在于,所述根据与所述特征词对应的特征词向量以及与所述空白标记对应的空白标记向量,构建所述句子文本文件的特征矩阵,具体包括:计算所述特征词以及所述空白标记的总数量;若所述总数量大于或等于预设数量,则按照所述预设数量和所述特征词以及所述空白标记在所述句子文本文件中的先后顺序,截取所述句子文本文件对应的所述特征词以及所述空白标记,并根据截取后的所述特征词对应的特征词向量以及所述空白标记对应的空白标记向量,构建所述句子文本文件的特征矩阵;若所述总数量小于所述预设数量,则计算所述预设数量与所述总数量之差得到缺失数量,并根据与所述特征词对应的特征词向量、与所述空白标记对应的空白标记向量以及所述缺失数量的所述预设向量维度的0向量,构建所述句子文本文件的特征矩阵。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果,具体包括:将所述待识别音频文件转换为对应的待识别文本文件;按照所述待识别文本文件中的标点信息,对所述待识别文本文件进行句子分割处理,得到对应的待识别句子文本文件;根据所述待识别句子文本文件,构建所述待识别句子文本文件对应的待识别特征矩阵;分别将每个...

【专利技术属性】
技术研发人员:朱文和
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1