谎言识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号：22076129 阅读：56 留言：0更新日期：2019-09-12 14:16

本申请公开了一种谎言识别方法及装置、存储介质、计算机设备，该方法包括：获取样本音频文件以及与样本音频文件对应的标签；将样本音频文件转换为文本文件；对文本文件进行句子分割处理，得到与文本文件对应的句子文本文件；根据句子文本文件，构建句子文本文件对应的特征矩阵；根据特征矩阵以及特征矩阵对应的标签，训练谎言识别模型，其中，特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的样本音频文件对应的标签；根据训练后的谎言识别模型，对待识别音频文件进行识别，得出与待识别音频文件对应的识别结果。本申请利用句子特征矩阵进行模型训练，能够结合说话内容中的语序表达、语言组织特点实现谎言识别。

Lie Recognition Method and Device, Storage Media, Computer Equipment

全部详细技术资料下载

【技术实现步骤摘要】
谎言识别方法及装置、存储介质、计算机设备
本申请涉及谎言识别
，尤其是涉及到一种谎言识别方法及装置、存储介质、计算机设备。
技术介绍
一直以来，如何识别一个人是否在说谎，在日常的生活生产中都是一个重要的问题。例如在银行、证券、保险、P2P等金融机构中，通过配备质检人员对服务人员与客户之间的通话内容进行监控识别，通过客户是否说谎以确定客户是否正在进行欺诈行为，以起到反欺诈目的。目前谎言识别领域中，对基于说话内容的谎言识别的研究尚在探索阶段，通常是通过这种人工质检的方式识别客户是否在进行欺诈作为，处理过程效率低，且需配备专业的质检人员，人工成本高。
技术实现思路
有鉴于此，本申请提供了一种谎言识别方法及装置、存储介质、计算机设备，能够依据说话者的说话内容，判断说话者是否说谎。根据本申请的一个方面，提供了一种获取样本音频文件以及与所述样本音频文件对应的标签；将所述样本音频文件转换为文本文件；对所述文本文件进行句子分割处理，得到与所述文本文件对应的句子文本文件；根据所述句子文本文件，构建所述句子文本文件对应的特征矩阵；根据所述特征矩阵以及所述特征矩阵对应的标签，训练谎言识别模型，其中，所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签；根据训练后的所述谎言识别模型，对待识别音频文件进行识别，得出与所述待识别音频文件对应的识别结果。根据本申请的另一方面，提供了一种样本获取模块，用于获取样本音频文件以及与所述样本音频文件对应的标签；文件转换模块，用于将所述样本音频文件转换为文本文件；句子分割模块，用于对所述文本文件进行句...

【技术保护点】
1.一种谎言识别方法，其特征在于，包括：获取样本音频文件以及与所述样本音频文件对应的标签；将所述样本音频文件转换为文本文件；对所述文本文件进行句子分割处理，得到与所述文本文件对应的句子文本文件；根据所述句子文本文件，构建所述句子文本文件对应的特征矩阵；根据所述特征矩阵以及所述特征矩阵对应的标签，训练谎言识别模型，其中，所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签；根据训练后的所述谎言识别模型，对待识别音频文件进行识别，得出与所述待识别音频文件对应的识别结果。

【技术特征摘要】
1.一种谎言识别方法，其特征在于，包括：获取样本音频文件以及与所述样本音频文件对应的标签；将所述样本音频文件转换为文本文件；对所述文本文件进行句子分割处理，得到与所述文本文件对应的句子文本文件；根据所述句子文本文件，构建所述句子文本文件对应的特征矩阵；根据所述特征矩阵以及所述特征矩阵对应的标签，训练谎言识别模型，其中，所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签；根据训练后的所述谎言识别模型，对待识别音频文件进行识别，得出与所述待识别音频文件对应的识别结果。2.根据权利要求1所述的方法，其特征在于，所述将所述谎言样本音频文件转换为文本文件，具体包括：解析所述样本音频文件，得到按照时间顺序排列的非空音频和空白音频；检测每一段所述空白音频的持续时长，并根据所述持续时长确定与每一段所述空白音频对应的空白标记；将每一段所述非空音频转换成对应的文本，并按照所述时间顺序将每一段所述非空音频对应的文本和每一段所述空白音频对应的空白标记进行排列，得到所述样本音频文件对应的所述文本文件。3.根据权利要求2所述的方法，其特征在于，所述根据所述句子文本文件，构建所述句子文本文件对应的特征矩阵，具体包括：根据所述句子文本文件，提取所述句子文本文件对应的特征词以及所述空白标记；根据与所述特征词对应的特征词向量以及与所述空白标记对应的空白标记向量，构建所述句子文本文件的特征矩阵，其中，所述特征词向量与所述空白标记向量为预设向量维度。4.根据权利要求3所述的方法，其特征在于，所述根据与所述特征词对应的特征词向量以及与所述空白标记对应的空白标记向量，构建所述句子文本文件的特征矩阵，具体包括：计算所述特征词以及所述空白标记的总数量；若所述总数量大于或等于预设数量，则按照所述预设数量和所述特征词以及所述空白标记在所述句子文本文件中的先后顺序，截取所述句子文本文件对应的所述特征词以及所述空白标记，并根据截取后的所述特征词对应的特征词向量以及所述空白标记对应的空白标记向量，构建所述句子文本文件的特征矩阵；若所述总数量小于所述预设数量，则计算所述预设数量与所述总数量之差得到缺失数量，并根据与所述特征词对应的特征词向量、与所述空白标记对应的空白标记向量以及所述缺失数量的所述预设向量维度的0向量，构建所述句子文本文件的特征矩阵。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据训练后的所述谎言识别模型，对待识别音频文件进行识别，得出与所述待识别音频文件对应的识别结果，具体包括：将所述待识别音频文件转换为对应的待识别文本文件；按照所述待识别文本文件中的标点信息，对所述待识别文本文件进行句子分割处理，得到对应的待识别句子文本文件；根据所述待识别句子文本文件，构建所述待识别句子文本文件对应的待识别特征矩阵；分别将每个...

【专利技术属性】
技术研发人员：朱文和，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人