【技术实现步骤摘要】
文本记录处理方法及装置
本申请涉及计算机
,特别是涉及一种文本记录处理方法及装置。
技术介绍
嫌疑人在接受公安民警讯问的过程中有时候会在案件的关键信息上有意撒谎,企图欺骗民警,逃避惩罚,给讯问增加难度。为了识别嫌疑人在讯问过程中是否撒谎,公安民警会对同一嫌疑人进行多次讯问,或者,对于与同一案件相关联的至少两个嫌疑人分别审讯,并在每一次的讯问过程中公安民警会人工记录嫌疑人交代的作案内容作为笔录,之后人工对比多份笔录是否相同来确定嫌疑人是否撒谎。然而,专利技术人发现,当笔录中记录的作案内容较多时,往往需要安排多个公安民警人工对比多份笔录且每一个公安民警在对比笔录时需要耗费较多的精力,导致人工成本较高。
技术实现思路
为解决上述技术问题,本申请实施例示出了一种文本记录处理方法及装置。第一方面,本申请实施例示出了一种文本记录处理方法,所述方法包括:获取在讯问第一嫌疑人的第一讯问过程中生成的第一文本记录,提取所述第一文本记录中的第一文本内容;获取在讯问第二嫌疑人的第二讯问过程中生成的第二文本记录,提取所述第二文本记录中的第二文本内容,所述第二嫌疑人包括第一嫌疑人或所犯案件与所述第一嫌疑人所犯案件相关联的嫌疑人;根据所述第一文本内容和所述第二文本内容确定所述第一文本记录与所述第二文本记录之间的相似度。在一个可选的实现方式中,所述第一文本记录包括在讯问所述第一嫌疑人的当前询问过程中生成的当前口供文本记录;所述第二文本记录包括在讯问所述第二嫌疑 ...
【技术保护点】
1.一种文本记录处理方法,其特征在于,所述方法包括:/n获取在讯问第一嫌疑人的第一讯问过程中生成的第一文本记录,提取所述第一文本记录中的第一文本内容;/n获取在讯问第二嫌疑人的第二讯问过程中生成的第二文本记录,提取所述第二文本记录中的第二文本内容,所述第二嫌疑人包括第一嫌疑人或所犯案件与所述第一嫌疑人所犯案件相关联的嫌疑人;/n根据所述第一文本内容和所述第二文本内容确定所述第一文本记录与所述第二文本记录之间的相似度。/n
【技术特征摘要】
1.一种文本记录处理方法,其特征在于,所述方法包括:
获取在讯问第一嫌疑人的第一讯问过程中生成的第一文本记录,提取所述第一文本记录中的第一文本内容;
获取在讯问第二嫌疑人的第二讯问过程中生成的第二文本记录,提取所述第二文本记录中的第二文本内容,所述第二嫌疑人包括第一嫌疑人或所犯案件与所述第一嫌疑人所犯案件相关联的嫌疑人;
根据所述第一文本内容和所述第二文本内容确定所述第一文本记录与所述第二文本记录之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述第一文本记录包括在讯问所述第一嫌疑人的当前询问过程中生成的当前口供文本记录;
所述第二文本记录包括在讯问所述第二嫌疑人的历史询问过程中生成的历史口供文本记录。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述相似度小于或等于预设阈值,则确定所述第一嫌疑人在所述第一讯问过程中存在撒谎的可能;
如果所述相似度大于预设阈值,则确定所述第一嫌疑人在所述第一讯问过程中不存在撒谎的可能。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述相似度小于或等于预设阈值,获取所述第一文本内容与所述第二文本内容之间不同的内容。
5.根据权利要求1所述的方法,其特征在于,所述获取在讯问第一嫌疑人的第一讯问过程中生成的第一文本记录,包括:
获取在讯问所述第一嫌疑人的第一讯问过程中录制的第一录音;
对所述第一录音进行语音识别,得到所述第一文本记录。
6.根据权利要求1所述的方法,其特征在于,所述提取所述第一文本记录中的第一文本内容,包括:
提取所述第一文本记录中的第一实体、所述第一实体之间的第一关系,以及基于所述第一实体和/或所述第一关系而发生的第一事件;
根据所述第一实体、所述第一关系以及所述第一事件确定所述第一文本内容。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一实体、所述第一关系以及所述第一事件确定所述第一文本内容,包括:
判断所述第一实体是否符合预设规范化描述规则;
如果所述第一实体不符合预设规范化描述规则,则将所述第一实体转换为符合规范化描述规则的规范实体;
根据所述规范实体、所述第一关系以及所述第一事件确定所述第一文本内容。
8.根据权利要求6所述的方法,其特征在于,所述根据所述第一实体、所述第一关系以及所述第一事件确定所述第一文本内容,包括:
确定所述第一嫌疑人所犯的案件;
在所述案件的预设实体关系库中查找所述第一实体所涉及的、与所述第一关系不同的第三关系,所述预设实体关系库中存储了根据第二讯问过程而总结出的、触犯所述案件的各个实体之间的关系;
根据所述第一实体、所述第一关系、所述第三关系以及所述第一事件确定所述第一文本内容。
9.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本内容和所述第二文本内容确定所述第一文本记录与所述第二文本记录之间的相似度,包括:
确定所述第一关系的关系类型与所述第二关系的关系类型是否相同;
如果所述第一关系的关系类型与所述第二关系的关系类型不同,则将所述相似度设置为第一相似度;
如果所述第一关系的关系类型与所述第二关系的关系类型相同,则确定所述第一实体与所述第二实体是否相同,如果所述第一实体与所述第二实体不同,则将所述相似度设置为所述第一相似度,如果所述第一实体与所述第二实体相同,则将所述相似度设置为第二相似度,所述第二相似度大于所述第一相似度。
10.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本内容和所述第二文本内容确定所述第一文本记录与所述第二文本记录之间的相似度,包括:
根据所述第一实体、所述第一关系以及所述第一事件构建第一图谱;
根据所述第二实体、所述第二关系以及所述第二事件构建第二图谱;
确定所述第一图谱与所述第二谱图之间的相似度,并作为所述第一文本记录与所述第二文本记录之间的相似度。
11.一种文本记录处理装置,其特征在于,所述装置包括:
第一...
【专利技术属性】
技术研发人员:王潇斌,谢朋峻,马春平,李林琳,司罗,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。