【技术实现步骤摘要】
输入信息的信息有效性验证方法、装置、设备及存储介质
[0001]本申请涉及自然语言处理
,尤其涉及一种输入信息的信息有效性验证方法、装置、电子设备及存储介质。
技术介绍
[0002]在自然语言处理任务中,经常遇到需要验证两个文本信息的相似性,例如,判断两篇文章是否相似,在问答系统中,当问题相似时,系统直接返回准备好的答案;在监控新闻稿件在互联网中的传播情况时,把所有和原创稿件相似的文章,都看作转发,进而刻画原创稿件相似的文章都看作转发等场景。通过判断两个文本的相似性,用来搜索信息、文本纠错等。
[0003]在某些场景中,通过判断两个文本的相似性验证数据有效性,用于对输入信息的有效性验证时,对于两个文本的相似性的判断的准确率要求更高。
技术实现思路
[0004]本申请提供一种输入信息的信息有效性验证方法、装置、电子设备及存储介质,以提高输入信息的验证的准确率问题。本申请的技术方案如下:
[0005]根据本申请实施例的第一方面,提供一种输入信息的信息有效性验证方法,包括:
[0006 ...
【技术保护点】
【技术特征摘要】
1.一种输入信息的信息有效性验证方法,其特征在于,包括:从所述输入信息中获取第一文本以及获取对应的校验文本;获取所述第一文本和所述校验文本各自的字符串长度,并确定最大长度值N,其中,N为正整数;根据字符间距从0到N
‑
1,获取所述第一文本和所述校验文本的各自的N类向量数据,其中,每类所述向量数据包括满足该类向量数据的字符间距的字符或字符组合以及该字符或字符组合对应的权重信息;基于所述第一文本和所述校验文本各自的N类向量数据,计算所述第一文本与所述校验文本之间的相似度;基于所述相似度和预设阈值,返回所述输入信息的信息有效性验证结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本和所述校验文本各自的N类向量数据,计算所述第一文本与所述校验文本之间的相似度,包括:获取所述第一文本的N类向量数据与所述校验文本的N类向量数据之中的相同类向量数据之间的交集和并集,最终得到N个交集和N个并集;提取所述N个交集中的字符或字符组合的权重信息进行求和,得到第一数值;提取所述N个并集中的字符或字符组合的权重信息进行求和,得到第二数值;求解所述第一数值与所述第二数值的商,将所述商作为相似度。3.根据权利要求1所述的方法,其特征在于,所述权重信息包括权重参数和字符间距。4.根据权利要求1所述的方法,其特征在于,所述从输入信息中获取第一文本以及获取对应的校验文本,包括:接收用户根据业务需求的提示信息输入的语音;将所述语音转换为文本,并将所述文本拆成多个短句;将所述短句作为第一文本;获取根据所述业务需求预先产生的多个校验短句,并从所述多个校验短句中获取当前校验短句作为校验文本。5.根据权利要求1所述的方法,其特征在于,所述基于所述相似度和预设阈值,返回所述输入信息的信息有效性验证结果,包括:响应于所述相似度满足预设阈值范围,返回验证成功;响应于所述相似度不满足预设阈值范围,返回验证失败。6.一种输入信息的信息有效性验证装置,其特征在于,包括:第一获取模块,被配置为从输入信息中获取第一文本以及获取对应的校验文本;第二获取模块,被配置为获取所...
【专利技术属性】
技术研发人员:李胤文,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。