一种干扰词生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:24854792 阅读:56 留言:0更新日期:2020-07-10 19:08
本申请提供了一种干扰词生成方法、装置、电子设备和存储介质,其中,该方法包括:获取第一目标语句,第一目标语句中包含K个被掩藏的文字;根据第一目标语句,得到第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;根据预设干扰词数量,从各第一候选文字列表中选择对应数量的第一目标文字;对于每个第一目标文字,根据该第一目标文字,得到第一目标语句对应的干扰词,通过上述方法,有利于减少生成的干扰词的数量,以及生成迷惑性相对较高的干扰词。

【技术实现步骤摘要】
一种干扰词生成方法、装置、电子设备和存储介质
本申请涉及计算机
,具体而言,涉及一种干扰词生成方法、装置、电子设备和存储介质。
技术介绍
随着科技的发展,科技给人们的日常生活带来了越来越多的娱乐项目,其中一种娱乐项目为猜字游戏,在进行猜字游戏时,需要给出一段有掩藏文字的语句,并给出掩藏文字的候选项,在现有技术中,对于每个掩藏文字都会得到多个候选选项,并且在给出干扰词时会将每个掩藏文字对应的候选选项进行组合,然后将得到的多个干扰词都推送给用户进行选择,通过上述方式给出的干扰词中有明显使语句不通顺的干扰词,从而使得给出的干扰词中迷惑性较低的干扰词的数量较多,从而降低了猜字游戏的娱乐性。
技术实现思路
有鉴于此,本申请实施例提供了一种干扰词生成方法、装置、电子设备和存储介质,以降低干扰词中迷惑性较低的干扰词的数量。第一方面,本申请实施例提供了一种干扰词生成方法,包括:获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。可选地,所述根据该第一目标文字,得到所述第一目标语句对应的干扰词,包括:当K=1时,将该第一目标文字作为所述干扰词;当K≥2时,根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字;按照该第一目标文字和所述目标文字在所述第一目标语句中的位置生成所述干扰词。可选地,所述根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字,包括:根据该第一目标文字所在位置,将该第一目标文字添加到所述第一目标语句中,生成第二目标语句,所述第二目标语句包括K-1个被掩藏的文字;将所述第二目标语句作为输入参数输入到BERT模型中,得到所述第二目标语句中被掩藏的文字所在的各个位置上的第二候选文字列表,以及每个第二候选文字列表中的各第二候选文字的置信度;从各第二候选文字列表包括的第二候选文字中选择第二目标文字,其中,所述第二目标文字是各第二候选文字列表构成的文字集合所包含的第二候选文字中置信度最高的第二候选文字;根据所述第二目标文字所在位置,将所述第二目标文字添加到所述第二目标语句中,生成第三目标语句,所述第二目标语句包括K-2个被掩藏的文字;将所述第三目标语句作为输入参数输入到所述BERT模型中,得到所述第三目标语句中被掩藏的文字所在的各个位置上的第三候选文字列表,以及每个第三候选文字列表中的各第三候选文字的置信度;从各第三候选文字列表包括的第三候选文字中选择第三目标文字,其中,所述第三目标文字是各第三候选文字列表构成的文字集合所包含的第三候选文字中置信度最高的第三候选文字,直至得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字。可选地,所述根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度,包括:将所述第一目标语句作为输入参数输入到BERT模型中,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度。可选地,所述方法还包括:获取待掩藏语句;按照指定掩藏位置,对所述待掩藏语句中的文字进行掩藏,得到所述第一目标语句。可选地,所述方法还包括:获取第一待掩藏语句;对所述第一待掩藏语句进行分词处理,得到所述第一待掩藏语句包括的各个词语;对于每个词语,对该词语进行词性分析,得到该词语的词性;根据该词语的词性和预设词语掩藏数量,对所述第一待掩藏语句中的指定词性对应的词语进行掩藏,得到所述第一目标语句。可选地,所述根据该词语的词性和预设词语掩藏数量,对所述第一待掩藏语句中的指定词性对应的词语进行掩藏,得到所述第一目标语句,包括:根据该词语的词性,对所述第一待掩藏语句中的各个词语进行标记,其中,所述指定词性对应的词语使用第一标识进行标记,非指定词性对应的词语和标点符号使用第二标识进行标记,与同一非指定词性的词语相邻的两个指定词性的词语使用不同的第一标识进行标记;将所述第一待掩藏语句作为输入参数输入到掩藏语言模型中,对属于所述指定词性的词语中的文字进行掩藏,得到包含有目标掩藏文字的第二待掩藏语句;根据标记后的第一待掩藏语句和所述第二待掩藏语句,对所述第二待掩藏语句中与所述目标掩藏文字具有相同标记且相邻的文字进行掩藏,得到所述第一目标语句。可选地,所述方法还包括:对得到的干扰词和标准干扰词组成的干扰词集合进行去重处理,得到待输出干扰词;对所述待输出干扰词进行输出显示。第二方面,本申请实施例提供了一种干扰词生成装置,包括:获取单元,用于获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;确定单元,用于根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;选择单元,用于根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;处理单元,用于对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。可选地,所述处理单元的配置在用于根据该第一目标文字,得到所述第一目标语句对应的干扰词时,包括:当K=1时,将该第一目标文字作为所述干扰词;当K≥2时,根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字;按照该第一目标文字和所述目标文字在所述第一目标语句中的位置生成所述干扰词。可选地,所述处理单元的配置在用于根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字时,包括:根据该第一目标文字所在位置,将该第一目标文字添加到所述第一目标语句中,生成第二目标语句,所述第二目标语句包括K-1个被掩藏的文字;将所述第二目标语句作为输入参数输入到BERT模型中,得到所述第二目标语句中被掩藏的文字所在的各个位置上的第二候选文字列表,以及每个第二候选文字列本文档来自技高网...

【技术保护点】
1.一种干扰词生成方法,其特征在于,包括:/n获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;/n根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;/n根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;/n对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。/n

【技术特征摘要】
1.一种干扰词生成方法,其特征在于,包括:
获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;
根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;
根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;
对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。


2.如权利要求1所述的干扰词生成方法,其特征在于,所述根据该第一目标文字,得到所述第一目标语句对应的干扰词,包括:
当K=1时,将该第一目标文字作为所述干扰词;
当K≥2时,根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字;按照该第一目标文字和所述目标文字在所述第一目标语句中的位置生成所述干扰词。


3.如权利要求2所述的干扰词生成方法,其特征在于,所述根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字,包括:
根据该第一目标文字所在位置,将该第一目标文字添加到所述第一目标语句中,生成第二目标语句,所述第二目标语句包括K-1个被掩藏的文字;
将所述第二目标语句作为输入参数输入到BERT模型中,得到所述第二目标语句中被掩藏的文字所在的各个位置上的第二候选文字列表,以及每个第二候选文字列表中的各第二候选文字的置信度;
从各第二候选文字列表包括的第二候选文字中选择第二目标文字,其中,所述第二目标文字是各第二候选文字列表构成的文字集合所包含的第二候选文字中置信度最高的第二候选文字;
根据所述第二目标文字所在位置,将所述第二目标文字添加到所述第二目标语句中,生成第三目标语句,所述第二目标语句包括K-2个被掩藏的文字;
将所述第三目标语句作为输入参数输入到所述BERT模型中,得到所述第三目标语句中被掩藏的文字所在的各个位置上的第三候选文字列表,以及每个第三候选文字列表中的各第三候选文字的置信度;
从各第三候选文字列表包括的第三候选文字中选择第三目标文字,其中,所述第三目标文字是各第三候选文字列表构成的文字集合所包含的第三候选文字中置信度最高的第三候选文字,直至得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字。


4.如权利要求1所述的干扰词生成方法,其特征在于,所述根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度,包括:
将所述第一目标语句作为输入参数输入到BERT模型中,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度。

【专利技术属性】
技术研发人员:张林箭王怡张聪毛晓曦范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1