【技术实现步骤摘要】
一种干扰词生成方法、装置、电子设备和存储介质
本申请涉及计算机
,具体而言,涉及一种干扰词生成方法、装置、电子设备和存储介质。
技术介绍
随着科技的发展,科技给人们的日常生活带来了越来越多的娱乐项目,其中一种娱乐项目为猜字游戏,在进行猜字游戏时,需要给出一段有掩藏文字的语句,并给出掩藏文字的候选项,在现有技术中,对于每个掩藏文字都会得到多个候选选项,并且在给出干扰词时会将每个掩藏文字对应的候选选项进行组合,然后将得到的多个干扰词都推送给用户进行选择,通过上述方式给出的干扰词中有明显使语句不通顺的干扰词,从而使得给出的干扰词中迷惑性较低的干扰词的数量较多,从而降低了猜字游戏的娱乐性。
技术实现思路
有鉴于此,本申请实施例提供了一种干扰词生成方法、装置、电子设备和存储介质,以降低干扰词中迷惑性较低的干扰词的数量。第一方面,本申请实施例提供了一种干扰词生成方法,包括:获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。可 ...
【技术保护点】
1.一种干扰词生成方法,其特征在于,包括:/n获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;/n根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;/n根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;/n对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。/n
【技术特征摘要】 【专利技术属性】
1.一种干扰词生成方法,其特征在于,包括:
获取第一目标语句,所述第一目标语句中包含K个被掩藏的文字,其中,K为正整数;
根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度;
根据预设干扰词数量,从各第一候选文字列表构成的文字集合中选择对应数量的第一目标文字,所述第一目标文字是从各第一候选文字列表构成的文字集合所包含的第一候选文字中按照置信度由高到低的顺序选择出来的;
对于每个第一目标文字,根据该第一目标文字,得到所述第一目标语句对应的干扰词。
2.如权利要求1所述的干扰词生成方法,其特征在于,所述根据该第一目标文字,得到所述第一目标语句对应的干扰词,包括:
当K=1时,将该第一目标文字作为所述干扰词;
当K≥2时,根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字;按照该第一目标文字和所述目标文字在所述第一目标语句中的位置生成所述干扰词。
3.如权利要求2所述的干扰词生成方法,其特征在于,所述根据该第一目标文字和所述第一目标语句,得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字,包括:
根据该第一目标文字所在位置,将该第一目标文字添加到所述第一目标语句中,生成第二目标语句,所述第二目标语句包括K-1个被掩藏的文字;
将所述第二目标语句作为输入参数输入到BERT模型中,得到所述第二目标语句中被掩藏的文字所在的各个位置上的第二候选文字列表,以及每个第二候选文字列表中的各第二候选文字的置信度;
从各第二候选文字列表包括的第二候选文字中选择第二目标文字,其中,所述第二目标文字是各第二候选文字列表构成的文字集合所包含的第二候选文字中置信度最高的第二候选文字;
根据所述第二目标文字所在位置,将所述第二目标文字添加到所述第二目标语句中,生成第三目标语句,所述第二目标语句包括K-2个被掩藏的文字;
将所述第三目标语句作为输入参数输入到所述BERT模型中,得到所述第三目标语句中被掩藏的文字所在的各个位置上的第三候选文字列表,以及每个第三候选文字列表中的各第三候选文字的置信度;
从各第三候选文字列表包括的第三候选文字中选择第三目标文字,其中,所述第三目标文字是各第三候选文字列表构成的文字集合所包含的第三候选文字中置信度最高的第三候选文字,直至得到所述第一目标语句中除该第一目标文字所在位置之外的其他位置上的目标文字。
4.如权利要求1所述的干扰词生成方法,其特征在于,所述根据所述第一目标语句,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度,包括:
将所述第一目标语句作为输入参数输入到BERT模型中,得到所述第一目标语句中被掩藏的文字所在的各个位置上的第一候选文字列表,以及每个第一候选文字列表中的各第一候选文字的置信度。
技术研发人员:张林箭,王怡,张聪,毛晓曦,范长杰,胡志鹏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。