答案的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:36732267 阅读:18 留言:0更新日期:2023-03-04 10:00
本公开公开了一种答案的生成方法、装置、设备及存储介质,涉及数据处理技术领域,具体实现方案为:获取待处理的目标题目,其中,目标题目中包含中文字符及拼音字符串;将拼音字符串中的拼音字符单元分别与拼音词典中各参考拼音单元进行匹配,以确定拼音字符单元对应的匹配度;根据匹配度,将目标题目进行切分,以获取输入序列;利用预设的语言模型,对输入序列进行处理,以获取所述拼音字符串对应的中文序列。由此,通过利用语言模型对拼音类题目对应的序列进行处理来获取题目中的拼音对应的中文字符,从而使得生成的答案充分考虑了目标题目的上下文,提高生成的答案的精确性,而且不需要提前将题目录入题库,节省了很大的人力成本。本。本。

【技术实现步骤摘要】
答案的生成方法、装置、设备及存储介质


[0001]本公开涉及数据处理
,具体涉及一种答案的生成方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的不断发展,利用信息化手段提高作业批改效率成为技术趋势。相关技术中,大部分的批改都是基于搜索的,通过将在题库里找到问题的答案,跟用户提供的答案进行比对,得到批改结果。即对题目的批改完全依赖于题库的规模,而由于题库里的题目需要经过人工录题,校对等处理才能供线上使用,故题库的更新过程周期较长,这就导致了基于题库确定题目答案的方式,不仅效率低,而且成本高。

技术实现思路

[0003]本公开提供了一种答案的生成方法、装置、设备以及存储介质。
[0004]根据本公开的第一方面,提供了一种答案的生成方法,包括:
[0005]获取待处理的目标题目,其中,所述目标题目中包含中文字符及拼音字符串;
[0006]将所述拼音字符串中的拼音字符单元分别与拼音词典中各参考拼音单元进行匹配,以确定所述拼音字符对应的匹配度;
[0007]根据所述匹配度,将所述目标题目进行切分,以获取输入序列;
[0008]利用预设的语言模型,对所述输入序列进行处理,以获取所述拼音字符串对应的答案。
[0009]根据本公开的第二方面,提供了一种答案的生成装置,包括:
[0010]获取模块,用于获取待处理的目标题目,其中,所述目标题目中包含中文字符及拼音字符串;
[0011]第一确定模块,用于将所述拼音字符串中的拼音字符单元分别与拼音词典中各参考拼音单元进行匹配,以确定所述拼音字符对应的匹配度;
[0012]第二获取模块,用于根据所述匹配度,将所述目标题目进行切分,以获取输入序列;
[0013]第三获取模块,用于利用预设的语言模型,对所述输入序列进行处理,以获取所述拼音字符串对应的答案。
[0014]可选的,所述第二获取模块,包括:
[0015]第一确定单元,用于根据所述匹配度,确定所述拼音字符串对应的切分单元;
[0016]第一获取单元,用于基于所述切分单元,将所述目标题目中的拼音字符串进行切分,以获取输入序列。
[0017]可选的,所述第一确定单元,具体用于:
[0018]在任一拼音字符单元对应的匹配度小于第一阈值的情况下,将所述任一拼音字符单元用预设的掩码替换,且所述掩码为切分单元;
[0019]在任一拼音字符单元对应的匹配度大于或等于所述第一阈值的情况下,确定所述任一拼音字符单元为切分单元。
[0020]可选的,所述拼音词典中包括拼音字符串对应的中文字符串,所述第三获取模块,包括:
[0021]第二获取单元,用于在所述目标题目中多个相邻的拼音字符单元,与所述拼音词典中的任一拼音字符串间的匹配度大于第二阈值的情况下,获取所述任一拼音字符串对应的中文字符串;
[0022]更新单元,用于基于所述中文字符串,对所述答案中所述多个相邻的拼音字符单元对应的中文字符进行更新。
[0023]可选的,所述更新单元,具体用于:
[0024]在所述中文字符串为多个的情况下,确定所述中文序列中每个中文字符的置信度;
[0025]基于置信度最高的中文字符所在的中文字符串,对所述答案中所述多个相邻的拼音字符单元对应的中文字符进行更新。
[0026]可选的,所述第一获取模块,具体用于:
[0027]接收题目批改请求,其中,所述批改请求中包括所述目标题目及答案数据;
[0028]基于所述目标题目中的中文字符及拼音字符串检索预设的题目库,在确定所述预设的题目库中未包含所述目标题目的情况下,确定所述目标题目为待处理的题目。
[0029]可选的,该装置,还包括:
[0030]处理模块,用于将所述目标题目及所述拼音字符串对应的答案关联存入所述预设的题目库中。
[0031]根据本公开的第三方面,提供了一种电子设备,包括:
[0032]至少一个处理器;以及
[0033]与所述至少一个处理器通信连接的存储器;其中,
[0034]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的方法。
[0035]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其上存储有计算机程序,所述计算机指令用于使所述计算机执行上述一方面实施例所述的方法。
[0036]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述一方面实施例所述的方法。
[0037]本公开实施例中,首先获取待处理的目标题目,其中,目标题目中包含中文字符及拼音字符串,然后将拼音字符串中的拼音字符单元分别与拼音词典中各参考拼音单元进行匹配,以确定拼音字符单元对应的匹配度,之后根据匹配度,将目标题目进行切分,以获取输入序列,最后利用预设的语言模型,对输入序列进行处理,以获取拼音字符串对应的答案。由此,通过利用语言模型对拼音类题目对应的序列进行处理来获取题目中的拼音对应的中文字符,从而使得生成的答案充分考虑了目标题目的上下文,提高生成的答案的精确性,而且不需要提前将题目录入题库,节省了很大的人力成本。
[0038]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0039]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0040]图1是根据本公开提供的一种答案的生成方法的流程示意图;
[0041]图2是根据本公开提供的另一种答案的生成方法的流程示意图;
[0042]图3为本公开提供的一种答案的生成装置的结构框图;
[0043]图4为本公开提供的电子设备的结构框图。
具体实施方式
[0044]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0045]本公开提供的一种答案的生成方法,该方法可以由本公开提供的一种答案的生成装置执行,也可以由本公开提供的电子设备执行,其中,电子设备可以包括但不限于手机、台式电脑、平板电脑等终端设备,下面以由本公开提供的答案的生成装置来执行本公开提供的一种答案的生成方法,而不作为对本公开的限定,以下简称为“装置”。
[0046]下面结合参考附图对本公开提供的答案的生成方法、装置、计算机设备及存储介质进行详细描述。
[0047]图1是根据本公开一实施例的一种答案的生成方法的流程示意图。
[0048]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案的生成方法,其特征在于,包括:获取待处理的目标题目,其中,所述目标题目中包含中文字符及拼音字符串;将所述拼音字符串中的拼音字符单元分别与拼音词典中各参考拼音单元进行匹配,以确定所述拼音字符单元对应的匹配度;根据所述匹配度,将所述目标题目进行切分,以获取输入序列;利用预设的语言模型,对所述输入序列进行处理,以获取所述拼音字符串对应的答案。2.如权利要求1所述的方法,其特征在于,所述根据所述匹配度,将所述目标题目进行切分,以获取输入序列,包括:根据所述匹配度,确定所述拼音字符串对应的切分单元;基于所述切分单元,将所述目标题目中的拼音字符串进行切分,以获取输入序列。3.如权利要求2所述的方法,其特征在于,所述根据所述匹配度,确定所述拼音字符串对应的切分单元,包括:在任一拼音字符单元对应的匹配度小于第一阈值的情况下,将所述任一拼音字符单元用预设的掩码替换,且所述掩码为切分单元;在任一拼音字符单元对应的匹配度大于或等于所述第一阈值的情况下,确定所述任一拼音字符单元为切分单元。4.如权利要求1所述的方法,其特征在于,所述拼音词典中包括拼音字符串对应的中文字符串,在所述获取所述拼音字符串对应的答案之后,还包括:在所述目标题目中多个相邻的拼音字符单元,与所述拼音词典中的任一拼音字符串间的匹配度大于第二阈值的情况下,获取所述任一拼音字符串对应的中文字符串;基于所述中文字符串,对所述答案中所述多个相邻的拼音字符单元对应的中文字符进行更新。5.如权利要求4所述的方法,其特征在于,所述基于所述中文字符串,对所述答案中所述多个相邻的拼音字符单元对应的中文字符进行更新,包括:在所述中文字符串为多个的情况下,确定所述答案中每个中文字符的置信...

【专利技术属性】
技术研发人员:赵薇柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1