一种信息确定方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:39255662 阅读:10 留言:0更新日期:2023-10-30 12:07
本申请实施例公开了一种信息确定方法,该方法包括:获取待检测影视文本信息,目标文本检索模型中存在与待检测影视文本信息匹配的第一文本信息的情况下,基于第一文本信息确定目标文本信息;其中,目标文本检索模型中包括影视实体文本;在目标文本检索模型中不存在与待检测影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对待检测影视文本信息进行处理,确定目标文本信息。本申请实施例还公开了一种信息确定设备及计算机可读存储介质。储介质。储介质。

【技术实现步骤摘要】
一种信息确定方法、装置、设备及计算机可读存储介质


[0001]本申请涉及信息技术应用领域,尤其涉及一种信息确定方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]点播任务是采用实体识别技术从用户的语音文本中提取正确的实体名称 (即影视名称)等信息,并进行点播下发至用户。目前,常采用双向长短时记忆网络和条件随机场构建的神经网络识别模型进行影视名称识别,再采用由多音字和易错字构建的混淆数据集对识别的影视名称进行纠错,以此来实现点播任务。但是,传统的方法仅采用双向长短时记忆网络和条件随机场构建的神经网络识别模型对影视名称进行检测,并未考虑影视名称中出现多字的情况,导致对影视名称的识别准确率较低的问题。

技术实现思路

[0003]为解决上述技术问题,本申请实施例期望提供一种信息确定方法、装置、设备及计算机可读存储介质,可以解决相关技术中对影视名称进行检测时未考虑影视名称中出现多字的情况,导致对影视名称识别的准确率较低的问题,从而提高了待检测影视文本信息的识别准确率。
[0004]本申请的技术方案是这样实现的:
[0005]一种信息确定方法,所述方法包括:
[0006]获取待检测影视文本信息;
[0007]在目标文本检索模型中存在与所述待检测影视文本信息匹配的第一文本信息的情况下,基于所述第一文本信息确定目标文本信息;其中,所述目标文本检索模型中包括影视实体文本;
[0008]在所述目标文本检索模型中不存在与所述待检测影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对所述待检测影视文本信息进行处理,确定所述目标文本信息。
[0009]上述方案中,所述基于所述第一文本信息确定目标文本信息,包括:
[0010]确定所述待检测影视文本信息与所述第一文本信息之间的文本相似度;
[0011]基于所述文本相似度和所述第一文本信息,确定所述目标文本信息。
[0012]上述方案中,所述确定所述待检测影视文本信息与所述第一文本信息之间的文本相似度,包括:
[0013]确定对所述待检测影视文本信息的操作次数;
[0014]确定所述待检测影视文本信息和所述第一文本信息的文本总字数;
[0015]基于所述操作次数和所述文本总字数,确定所述文本相似度。
[0016]上述方案中,所述基于目标文本纠错模型对所述待检测影视文本信息进行处理,确定目标文本信息,包括:
[0017]基于所述目标文本纠错模型对所述待检测影视文本信息进行处理,得到候选文本信息;
[0018]基于所述目标文本检索模型和所述候选文本信息,确定所述目标文本信息。
[0019]上述方案中,所述基于所述目标文本纠错模型对所述待检测影视文本信息进行处理,得到候选文本信息,包括:
[0020]采用所述目标文本纠错模型对所述待检测文本信息进行特征提取,得到多个第二文本信息;
[0021]采用目标函数对每一所述第二文本信息进行处理,得到所述每一第二文本信息对应的概率;
[0022]基于所述概率和所述第二文本信息,得到所述候选文本信息。
[0023]上述方案中,所述基于所述概率和所述第二文本信息,得到所述候选文本信息,包括:
[0024]针对所述每一第二文本信息,将所述概率与目标概率进行比较;
[0025]基于比较结果从所述第二文本信息中筛选所述概率大于所述目标概率的文本信息,得到所述候选文本信息。
[0026]上述方案中,所述基于所述目标文本检索模型和所述候选文本信息,确定所述目标文本信息,包括:
[0027]基于所述候选文本信息确定目标候选文本信息;
[0028]在所述目标文本检索模型中存在与所述目标候选文本信息匹配的第三文本信息的情况下,基于所述第三文本信息确定所述目标文本信息;
[0029]在所述目标文本检索模型中不存在与所述目标候选文本信息匹配的所述第三文本信息的情况下,确定所述待检测影视文本信息为所述目标文本信息。
[0030]上述方案中,所述基于所述候选文本信息确定目标候选文本信息,包括:
[0031]在所述候选文本信息中包括一个文本信息的情况下,确定所述候选文本信息为所述目标候选文本信息;
[0032]在所述候选文本信息中包括多个文本信息的情况下,从所述候选文本信息中筛选得到所述目标候选文本信息。
[0033]一种信息确定装置,所述装置包括:
[0034]获取单元,用于获取待检测影视文本信息;
[0035]处理单元,用于在目标文本检索模型中存在与所述待检测影视文本信息匹配的第一文本信息的情况下,基于所述第一文本信息确定目标文本信息;其中,所述目标文本检索模型中包括影视实体文本;
[0036]所述处理单元,还用于在所述目标文本检索模型中不存在与所述待检测的影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对所述待检测影视文本信息进行处理,确定所述目标文本信息。
[0037]一种信息确定设备,所述设备包括:处理器、存储器和通信总线;
[0038]所述通信总线用于实现所述处理器和所述存储器之间的通信连接;
[0039]所述处理器用于执行所述存储器中存储的信息确定程序,以实现上述信息确定方法的步骤。
[0040]一种计算机可读存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述信息确定方法的步骤。
[0041]本申请实施例所提供的信息确定方法、装置、设备及计算机可读存储介质,可以获取待检测影视文本信息,在目标文本检索模型中存在与待检测影视文本信息匹配的第一文本信息的情况下,基于第一文本信息确定目标文本信息;目标文本检索模型中包括影视实体文本;以及,在目标文本检索模型中不存在与待检测影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对待检测影视文本信息进行处理,确定目标文本信息,如此,先采用目标文本检索模型对待检测影视文本信息进行初步检测,在未得到目标文本信息的情况下再采用目标文本纠错模型对待检测影视文本信息进行再一次检测,使得对待检测影视文本信息进行了两次纠错操作,从而提高了待检测影视文本信息的识别准确率。
附图说明
[0042]图1为本申请实施例提供的一种信息确定方法的流程示意图;
[0043]图2为本申请实施例提供的另一种信息确定方法的流程示意图;
[0044]图3为本申请实施例提供的一种信息确定方法中确定第二文本信息对应的概率的示意图;
[0045]图4为本申请实施例提供的又一种信息确定方法的流程示意图;
[0046]图5为本申请实施例提供的一种信息确定方法中下发影视实体的流程示意图;
[0047]图6(a)本申请实施例提供的一种信息确定方法中数组结构的字典树的示意图;
[0048]图6(b)本申请实施例提供的一种信息确定方法中链表结构的字典树的示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息确定方法,其特征在于,所述方法包括:获取待检测影视文本信息;在目标文本检索模型中存在与所述待检测影视文本信息匹配的第一文本信息的情况下,基于所述第一文本信息确定目标文本信息;其中,所述目标文本检索模型中包括影视实体文本;在所述目标文本检索模型中不存在与所述待检测影视文本信息匹配的第一文本信息的情况下,基于目标文本纠错模型对所述待检测影视文本信息进行处理,确定所述目标文本信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本信息确定目标文本信息,包括:确定所述待检测影视文本信息与所述第一文本信息之间的文本相似度;基于所述文本相似度和所述第一文本信息,确定所述目标文本信息。3.根据权利要求2所述的方法,其特征在于,所述确定所述待检测影视文本信息与所述第一文本信息之间的文本相似度,包括:确定对所述待检测影视文本信息的操作次数;确定所述待检测影视文本信息和所述第一文本信息的文本总字数;基于所述操作次数和所述文本总字数,确定所述文本相似度。4.根据权利要求1所述的方法,其特征在于,所述基于目标文本纠错模型对所述待检测影视文本信息进行处理,确定目标文本信息,包括:基于所述目标文本纠错模型对所述待检测影视文本信息进行处理,得到候选文本信息;基于所述目标文本检索模型和所述候选文本信息,确定所述目标文本信息。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标文本纠错模型对所述待检测影视文本信息进行处理,得到候选文本信息,包括:采用所述目标文本纠错模型对所述待检测影视文本信息进行特征提取,得到多个第二文本信息;采用目标函数对每一所述第二文本信息进行处理,得到所述每一第二文本信息对应的概率;基于所述概率和所述第二文本信息,得到所述候选文本信息。6.根据权利要求5所述的方法,其特征在于,所述基于所述概率和所述第二文本信息,得到所述候选文本信息,包括:针对所述每一第二文本信息,将所述概率与目标概率进行比较;基于比较结果...

【专利技术属性】
技术研发人员:章翔顾孙炎徐运
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1