一种成语推荐模型的训练方法及装置制造方法及图纸

技术编号:23787802 阅读:31 留言:0更新日期:2020-04-15 00:53
本申请提供一种成语推荐模型的训练方法及装置,其中所述方法包括:获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数;通过所述训练样本和对应的训练标签对成语推荐模型进行训练,得到所述成语推荐模型,所述成语推荐模型使得所述训练样本与所述训练标签相关联。本申请通过大规模的语料训练,实现了根据上下文语义信息对常见成语进行打分的智能模型,通过该模型能够帮助用户在写作时进行常见成语的推荐,使得用户能够又快又好的完成高质量文笔的文章,提升了用户的体验。

A training method and device of idiom recommendation model

【技术实现步骤摘要】
一种成语推荐模型的训练方法及装置
本说明书涉及人工智能
,特别涉及一种成语推荐模型的训练方法、一种成语推荐方法、装置、计算设备及计算机可读存储介质。
技术介绍
在用户进行文本撰写时,往往需要使用一些常用成语来提升写作内容的文学水平,但是在用户自身知识水平有限或根据当前上下文语境难以确定适合填写的常用成语的情况下,现有技术中并不存在能够根据上下文语境主动进行多个成语推荐的方法,此时用户必须切换到第三方的搜索平台或利用字典等工具进行检索,并对第三方的搜索或字典等工具返回的多个常见成语进行主观的甄别以及筛选,降低了用户关于文本写作思路的连续性以及正确性,破坏了用户的体验。
技术实现思路
有鉴于此,本说明书实施例提供了一种成语推荐模型的训练方法、一种成语推荐方法、装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种成语推荐模型的训练方法,包括:获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数;通过所述训练样本和对应的训练标签对成语推荐模型进行训练,得到所述成语推荐模型,所述成语推荐模型使得所述训练样本与所述训练标签相关联。根据本说明书实施例的第二方面,提供了一种成语推荐方法,包括:获取目标语句,在所述目标语句中包含有待填充常见成语的缺失空白;将所述目标语句输入至如上所述的方法训练得到的成语推荐模型中进行成语推荐,根据所述常见成语的推荐分数确定所述缺失空白对应的至少一个推荐成语。根据本说明书实施例的第三方面,提供了一种成语推荐模型的训练装置,包括:训练数据获取模块,被配置为获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数;模型训练模块,被配置为通过所述训练样本和对应的训练标签对成语推荐模型进行训练,得到所述成语推荐模型,所述成语推荐模型使得所述训练样本与所述训练标签相关联。根据本说明书实施例的第四方面,提供了一种成语推荐装置,包括:预测获取模块,被配置为获取目标语句,在所述目标语句中包含有待填充常见成语的缺失空白;成语推荐模块,被配置为将所述目标语句输入至如上所述的方法训练得到的成语推荐模型中进行成语推荐,根据所述常见成语的推荐分数确定所述缺失空白对应的至少一个推荐成语。根据本说明书实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述成语推荐模型的训练方法或成语推荐方法的步骤。根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述成语推荐模型的训练方法或成语推荐方法的步骤。本申请通过大规模的语料训练,实现了根据上下文语义信息对常见成语进行打分的智能模型,通过该模型能够帮助用户在写作时进行常见成语的推荐,使得用户能够又快又好的完成高质量文笔的文章,提升了用户的体验。附图说明图1是本申请实施例提供的计算设备的结构框图;图2是本申请实施例提供的成语推荐模型的训练方法的流程图;图3是本申请实施例提供的成语推荐模型的训练方法的另一流程图;图4是本申请实施例提供的成语推荐方法的流程图;图5是本申请实施例提供的成语推荐方法的另一流程图;图6是本申请实施例提供的成语推荐模型的训练装置的结构示意图;图7是本申请实施例提供的成语推荐装置的结构示意图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。在本申请中,提供了一种成语推荐模型的训练方法、装置、计算设备及计算机可读存储介质,在下面的实施例中逐一进行详细说明。图1示出了根据本说明书一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备100还可以是移动式或静止式的服务器。其中,处理器120可以执行图2所示方法中的步骤。图2是示出了根据本申请一实施例的成语推荐模型的训练方法的示意性流程图,包括步骤202至步骤204。步骤202:获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数。在本申请的实施例中,所述训练样本包本文档来自技高网...

【技术保护点】
1.一种成语推荐模型的训练方法,其特征在于,包括:/n获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数;/n通过所述训练样本和对应的训练标签对成语推荐模型进行训练,得到所述成语推荐模型,所述成语推荐模型使得所述训练样本与所述训练标签相关联。/n

【技术特征摘要】
1.一种成语推荐模型的训练方法,其特征在于,包括:
获取训练样本和对应的训练标签,其中,所述训练样本包括含有缺失空白的原始语料以及多个常见成语,所述训练标签包括每个常见成语在每个缺失空白中对应的推荐分数;
通过所述训练样本和对应的训练标签对成语推荐模型进行训练,得到所述成语推荐模型,所述成语推荐模型使得所述训练样本与所述训练标签相关联。


2.根据权利要求1所述的方法,其特征在于,获取训练样本和对应的训练标签包括:
从公开的语料数据库中获取多个常见成语以及原始语料作为训练样本,在所述原始语料中包含有多个待填充常见成语的缺失空白;
从公开的语料数据库中获取每个缺失空白对应的至少一个推荐成语作为训练标签。


3.根据权利要求1所述的方法,其特征在于,通过所述训练样本和对应的训练标签对成语推荐模型进行训练包括:
将所述多个常见成语随机分为目标数量的成语分组,并且在每个所述成语分组中均包括相同数量的不重复的所述常见成语;
构建目标数量的测试集合,每个所述测试集合均包括所述原始语料和一个所述成语分组;
根据所述缺失空白的属性信息,对每个所述测试集合中的所述成语分组中的每个常见成语进行打分,确定每个所述常见成语对应的推荐分数。


4.根据权利要求3所述的方法,其特征在于,根据所述缺失空白的属性信息,对每个所述测试集合中的所述成语分组中的每个常见成语进行打分包括:
确定所述缺失空白在所述原始语料中的位置和占位符的数量,并根据所述缺失空白在所述原始语料中的位置确定所述缺失空白的上下文语义关系;
根据所述缺失空白的上下文语义关系和所述缺失空白在所述原始语料中占位符的数量,通过损失函数得到所述常见成语为推荐成语的概率。


5.根据权利要求3所述的方法,其特征在于,确定每个所述常见成语对应的推荐分数包括:
在一个常见成语对应有两个推荐分数的情况下,将所述推荐分数的分值较高...

【专利技术属性】
技术研发人员:郭昱汪美玲李长亮
申请(专利权)人:北京金山数字娱乐科技有限公司成都金山互动娱乐科技有限公司北京金山软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1