词语释义方法、装置及非易失性存储介质制造方法及图纸

技术编号:38351062 阅读:7 留言:0更新日期:2023-08-05 17:24
本发明专利技术公开了一种词语释义方法、装置及非易失性存储介质。其中,该方法包括:在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征;将目标语句输入至预先构建的语义特征提取模型,得到目标语句对应的第二语义特征;将第二语义特征分别与多个语义情景分别对应的第一语义特征进行相似度匹配,得到第二语义特征分别与多个语义情景分别对应的第一语义特征之间的相似度得分;根据第二语义特征分别与多个语义情景分别对应的第一语义特征之间的相似度得分,确定待查词语的目标释义结果。本发明专利技术解决了相关技术中采用人工方式进行单词释义查询,存在的查询效率低且查询准确性差的技术问题。性差的技术问题。性差的技术问题。

【技术实现步骤摘要】
词语释义方法、装置及非易失性存储介质


[0001]本专利技术涉及语义特征提取领域,具体而言,涉及一种词语释义方法、装置及非易失性存储介质。

技术介绍

[0002]由于同样的单词在不同语境中的含义不同,因此想要知道一个单词在文本中的确切含义,必须基于上下文来理解。在语言学习过程中,单词释义是一项基础需求。目前一般通过两种方式获得基于上下文语境的确切释义:一种是相关人员(如教研人员或老师等)根据单词上下文语境提供单词释义,即人工释义;另一种是提供字典查询,然后查询者(如学生)根据上下文理解。这两种方式都有其局限性,人工释义的方式虽然能够根据上下文给出单词确切含义,但依赖外部人员;而字典查询会给出多条释义,尤其是高级词典给出的单词语境数量多,释义、例句等信息丰富,需要花费很多精力去分辨理解。导致单词释义查询效率较低,且准确性较差。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种词语释义方法、装置及非易失性存储介质,以至少解决相关技术中采用人工方式进行单词释义查询,存在的查询效率低且查询准确性差的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种词语释义方法,包括:在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征;将上述目标语句输入至预先构建的语义特征提取模型,得到上述目标语句对应的第二语义特征;将上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征进行相似度匹配,得到上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分;根据上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分,确定上述待查词语的目标释义结果。
[0006]根据本专利技术实施例的另一方面,还提供了一种词语释义装置,包括:第一获取模块,用于在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征;第二获取模块,用于将上述目标语句输入至预先构建的语义特征提取模型,得到上述目标语句对应的第二语义特征;匹配模块,用于将上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征进行相似度匹配,得到上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分;确定模块,用于根据上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分,确定上述待查词语的目标释义结果。
[0007]根据本专利技术实施例的另一方面,还提供了一种非易失性存储介质,其特征在于,上述非易失性存储介质存储有多条指令,上述指令适于由处理器加载并执行任意一项上述的
词语释义方法。
[0008]在本专利技术实施例中,通过在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征;将上述目标语句输入至预先构建的语义特征提取模型,得到上述目标语句对应的第二语义特征;将上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征进行相似度匹配,得到上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分;根据上述第二语义特征分别与上述多个语义情景分别对应的第一语义特征之间的相似度得分,确定上述待查词语的目标释义结果,达到了基于上下文语境准确自动查询单词释义的目的,从而实现了提升上下文语境中特定单词释义查询效率和查询准确性的技术效果,进而解决了相关技术中采用人工方式进行单词释义查询,存在的查询效率低且查询准确性差的技术问题。
附图说明
[0009]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0010]图1是根据本专利技术实施例的一种词语释义方法的示意图;
[0011]图2是根据本专利技术实施例的一种可选的语义特征提取模型训练示意图;
[0012]图3是根据本专利技术实施例的一种可选的词语释义方法的示意图;
[0013]图4是根据本专利技术实施例的一种词语释义装置的示意图。
具体实施方式
[0014]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0015]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0016]首先,为方便理解本专利技术实施例,下面将对本专利技术中所涉及的部分术语或名词进行解释说明:
[0017]BERT模型,基于Transformer的双向编码模型,全称:Bidirection Encoder Representations from Transformer,其目的在于利用大规模无标注语料训练、获得文本的包含丰富语义信息的语义表示。
[0018]根据本专利技术实施例,提供了一种词语释义的方法实施例,需要说明的是,在附图的
流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0019]图1是根据本专利技术实施例的词语释义方法的流程图,如图1所示,该方法包括如下步骤:
[0020]步骤S102,在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征。
[0021]可选的,上述待查词语可以但不限于为各种语言对应的词语,例如,中文词语、英文单词等等;上述多个语义情景分别对应于待查词语在词典中的不同的释义结果。可以理解,词典中针对同一个词语可能存在多种不同的释义,并配置有不同的语义情景。因此,在进行待查词语释义结果的选定时,需要将待查询词语的所有语义情景考虑其中,并逐一进行分析,以提升待查词语释义结果选取的准确性。
[0022]在一种可选的实施例中,上述在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征,包括:对上述词典中包括的词语分别进行语义特征提取处理,得到上述词典中包括的词语分别对应的文本信息的语义特征;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词语释义方法,其特征在于,包括:在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征;将所述目标语句输入至预先构建的语义特征提取模型,得到所述目标语句对应的第二语义特征;将所述第二语义特征分别与所述多个语义情景分别对应的第一语义特征进行相似度匹配,得到所述第二语义特征分别与所述多个语义情景分别对应的第一语义特征之间的相似度得分;根据所述第二语义特征分别与所述多个语义情景分别对应的第一语义特征之间的相似度得分,确定所述待查词语的目标释义结果。2.根据权利要求1所述的方法,其特征在于,所述在检测到词典中存在多个与目标语句中的待查词语对应的语义情景的情况下,获取多个语义情景分别对应的第一语义特征,包括:对所述词典中包括的词语分别进行语义特征提取处理,得到所述词典中包括的词语分别对应的文本信息的语义特征;基于所述词典中包括的词语分别对应的文本信息的语义特征,确定所述词典中包括的词语分别对应的词典释义语义特征表,其中,所述词典中包括的词语分别对应的词典释义语义特征表中包括对应的词语在至少一个语义情景的语义特征;在检测到所述词典中存在多个与所述待查词语对应的语义情景的情况下,从所述词典中包括的词语分别对应的词典释义语义特征表中,确定所述待查词语对应的词典释义语义特征表,其中,所述待查词语对应的词典释义语义特征表中包括所述多个语义情景分别对应的第一语义特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述词典中包括的词语分别对应的文本信息的语义特征,确定所述词典中包括的词语分别对应的词典释义语义特征表,包括:获取所述词典中包括的词语分别对应的文本信息分别对应的权重值,其中,所述文本信息至少包括:所述词典中包括的词语分别在至少一个语义情景下的释义信息、例句信息、短语信息、搭配词信息;基于所述词典中包括的词语分别对应的文本信息分别对应的权重值,以及所述词典中包括的词语分别对应的文本信息的语义特征,得到所述词典中包括的词语分别在至少一个语义情景的语义特征;基于所述词典中包括的词语分别在至少一个语义情景的语义特征,构建所述词典中包括的词语分别对应的词典释义语义特征表。4.根据权利要求1所述的方法,其特征在于,在所述语义特征提取模型包括多个网络层,所述多个网络层中上一网络层的输出作为下一网络层的输入的情况下,所述将所述目标语句输入至预先构建的语义特征提取模型,得到所述目标语句对应的第二语义特征,包括:将所述目标语句输入至所述语义特征提取模型,得到所述多个网络层分别输出的所述目标语句中包括的词语分别对应的语义特征;
从所述多个网络层分别输出的所述目标语句中包括的词语分别对应的语义特征中,确定出所述多个网络层中最后预订数量的网络层分别输出的所述目标语句中包括的词语分别对应的语义特征;基于所述最后预订数量的网络层分别输出的所述目标语句中包括的词语分别对应的语义特征,得到所述目标语句中包括的词语分别对应的第三语义特征;基于所述目标语句中包括的词语分别对应的第三语义特征,得到所述目标语句对应的所述第二语义特征。5.根据权利要求4所述的方法,其特征在于,所述基于所述最后预订数量的网络层分别输出的所述目标语句中包括的词语分别对应的语义特征,得到所述目标语句中包括的词语分别对应的第三语义特征,包括:根据所述最后预订数量的网络层分别输...

【专利技术属性】
技术研发人员:吴延年王东永
申请(专利权)人:北京全未来教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1