【技术实现步骤摘要】
一种对句子中多义词进行消岐的方法及系统
本专利技术涉及自然语言处理
,尤指一种对句子中多义词进行消岐的方法及系统。
技术介绍
随着互联网的快速发展,人们的生活变得越来越智能化。通过智能终端识别用户输入的信息然后执行相应的操作也是越来越常见,例如关键词搜索等,因此识别用户通过智能终端所输入的信息的准确性严重影响着智能终端所作出的反馈。但是,汉字中存在大量的多义词,当语句中存在多义词时,智能终端可能无法准确识别出语句中该多义词的语义,导致无法识别用户的真实意图。另外,在翻译的过程中,对于多义词语义的选取也直接影响翻译文本的准确性。因此,目前市场上需要一种对句子中多义词进行消岐的方法及系统。
技术实现思路
本专利技术的目的是提供一种对句子中多义词进行消岐的方法及系统,实现通过多义词以及包含多义词的语料样本生成知识图谱,然后通过知识图谱对用户语料进行解析,从而快速准确地确定用户语料中包含的多义词对应的语义,避免理解出现歧义。本专利技术提供的技术方案如下:本专利技术提供一种对句子中多义 ...
【技术保护点】
1.一种对句子中多义词进行消岐的方法,其特征在于,包括:/n获取多义词以及所述多义词对应的词语信息,根据所述多义词和所述词语信息生成第一类三元组数据;/n获取包含所述多义词的语料样本,根据所述语料样本生成第二类三元组数据;/n根据所述第一类三元组数据和所述第二类三元组数据生成知识图谱;/n获取用户语料;/n若所述用户语料中包含多义词,根据所述知识图谱解析所述用户语料确定所述用户语料中多义词的语义。/n
【技术特征摘要】
1.一种对句子中多义词进行消岐的方法,其特征在于,包括:
获取多义词以及所述多义词对应的词语信息,根据所述多义词和所述词语信息生成第一类三元组数据;
获取包含所述多义词的语料样本,根据所述语料样本生成第二类三元组数据;
根据所述第一类三元组数据和所述第二类三元组数据生成知识图谱;
获取用户语料;
若所述用户语料中包含多义词,根据所述知识图谱解析所述用户语料确定所述用户语料中多义词的语义。
2.根据权利要求1所述的对句子中多义词进行消岐的方法,其特征在于,获取多义词以及所述多义词对应的词语信息,根据所述多义词和所述词语信息生成第一类三元组数据具体包括:
获取所述多义词以及所述多义词对应的所述词语信息,所述词语信息包含多义词词性以及多义词词义;
根据所述多义词、多义词词性以及所述多义词词义生成所述第一类三元组数据,所述第一类三元组数据中第一元素为所述多义词,第二元素为所述多义词词性,第三元素为所述多义词词义。
3.根据权利要求1所述的对句子中多义词进行消岐的方法,其特征在于,获取包含所述多义词的语料样本,根据所述语料样本生成第二类三元组数据具体包括:
获取包含所述多义词的所述语料样本;
对所述语料样本进行分词得到所述多义词和样本分词;
根据所述语料样本获取所述多义词和所述样本分词的相对位置;
获取所述语料样本中所述多义词对应的样本多义词语义;
根据所述样本多义词语义、所述相对位置以及所述样本分词生成所述第二类三元组数据,所述第二类三元组数据中第一元素为所述样本多义词语义,第二元素为所述相对位置,第三元素为所述样本分词。
4.根据权利要求1所述的对句子中多义词进行消岐的方法,其特征在于,获取用户语料之后,若所述用户语料中包含多义词,根据所述知识图谱解析所述用户语料确定所述用户语料中包含的多义词的语义之前包括:
对所述用户语料进行分词得到语料分词;
识别所述语料分词,判断所述语料分词中是否包含多义词。
5.根据权利要求4所述的对句子中多义词进行消岐的方法,其特征在于,若所述用户语料中包含多义词,根据所述知识图谱解析所述用户语料确定所述用户语料中多义词的语义具体包括:
若所述语料分词中包含多义词,将所述多义词定义为语料多义词;
根据所述用户语料获取所述语料多义词和非多义词的语料分词之间的分词相对位置;
根据所述语料多义词、所述非多义词的语料分词和所述分词相对位置,结合所述知识图谱确定所述语料多义词对应的语义。
6.一种对句子中多义词进行消岐的系统,其特征在于,包括:
多义词获取模块,获取多义词以及所述多义词对应的词语信息;
第一生成模块,根据所述多义词获取模块获取的所述多义词...
【专利技术属性】
技术研发人员:周林,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。