语义分析方法、装置以及存储介质制造方法及图纸

技术编号:27743536 阅读:14 留言:0更新日期:2021-03-19 13:37
本公开是关于一种语义分析方法、装置以及存储介质;其中,所述方法应用于终端设备,包括:获取终端设备接收到的语句信息;提取所述语句信息中的待执行词性标注的文本数据的词性标签序列;对所述词性标签序列进行合法性检测,得到检测结果;若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正;将修正后的词性标签序列,作为所述文本数据的词性标注的结果进行输出;根据输出的带有词性标注的语句信息,确定所述语句信息对应的语义。这样,由于经过了修正,使得词性标注结果的准确度会提升,语句信息对应的语义也更为准确。

【技术实现步骤摘要】
语义分析方法、装置以及存储介质
本公开涉及自然语言处理
,尤其涉及一种语义分析方法、装置以及存储介质。
技术介绍
目前,人机交互的交互方式受到了广泛关注,整个互联网行业都在积极探索人机交互可能的应用方式和应用场景,人机交互场景中,让机器能更好的理解自然语言,需要先对自然语言进行词性标注。词性标注作为自然语言处理中的基本任务之一,是一种将语料库内单词的词性按其含义和上下文内容进行标记的文本数据处理技术。深度学习时代,出现了很多的模型来实现词性标注,可以输出词性标注的结果。但是随着社会的发展,很多词都会潜移默化的产生额外的词性,对于词性标注而言,不论是中文还是英文,其难点在于对于不同的语境,词性的多变化,这种情况使得语义分析方法的准确率不高。
技术实现思路
本公开提供一种语义分析方法、装置以及存储介质。根据本公开实施例的第一方面,提供一种语义分析方法,应用于终端设备,包括:获取终端设备接收到的语句信息;提取所述语句信息中待执行词性标注的文本数据的词性标签序列;对所述词性标签序列进行合法性检测,得到检测结果;若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正;将修正后的词性标签序列,作为所述文本数据的词性标注的结果进行输出;根据输出的带有词性标注的语句信息,确定所述语句信息对应的语义。可选地,所述对所述词性标签序列进行合法性检测,得到检测结果,包括:将所述词性标签序列与预设标签序列进行比对,得到比对结果;其中,所述预设标签序列为词性标签构成的非法序列;根据所述比对结果,得到表征所述词性标签序列是否合法的检测结果。可选地,所述将所述词性标签序列与预设标签序列进行比对,得到比对结果,包括:将所述词性标签序列所包含的词性标签依次压入栈中;在所述栈中每压入一个词性标签,则将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列比对,得到所述比对结果。可选地,所述根据所述比对结果,得到表征词性标签序列是否合法的检测结果,包括:在所述词性标签序列中词性标签压入所述栈中,得到的每一个词性标签子序列都合法时,得到所述词性标签序列合法的检测结果。可选地,所述若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正,包括:在所述比对结果表明当前所述词性标签子序列非法时,对当前所述词性标签子序列进行词性标签修正;所述将所述词性标签序列所包含的词性标签依次压入栈中,包括:将所述栈中导致当前所述词性标签子序列非法的词性标签弹出,并压入修正后的词性标签,并返回将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列进行比对的步骤。可选地,所述对所述词性标签序列进行修正,包括:根据表征词性之间转换关系的转移概率,对所述词性标签序列进行修正。可选地,所述提取所述语句信息中待执行词性标注的文本数据的词性标签序列,包括:基于预设的提取模型,对所述文本数据所包含的各个字词进行特征提取,得到所述各个字词相对于各个词性标签的发射概率;根据所述发射概率和所述文本数据内各个字词的排列顺序,得到所述文本数据的词性标签序列。根据本公开实施例的第二方面,提供一种语义分析装置,应用于终端设备,包括:获取模块,用于获取终端设备接收到的语句信息;提取模块,用于提取所述语句信息中待执行词性标注的文本数据的词性标签序列;检测模块,用于对所述词性标签序列进行合法性检测,得到检测结果;修正模块,用于若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正;输出模块,用于将修正后的词性标签序列,作为所述文本数据的词性标注的结果进行输出;语义确定模块,用于根据输出的带有词性标注的语句信息,确定所述语句信息对应的语义。可选地,所述检测模块,包括:比对模块,用于将所述词性标签序列与预设标签序列进行比对,得到比对结果;其中,所述预设标签序列为词性标签构成的非法序列;结果获取模块,用于根据所述比对结果,得到表征所述词性标签序列是否合法的检测结果。可选地,所述比对模块,包括:入栈模块,用于将所述词性标签序列所包含的词性标签依次压入栈中;比对子模块,用于在所述栈中每压入一个词性标签,则将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列比对,得到所述比对结果。可选地,所述结果获取模块,还用于:在所述词性标签序列中词性标签压入所述栈中,得到的每一个词性标签子序列都合法时,得到所述词性标签序列合法的检测结果。可选地,所述修正模块,还包括:修正子模块,用于在所述比对结果表明当前所述词性标签子序列非法时,对当前所述词性标签子序列进行词性标签修正;所述入栈模块,还用于:将所述栈中导致当前所述词性标签子序列非法的词性标签弹出,并压入修正后的词性标签,并返回将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列进行比对的步骤。可选地,所述修正子模块,还用于:根据表征词性之间转换关系的转移概率,对所述词性标签序列进行修正。可选地,所述提取模块,包括:发射概率确定模块,用于基于预设的提取模型,对所述文本数据所包含的各个字词进行特征提取,得到所述各个字词相对于各个词性标签的发射概率;词性标签序列获取模块,用于根据所述发射概率和所述文本数据内各个字词的排列顺序,得到所述文本数据的词性标签序列。根据本公开实施例的第三方面,提供一种语义分析装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行所述存储器中存储的可执行指令时,实现上述第一方面的任一项所述的方法。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述第一方面任一项提供的方法中的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例提供的语义分析方法,对获取的待执行词性标注的文本数据的词性标签序列进行合法性检测,在检测出词性标签序列不合法时,就对词性标签序列进行修正,将修正后的词性标签序列作为词性标注的最终结果进行输出。这样,由于在输出词性标注结果之前,先对词性标签序列的合法性进行了验证,可以在发现不对时就及时修正,提高了输出的词性标注结果的准确率,也使得对语句信息的语义理解更为准确,有利于交互效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种语义分析方法的流程图一。图2是根据一示例性实施例示出的一种语义分析本文档来自技高网...

【技术保护点】
1.一种语义分析方法,其特征在于,应用于终端设备,包括:/n获取终端设备接收到的语句信息;/n提取所述语句信息中待执行词性标注的文本数据的词性标签序列;/n对所述词性标签序列进行合法性检测,得到检测结果;/n若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正;/n将修正后的词性标签序列,作为所述文本数据的词性标注的结果进行输出;/n根据输出的带有词性标注的语句信息,确定所述语句信息对应的语义。/n

【技术特征摘要】
1.一种语义分析方法,其特征在于,应用于终端设备,包括:
获取终端设备接收到的语句信息;
提取所述语句信息中待执行词性标注的文本数据的词性标签序列;
对所述词性标签序列进行合法性检测,得到检测结果;
若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正;
将修正后的词性标签序列,作为所述文本数据的词性标注的结果进行输出;
根据输出的带有词性标注的语句信息,确定所述语句信息对应的语义。


2.根据权利要求1所述的方法,其特征在于,所述对所述词性标签序列进行合法性检测,得到检测结果,包括:
将所述词性标签序列与预设标签序列进行比对,得到比对结果;其中,所述预设标签序列为词性标签构成的非法序列;
根据所述比对结果,得到表征所述词性标签序列是否合法的检测结果。


3.根据权利要求2所述的方法,其特征在于,所述将所述词性标签序列与预设标签序列进行比对,得到比对结果,包括:
将所述词性标签序列所包含的词性标签依次压入栈中;
在所述栈中每压入一个词性标签,则将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列比对,得到所述比对结果。


4.根据权利要求3所述的方法,其特征在于,所述根据所述比对结果,得到表征词性标签序列是否合法的检测结果,包括:
在所述词性标签序列中词性标签压入所述栈中,得到的每一个词性标签子序列都合法时,得到所述词性标签序列合法的检测结果。


5.根据权利要求3所述的方法,其特征在于,所述若检测结果表征所述词性标签序列不合法,对所述词性标签序列进行修正,包括:
在所述比对结果表明当前所述词性标签子序列非法时,对当前所述词性标签子序列进行词性标签修正;
所述将所述词性标签序列所包含的词性标签依次压入栈中,包括:
将所述栈中导致当前所述词性标签子序列非法的词性标签弹出,并压入修正后的词性标签,并返回将所述栈中各所述词性标签组成的词性标签子序列与所述预设标签序列进行比对的步骤。


6.根据权利要求1所述的方法,其特征在于,所述对所述词性标签序列进行修正,包括:
根据表征词性之间转换关系的转移概率,对所述词性标签序列进行修正。


7.根据权利要求1所述的方法,其特征在于,所述提取所述语句信息中待执行词性标注的文本数据的词性标签序列,包括:
基于预设的提取模型,对所述文本数据所包含的各个字词进行特征提取,得到所述各个字词相对于各个词性标签的发射概率;
根据所述发射概率和所述文本数据内各个字词的排列顺序,得到所述文本数据的词性标签序列。


8.一种语义分析装置,其特征在于,应用于终端设备,包括:
获取模块,用于获取终端设备接收到的语句信息;
提取模块,用于提取所述语句信息中待执行词性标注的文本数据的词性标签序...

【专利技术属性】
技术研发人员:郭元凯胡羽蓝史亮孟二利王斌王颖哲王铄花新宇
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1