【技术实现步骤摘要】
语句评价方法及装置
[0001]本申请涉及自然语言处理
,尤其涉及一种语句评价方法及装置。
技术介绍
[0002]随着信息和互联网技术的发展,诸如对话系统的人机交互系统可以提供与用户进行交互的能力,其能够在自然语言处理(Natural Language Processing,NLP)的基础上,与用户交互,以实现回答用户提出的问题、判断用户的意图等功能。
[0003]在人机交互过程中,诸如知识库的标准语句的构建对于提高交互质量而言是重要的,具体来说,语句质量关乎人机交互系统中的自然语言理解(Natural Language Understanding,NLU),并且间接地影响自然语言生成(Natural Language Generation,NLG)。
[0004]然而,在现有的相关技术中,缺少对语句进行评价的方案,无法判断用于人机交互的语句质量。
技术实现思路
[0005]本申请提供一种语句评价方法及装置,以至少解决相关技术中无法判断用于人机交互的语句质量的问题。本申请的技术方案如下:
[0006]根据本申请实施例的第一方面,提供一种语句评价方法,所述语句评价方法包括:获取待评价的第一文本编码信息;对所述第一语句进行语法依存关系分析和词性分析,得到第一语法依存序列和第一词性序列;所述第一语法依存序列表示所述第一语句中的语法依存关系,所述第一词性序列表示所述第一语句中各个词语的词性;基于所述第一文本编码信息、所述第一语法依存序列和所述第一词性序列确定用于对所述第一语句进行 ...
【技术保护点】
【技术特征摘要】
1.一种语句评价方法,其特征在于,所述语句评价方法包括:获取待评价的第一语句的第一文本编码信息;对所述第一语句进行语法依存关系分析和词性分析,得到第一语法依存序列和第一词性序列;所述第一语法依存序列表示所述第一语句中的语法依存关系,所述第一词性序列表示所述第一语句中各个词语的词性;基于所述第一文本编码信息、所述第一语法依存序列和所述第一词性序列确定用于对所述第一语句进行质量评价的第一语法信息;基于所述第一语法信息对所述第一语句进行质量评价处理,得到所述第一语句作为标准语句的第一质量。2.根据权利要求1所述的语句评价方法,其特征在于,所述基于所述第一文本编码信息、所述第一语法依存序列和所述第一词性序列确定用于对所述第一语句进行质量评价的第一语法信息,包括:对所述第一语句进行分类,得到所述第一语句的语句类型;所述语句类型包括书面语或口语;将所述语句类型、所述第一文本编码信息、所述第一语法依存序列和所述第一词性序列进行融合,得到第一语法信息。3.根据权利要求1或2所述的语句评价方法,其特征在于,所述基于所述第一语法信息对所述第一语句进行质量评价处理,得到所述第一语句作为标准语句的第一质量,包括:基于所述第一语法信息对所述第一语句进行词语间语义关系分析,得到长距离依赖特征;将所述长距离依赖特征与所述第一语法信息融合,得到第一语法融合信息;基于所述第一语法融合信息对所述第一语句进行质量评价处理,确定所述第一语句的第一质量。4.根据权利要求1所述的语句评价方法,其特征在于,所述得到所述第一语句作为标准语句的第一质量之后,所述语句评价方法还包括:若所述第一质量大于或等于质量阈值,则将所述第一语句作为目标标准语句。5.根据权利要求4所述的方法,其特征在于,所述语句评价方法还包括:获取第二语句、与所述第二语句对应的所述目标标准语句以及与所述目标标准语句对应的现有相似语句;确定所述第二语句与所述目标标准语句之间的第一语义相似度;确定所述第二语句与所述现有相似语句之间的第二语义相似度;基于所述第一语义相似度和所述第二语义相似度对所述第二语句进行质量评价处理,得到所述第二语句作为所述目标标准语句的相似语句的第二质量;所述第一语义相似度与所述第二质量呈正相关,所述第二语义相似度与所述第二质量呈负相关。6.根据权利要求5所述的语句评价方法,其特征在于,所述确定所述第二语句与所述目标标准语句之间的第一语义相似度,包括:对所述第二语句进行编码,得到第二语句编码信息;对所述目标标准语句进行编码,得到标准语句编码信息;基于所述第二语句编码信息和所述标准语句编码信息,确定所述第一语义相似度。
7.根据权利要求6所述的语句评价方法,其特征在于,所述基于所述第二语句编码信息和所述标准语句编码信息,确定所述第一语义相似度,包括:确定所述第二语句编码信息与所述标准语句编码信息之间的第一向量距离;基于所述第一向量距离进行相似度计算,得到所述第一语义相似度。8.根据权利要求6所述的语句评价方法,其特征在于,所述基于所述第二语句编码信息和所述标准语句编码信息,确定所述第一语义相似度,包括:对所述第二语句进行语法依存关系分析和词性分析,得到第二语法依存序列和第二词性序列;所述第二语法依存序列表示所述第二语句中的语法依存关系,所述第二词性序列表示所述第二语句中各个词语的词性;基于所述第二语句编码信息、所述第二语法依存序列和所述第二词性序列确定用于对所述第二语句进行质量评价的第二语法信息;基于所述第二语法信息和所述第一语法信息进行相似度计算,得到所述第一语义相似度。9.根据权利要求5所述的语句评价方法,其特征在于,所述确定所述第二语句与所述目标标准语句之间的第一语义相似度,包括:对所述第二语句进行语...
【专利技术属性】
技术研发人员:白安琪,蒋宁,吴海英,肖冰,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。