【技术实现步骤摘要】
语义识别方法、语义识别装置、存储介质及电子设备
[0001]本公开涉及自然语言处理
,具体而言,涉及一种语义识别方法、语义识别装置、计算机可读存储介质和电子设备。
技术介绍
[0002]目前,程序员常常采用规则语义解析引擎来对用户输入的语句或者文本进行处理,例如,斯坦福大学的CoreNLP项目。CoreNLP项目采用的技术方案是:首先,配置指定的语义识别模板,然后,在用户输入语句与语义识别模板的内容完全相同的情况下,匹配并输出语句识别结果,否则,不输出结果。然而,在实际处理过程中,用户输入的语句可以包括一个或者多个口头禅或者语气词,用户可以输入与语义模板顺序不同的语句,这将导致计算机识别不出用户输入的语句的问题。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0004]本公开的目的在于提供一种语义识别方法、语义识别装置、计算机可读存储介质和电子设备,进而至少在一定程度上克服由于相 ...
【技术保护点】
【技术特征摘要】
1.一种语义识别方法,其特征在于,包括:获取待识别语句,按语义模板对所述待识别语句进行分词处理,得到待识别词语集合和与所述待识别词语集合对应的第一模板词语集合;基于所述待识别词语集合中各词语及各所述词语的词语类型,确定各所述词语对应的评价指标值,利用各所述词语对应的评价指标值,计算所述待识别语句与所述语义模板的第一相似度;根据所述待识别词语集合中各所述词语的长度之和与所述第一模板词语集合中各词语的长度之和,计算所述待识别语句与所述语义模板的第二相似度;基于所述第一相似度和所述第二相似度,输出所述待识别语句对应的第一识别语句。2.根据权利要求1所述的语义识别方法,所述语义模板包括第一关键词语类型,其特征在于,基于所述待识别词语集合中各词语及各所述词语的词语类型,确定各所述词语对应的评价指标值包括:在各所述词语的词语类型包括所述第一关键词语类型的情况下,确定所述第一关键词语类型对应词语的评价指标值为第一预设指标值;将除所述第一关键词语类型对应的词语之外的各所述词语确定为中间词语集合,以及确定所述中间词语集合中各词语对应的评价指标值。3.根据权利要求2所述的语义识别方法,所述评价指标值包括评价分数和权重系数,其特征在于,确定所述中间词语集合中各词语对应的评价指标值包括:确定所述中间词语集合中各词语的词语类型对应的权重系数;基于所述中间词语集合和词语评价指标库得出所述中间词语集合中各词语对应的评价分数;基于所述中间词语集合中各词语对应的评价分数和所述中间词语集合中各词语的词语类型对应的权重系数,计算所述中间词语集合中各词语的评价指标值。4.根据权利要求2或3所述的语义识别方法,所述语义模板包括第二关键词语类型,其特征在于,在计算所述待识别语句与所述语义模板的第一相似度之前,所述语义识别方法还包括:在各所述词语的词语类型包括所述第一关键词语类型的情况下,且所述第二关键词语类型对应词语的评价指标值小于指标阈值,则确定出所述待识别词语集合中所述第二关键词语类型对应词语的评价指标值为第二预设指标值。5.根据权利要求4所述的语义识别方法,其特征在于,所述语义识别方法还包括:按所述语义模板确定与所述第一识别语句对应的第二模板词语集合;基于所述第一模板词语集合和所述第二模板词语集合,输出所述待识别语句对应的第二识别语句。6.根据权利要求5所述的语义识别方法,其特征在于,基于所述第一模板词语集合和所述第二模板词语集合,输出所述待识别语句对应的第二识别语句包括:在所述第一模板词语集合中各词语的词语类型包含所述第一关键词语类型和所述第二关键词语类型的情况下,则确定所述第一模板词语集合中各词语对应的评价指标值,利用第一模板词...
【专利技术属性】
技术研发人员:孙孝雄,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。