基于分类模型进行文本评分的方法、装置和计算机设备制造方法及图纸

技术编号:22467617 阅读:43 留言:0更新日期:2019-11-06 11:26
本申请涉及分类模型的技术领域,提供了一种基于分类模型进行文本评分的方法、装置、计算机设备和存储介质,包括:获取用户答案文本,以及对应的标准答案文本;计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;本申请从多维度对用户答案文本进行评分,准确量化用户答案文本的正确性。

Method, device and computer equipment of text scoring based on classification model

【技术实现步骤摘要】
基于分类模型进行文本评分的方法、装置和计算机设备
本申请涉及分类模型的
,特别涉及一种基于分类模型进行文本评分的方法、装置和计算机设备。
技术介绍
目前,在业务系统、客服系统或者教育系统中,均需要用到对相关人员进行语言文本的正确性评估。现在通常是人工根据相关人员的文本答案进行评定,费时费力;且并不准确,同时评定的维度有限,通常不会进行多维度的评定,造成评定的结果不全面。
技术实现思路
本申请的主要目的为提供一种基于分类模型进行文本评分的方法、装置、计算机设备和存储介质,从多维度准确量化用户答案文本的正确性。为实现上述目的,本申请提供了一种基于分类模型进行文本评分的方法,包括以下步骤:获取用户答案文本,以及对应的标准答案文本;计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;其中,所述映射模型中预设有不同的相似度结果所在的不同评分维度,以及同一个评分维度所对应的多个相似度结果之间的权重比例。进一步地,所述将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果的步骤,包括:将所述相似度结果以及对应的相似度打分输入至预设的映射模型中;根据预设的不同相似度结果所在的不同评分维度,从所述相似度结果中确定对应在同一个评分维度的所有目标相似度结果;根据同一个评分维度所对应的所有目标相似度结果之间的权重比例,以及所述目标相似度结果所对应的相似度打分,通过加权计算得到所述用户答案文本在每个评分维度的评分结果。进一步地,所述计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果的步骤,包括:通过word2vec方法分别构建所述用户答案文本与标准答案文本对应的第一词向量以及第二词向量;通过WMD模型计算所述第一词向量以及第二词向量之间的欧式距离,并根据所述欧式距离计算得到所述用户答案文本与标准答案文本之间的相似度结果;其中,所述欧式距离的计算公式为:其中,d为欧式距离,x1i为所述用户答案文本对应的第一词向量,x2i为所述标准答案文本对应的第二词向量。进一步地,所述计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果的步骤,包括:对所述用户答案文本以及标准答案文本分别进行分词处理,并通过hash算法将所述用户答案文本以及标准答案文本中的每个词计算为对应的一个哈希值;对所述用户答案文本中每个词对应的哈希值进行加权计算,合并处理得到第一序列串;对所述标准答案文本中每个词对应的哈希值进行加权计算,合并处理得到第二序列串;分别对所述第一序列串以及第二序列串进行降维计算,得到对应的第一签名串以及第二签名串;对比所述第一签名串以及第二签名串中每个字符的差异,得到所述用户答案文本与标准答案文本之间的海明距离;将所述海明距离与阈值进行比较,得到所述用户答案文本与标准答案文本之间的相似度结果。进一步地,所述计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果的步骤之前,包括:对所述用户答案文本进行切句、分词处理,以及对所述标准答案文本进行切句、分词处理;并对所述用户答案文本中的词语进行同义词替换。进一步地,所述将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果的步骤之后,包括:根据所述用户答案文本在每个评分维度的评分结果,以及各个评分维度对应的权重比例,计算得到所述用户答案文本的总评分;根据所述总评分与评定结果的对应关系,匹配对应所述总评分的评定结果,作为对所述用户的评定结果。本申请还提供了一种基于分类模型进行文本评分的装置,包括:获取单元,用于获取用户答案文本,以及对应的标准答案文本;第一计算单元,用于计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;评分单元,用于将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;其中,所述映射模型中预设有不同的相似度结果所在的不同评分维度,以及同一个评分维度所对应的多个相似度结果之间的权重比例。进一步地,所述评分单元包括:输入子单元,用于将所述相似度结果以及对应的相似度打分输入至预设的映射模型中;确定子单元,用于根据预设的不同相似度结果所在的不同评分维度,从所述相似度结果中确定对应在同一个评分维度的所有目标相似度结果;评分子单元,用于根据同一个评分维度所对应的所有目标相似度结果之间的权重比例,以及所述目标相似度结果所对应的相似度打分,通过加权计算得到所述用户答案文本在每个评分维度的评分结果。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。本申请提供的基于分类模型进行文本评分的方法、装置、计算机设备和存储介质,包括:获取用户答案文本,以及对应的标准答案文本;计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;从多维度对用户答案文本进行评分,准确量化用户答案文本的正确性。附图说明图1是本申请一实施例中基于分类模型进行文本评分的方法步骤示意图;图2是本申请一一实施例中步骤S3的具体步骤示意图;图3是本申请一实施例中基于分类模型进行文本评分的装置结构框图;图4是本申请另一实施例中的评分单元的结构框图;图5为本申请一实施例的计算机设备的结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,本申请一实施例中提供了一种基于分类模型进行文本评分的方法,包括以下步骤:步骤S1,获取用户答案文本,以及对应的标准答案文本;步骤S2,计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;步骤S3,将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本文档来自技高网...

【技术保护点】
1.一种基于分类模型进行文本评分的方法,其特征在于,包括以下步骤:获取用户答案文本,以及对应的标准答案文本;计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;其中,所述映射模型中预设有不同的相似度结果所在的不同评分维度,以及同一个评分维度所对应的多个相似度结果之间的权重比例。

【技术特征摘要】
1.一种基于分类模型进行文本评分的方法,其特征在于,包括以下步骤:获取用户答案文本,以及对应的标准答案文本;计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果;根据所述相似度结果以及对应所述相似度结果的打分规则计算对应的相似度打分;将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果;其中,所述映射模型中预设有不同的相似度结果所在的不同评分维度,以及同一个评分维度所对应的多个相似度结果之间的权重比例。2.根据权利要求1所述的基于分类模型进行文本评分的方法,其特征在于,所述将所述相似度结果以及对应的相似度打分输入至预设的映射模型中,以输出所述用户答案文本在每个评分维度的评分结果的步骤,包括:将所述相似度结果以及对应的相似度打分输入至预设的映射模型中;根据预设的不同相似度结果所在的不同评分维度,从所述相似度结果中确定对应在同一个评分维度的所有目标相似度结果;根据同一个评分维度所对应的所有目标相似度结果之间的权重比例,以及所述目标相似度结果所对应的相似度打分,通过加权计算得到所述用户答案文本在每个评分维度的评分结果。3.根据权利要求1所述的基于分类模型进行文本评分的方法,其特征在于,所述计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果的步骤,包括:通过word2vec方法分别构建所述用户答案文本与标准答案文本对应的第一词向量以及第二词向量;通过WMD模型计算所述第一词向量以及第二词向量之间的欧式距离,并根据所述欧式距离计算得到所述用户答案文本与标准答案文本之间的相似度结果;其中,所述欧式距离的计算公式为:其中,d为欧式距离,x1i为所述用户答案文本对应的第一词向量,所述x2i为所述标准答案文本对应的第二词向量。4.根据权利要求1所述的基于分类模型进行文本评分的方法,其特征在于,所述计算所述用户答案文本与标准答案文本之间的特征距离,并根据所述特征距离计算所述用户答案文本与标准答案文本之间的相似度结果的步骤,包括:对所述用户答案文本以及标准答案文本分别进行分词处理,并通过hash算法将所述用户答案文本以及标准答案文本中的每个词计算为对应的一个哈希值;对所述用户答案文本中每个词对应的哈希值进行加权计算,合并处理得到第一序列串;对所述标准答案文本中每个词对应的哈希值进行加权计算,合并处理得到第二序列串;分别对所述第一序列串以及第二序列串进行降维计算,得到对应的第一签名串以及第二签名串;对比所述第一签名...

【专利技术属性】
技术研发人员:刘宇超辛婷婷郭佳谭贤卢清明郭典韩铃
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1