【技术实现步骤摘要】
用于评估量表的相似性评估方法及装置
本公开涉及数据处理
,具体涉及一种用于评估量表的相似性评估方法、一种用于评估量表的相似性评估装置、一种存储介质以及一种电子终端。
技术介绍
量表作为一种测量、评估手段,被应用于众多行业中。尤其针对医疗数据领域中,在具体使用时,可以有多个种类的划分,例如MMSE量表(Mini-mentalStateExamination,简易智力状态检查量表)。一个量表在经过增加、删除或者修改题目等处理后,是否还具备量表本身的测评作用,往往需要相关专业工作人员凭专业经验来判断。现有技术中对量表进行相似性评价时,一般采用纯粹的文本的相似性对比。使得相似性评价的计算量巨大,且准确性较低。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用于评估量表的相似性评估方法、一种用于评估量表的相似性评估装置、一种存储介质以及一种电子终端,实现结合量表结构对评估量表进行准确的相似性评 ...
【技术保护点】
1.一种用于评估量表的相似性评估方法,其特征在于,包括:/n获取至少两个待评估量表,对所述待评估量表进行结构化解析以提取预设类别的量表结构数据;其中,所述量表结构数据包括:基本结构数据和题目数据;/n对所述基本结构数据进行预处理以获取对应文本的结构数据向量表达信息;以及/n对所述题目数据按预设规则进行整理以获取对应的题目数据向量表达信息;/n结合所述结构数据向量表达信息和题目数据向量表达信息计算所述至少两个待评估量表的相似度评估结果。/n
【技术特征摘要】
1.一种用于评估量表的相似性评估方法,其特征在于,包括:
获取至少两个待评估量表,对所述待评估量表进行结构化解析以提取预设类别的量表结构数据;其中,所述量表结构数据包括:基本结构数据和题目数据;
对所述基本结构数据进行预处理以获取对应文本的结构数据向量表达信息;以及
对所述题目数据按预设规则进行整理以获取对应的题目数据向量表达信息;
结合所述结构数据向量表达信息和题目数据向量表达信息计算所述至少两个待评估量表的相似度评估结果。
2.根据权利要求1所述的方法,其特征在于,所述基本结构数据包括:量表名称、试卷数、试卷名称、题目数和量表题目;
所述对所述基本结构数据进行预处理以获取对应文本的结构数据向量表达信息,包括:
对所述基本结构数据进行维度划分,并对维度划分结果按预设规则分配权重;
根据权重分配结果对目标维度的所述基本结构数据进行文本清理处理,以获取目标文本序列;
对所述目标文本序列进行哈希变换,以获取结构数据向量表达信息。
3.根据权利要求1所述的方法,其特征在于,所述对所述题目数据按预设规则进行整理以获取对应的题目数据向量表达信息,包括:
根据所述题目数据中各题目与对应的答案生成键值对数据;
对所述键值对数据按预设题目类型进行排序,并对排序结果进行文本解析,以获取所述题目数据向量表达信息。
4.根据权利要求1所述的方法,其特征在于,所述结合所述结构数据向量表达信息和题目数据向量表达信息计算所述至少两个待评估量表的相似度评估结果,包括:
对所述结构数据向量表达信息和题目数据向量表达信息进行合并以获取合并序列串;
根据各所述待评估量表对应的合并序列串进行汉明距离计算,以获取相似度评估结果。
5.根据权利要求1所述的方法,其特征在于,所述结合所述结构数据向量表达信息和题目数据向量表达信息计算所述至少两个待评估量表的相似度评估结果,包括:
对所述结构数据向量表达信息和题目数据向量表达信息按预设规则进行分组处理,以获取对应的分组结果;
对...
【专利技术属性】
技术研发人员:高桐,
申请(专利权)人:泰康保险集团股份有限公司,泰康健康产业投资控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。