一种面向城市体检主题场景的评估方法及装置制造方法及图纸

技术编号:38017008 阅读:9 留言:0更新日期:2023-06-30 10:43
本发明专利技术涉及一种面向城市体检主题场景的评估方法,包括以下:步骤110、获取城市体验文本材料,根据预设置的处理方法对所述城市体验文本进行预处理,得到具备城市体检指标体系特色的城市体检语义材料;步骤120、根据具备城市体检指标体系特色的城市体检语义材料,构建城市体检主题评估方案;步骤130、基于城市体检主题评估方案,构建城市体检主题评估模型;步骤140、基于所述城市体检主题评估模型对城市体检主题场景进行评估,得到评估结果。本发明专利技术融合了不同类型的城市体检指标和指标体系,并通过城市体检语义材料、主题评估方案和主题评估模型构建,实现了具有城市体检指标体系特色的语义聚类与全流程自动化综合评估。语义聚类与全流程自动化综合评估。语义聚类与全流程自动化综合评估。

【技术实现步骤摘要】
一种面向城市体检主题场景的评估方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种面向城市体检主题场景的评估方法及装置。

技术介绍

[0002]目前,城市体检主要有两个部门在主导,一个是住房与城乡建设部,另一个是自然资源部。具体的体检工作又因城市而异,在体检指标、指标体系和评估方法上面有所差异。一方面,这些差异主要停留在话语体系上,即“语义”差异。尽管不同部门的人员在用差异化的职业语言描述城体检工作成果,但本质上确是在描述同一种实物或事件。这种语义差异会混淆视听,对试图了解城市体检的人造成认知困惑。例如,住建部指标“全社会R&D支出占GDP比重”与自资部指标“研究与试验发展经费投入强度”是完全一样的含义,但“看起来”却不一样。另一方面,因业务领域优势不同,不同类型的城市体检对同一事物的评估角度各异。例如,评估绿道建设情况,有的用“城市绿道密度”从整体空间分布是否均匀的角度进行评估,有的用“人均绿道程度”从人均数量是否足够的角度进行评估。如此,“各自为战”的现象十分明显。针对以上问题,需要提出一种能够充分利用多类型城市体检评估成果的方法,将多种评估角度、手段等融合,实现城市体检的综合快速评估。

技术实现思路

[0003]本专利技术的目的是为了至少解决现有技术的不足之一,提供一种面向城市体检主题场景的评估方法及装置。
[0004]为了实现上述目的,本专利技术采用以下的技术方案:
[0005]具体的,提出一种面向城市体检主题场景的评估方法,包括以下:
[0006]步骤110、获取城市体验文本材料,根据预设置的处理方法对所述城市体验文本进行预处理,得到具备城市体检指标体系特色的城市体检语义材料;
[0007]步骤120、根据具备城市体检指标体系特色的城市体检语义材料,构建城市体检主题评估方案;
[0008]步骤130、基于城市体检主题评估方案,构建城市体检主题评估模型;
[0009]步骤140、基于所述城市体检主题评估模型对城市体检主题场景进行评估,得到评估结果。
[0010]进一步,具体的,步骤110中的内容包括,
[0011]步骤111、抽取城市体检成果文本库内容,获得城市体检文本材料,
[0012]城市体检成果文本库包括城市体检工作评估报告、城市体检工作技术指南、第三方体检报告、居民满意度调查结果,抽取的文本包括指标名称、指标类型、指标体系、指标解释、指标计算公式、评估标准、体检结果;
[0013]步骤112、基于城市体检文本材料提取城市体检评估要素,获得城市体检评估要素集合,
[0014]通过对指标名称的拆分得到结果集合I
o
,通过对集合I
o
的提取获得城市体检评估要素以及集合I
e
,同时得到集合I
e
的补集,即集合其数学关系为集合将作为停用词集合的一部分内容,集合I
e
将作为词典的一部分内容;
[0015]步骤113、利用城市体检评估要素集合补充停用词集合与词典,获得城市体检领域内的初始停用词集合与初始词典,
[0016]预先对停用词集合和词典进行设计,获得初始停用词集合S
o
和初始词典D
o
,初始停用词集合S
o
包括常见中文停用词集合S
c
与集合数学关系为初始词典D
o
的内容为集合I
e

[0017]步骤114、基于初始停用词集合与初始词典,根据预设的停用词集合与词典扩充内循环机制,获得城市体检领域内停用词集合与词典,
[0018]城市体检文本材料数量记为N
docs
,分n次调用随机数量的城市体检文本材料,第i次调用的数量记为a
i
且a
i
是处在0.05N
docs
至0.1N
docs
之间的整数,调用次数处在10到20次之间,数学表达为循环开始后,第一次调用数量为a1的城市体检文本,先基于初始词典D
o
干预拆分结果并进行拆分,以集合S
o
配合词性的方式过滤拆分结果,得到首批次的城市体检文本拆分结果A1,将结果A1分为有效结果集合E1,表征城市体检评估的实质性内容;无效结果集合U1,定义为算法遗漏的词汇,表征无法提供城市体检特色的语义信息;错误集合M1,表征具有明显错误或极为不符合语义环境的拆分结果,
[0019]扩充机制为,综合利用第i次的拆分结果,使用有效结果集合E
i
扩充初始词典D
o
,使用错误集合M
i
扩充初始停用词集合S
o
,并利用第i次扩充后的停用词集合S
i
与词典D
i
对第i+1次的拆分结果进行影响,当循环进行到第n次,城市体检评估领域内停用词集合为S,数学表达式为城市体检评估领域内词典为D,数学表达式为
[0020]步骤115、结合停用词集合、词典以及城市体检评估要素集合,构建城市体检语义材料和版本参数特征,
[0021]定义体系P和体系Q,体系P基于概念以及目标对指标进行了分类,其类别集合记作P
s
={aim1,aim2,

,aim
p
},其元素数量为p,体系Q基于概念以及要素对指标进行了分类其类别集合记作Q
s
={elm1,elm2,

,elm
q
},其元素数量为q,以集合I
e
的元素为基准,分别与P
s
和Q
s
的元素建立映射关系,对城市体检评估文本材料进行拆分,并通过字典D影响拆分结果,通过集合S进行停用词过滤,获取初始城市体检语义材料C
o
,其数量与文本材料一致,即N
docs

[0022]以P
s
和Q
s
的元素为变量构建概率分布且通过I
e
与P
s
和Q
s
的映射关系,生成符合F(aim,elm)分布规律的城市体检指标体系特色语义材料C
s
,其内容为集合I
e
的元素,数量为利用C
o
以及C
s
得到语义材料C,三者关系为C=C
o
+C
s
,以上,通过参数α
i
、β
j
和φ调控城市体检特色语义材料的概率分布,形成不同版本的城市体检语义材料C,并记录版本参数特征。
[0023]进一步,具体的,所述步骤120的内容包括,
[0024]步骤121、根据预设的城市体检评估语义材料主题数量优选机制,获得每个主题的
主题词概率分布,
[0025]使用doc2bow方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向城市体检主题场景的评估方法,其特征在于,包括以下:步骤110、获取城市体验文本材料,根据预设置的处理方法对所述城市体验文本进行预处理,得到具备城市体检指标体系特色的城市体检语义材料;步骤120、根据具备城市体检指标体系特色的城市体检语义材料,构建城市体检主题评估方案;步骤130、基于城市体检主题评估方案,构建城市体检主题评估模型;步骤140、基于所述城市体检主题评估模型对城市体检主题场景进行评估,得到评估结果。2.根据权利要求1所述的一种面向城市体检主题场景的评估方法,其特征在于,具体的,步骤110中的内容包括,步骤111、抽取城市体检成果文本库内容,获得城市体检文本材料,城市体检成果文本库包括城市体检工作评估报告、城市体检工作技术指南、第三方体检报告、居民满意度调查结果,抽取的文本包括指标名称、指标类型、指标体系、指标解释、指标计算公式、评估标准、体检结果;步骤112、基于城市体检文本材料提取城市体检评估要素,获得城市体检评估要素集合,通过对指标名称的拆分得到结果集合I
o
,通过对集合I
o
的提取获得城市体检评估要素以及集合I
e
,同时得到集合I
e
的补集,即集合其数学关系为集合将作为停用词集合的一部分内容,集合I
e
将作为词典的一部分内容;步骤113、利用城市体检评估要素集合补充停用词集合与词典,获得城市体检领域内的初始停用词集合与初始词典,预先对停用词集合和词典进行设计,获得初始停用词集合S
o
和初始词典D
o
,初始停用词集合S
o
包括常见中文停用词集合S
c
与集合数学关系为初始词典D
o
的内容为集合I
e
;步骤114、基于初始停用词集合与初始词典,根据预设的停用词集合与词典扩充内循环机制,获得城市体检领域内停用词集合与词典,城市体检文本材料数量记为N
docs
,分n次调用随机数量的城市体检文本材料,第i次调用的数量记为a
i
且a
i
是处在0.05N
docs
至0.1N
docs
之间的整数,调用次数处在10到20次之间。数学表达为循环开始后,第一次调用数量为a1的城市体检文本,先基于初始词典D
o
干预拆分结果并进行拆分,以集合S
o
配合词性的方式过滤拆分结果,得到首批次的城市体检文本拆分结果A1,将结果A1分为有效结果集合E1,表征城市体检评估的实质性内容;无效结果集合U1,定义为算法遗漏的词汇,表征无法提供城市体检特色的语义信息;错误集合M1,表征具有明显错误或极为不符合语义环境的拆分结果,扩充机制为,综合利用第i次的拆分结果,使用有效结果集合E
i
扩充初始词典D
o
,使用错误集合M
i
扩充初始停用词集合S
o
,并利用第i次扩充后的停用词集合S
i
与词典D
i
对第i+1次的拆分结果进行影响,当循环进行到第n次,城市体检评估领域内停用词集合为S,数学表达式为城市体检评估领域内词典为D,数学表达式为步骤115、结合停用词集合、词典以及城市体检评估要素集合,构建城市体检语义材料
和版本参数特征,定义体系P和体系Q,体系P基于概念以及目标对指标进行了分类,其类别集合记作P
s
={aim1,aim2,

,aim
p
},其元素数量为p,体系Q基于概念以及要素对指标进行了分类其类别集合记作Q
s
={elm1,elm2,

,elm
q
},其元素数量为q,以集合I
e
的元素为基准,分别与P
s
和Q
s
的元素建立映射关系,对城市体检评估文本材料进行拆分,并通过字典D影响拆分结果,通过集合S进行停用词过滤,获取初始城市体检语义材料C
o
,其数量与文本材料一致,即N
docs
,以P
s
和Q
s
的元素为变量构建概率分布且通过I
e
与P
s
和Q
s
的映射关系,生成符合F(aim,elm)分布规律的城市体检指标体系特色语义材料C
s
,其内容为集合I
e
的元素,数量为N
Cs
=φN
docs
,φ∈(0,1),利用C
o
以及C
s
得到语义材料C,三者关系为C=C
o
+C
s
,以上,通过参数α
i
、β
j
和φ调控城市体检特色语义材料的概率分布,形成不同版本的城市体检语义材料C,并记录版本参数特征。3.根据权利要求1所述的一种面向城市体检主题场景的评估方法,其特征在于,具体的,所述步骤120的内容包括,步骤121、根据预设的城市体检评估语义材料主题数量优选机制,获得每个主题的主题词概率分布,使用doc2bow方法对城市体检评估语义材料C进行向量化操作,使用LDA...

【专利技术属性】
技术研发人员:王驭王思佳陈婉莹黄雍怀张晓阳支盼丁陈轶文黄文理
申请(专利权)人:广州市阿尔法软件信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1