一种基于知识图谱的城市热线派单方法及系统技术方案

技术编号:37053117 阅读:22 留言:0更新日期:2023-03-29 19:30
本发明专利技术公开了一种基于知识图谱的城市热线派单方法及系统,涉及语言处理技术领域。包括步骤:获得城市热线数据,对城市热线数据进行预处理,形成热线数据集;对预处理后的热线数据集使用企业建模法构建城市热线本体;根据城市热线本体,对热线数据集使用语言技术平台进行实体与属性关系抽取,抽取出的实体与属性关系以三元组的形式进行存储;将存储的三元组导入到数据库中,完成城市热线知识图谱的构建;对待派单的城市热线事件根据城市热线知识图谱的实体特征进行检索,根据检索结果进行派单。本发明专利技术的城市热线派单方法减少了热线派单过程中的人工经验依赖,提高了派单的准确率和效率,具有广阔的应用前景。具有广阔的应用前景。具有广阔的应用前景。

【技术实现步骤摘要】
一种基于知识图谱的城市热线派单方法及系统


[0001]本专利技术涉及语言处理
,尤其涉及一种基于知识图谱的城市热线派单方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着城市的高速发展,市民越来越习惯于拨打政务服务便民热线寻求帮助和提出一些自己的建议。但随着热线数据量的巨增,如何快速筛选和处理这些热线成为了目前政务服务便民热线的一个迫切需求。
[0004]自然语言处理和大数据分析技术目前来说相对成熟,大数据分析是对大量数据进行快速的筛选,选择出需要的目标数据,完成对数据快速地分类处理。自然语言处理可以对文本数据进行快速处理,同时可以通过存入图数据库,以知识图谱的形式展示,做到数据的可视化。
[0005]然而专利技术人发现,现有的热线数据处理过程中还是依赖于人工派单的方式,无法将大数据分析和自然语言处理技术融合应用到热线数据的分类和派单中。另外,热线数据不仅数量巨大而且内容繁杂,对于许多无效和重复的热线数据不能进行有效的筛选,造成了热线数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的城市热线派单方法,其特征在于,包括以下步骤:获得城市热线数据,对城市热线数据进行预处理,形成热线数据集;对预处理后的热线数据集使用企业建模法构建城市热线本体;根据城市热线本体,对热线数据集使用语言技术平台进行实体与属性关系抽取,抽取出的实体与属性关系以三元组的形式进行存储;将存储的三元组导入到数据库中,完成城市热线知识图谱的构建;对待派单的城市热线事件根据城市热线知识图谱的实体特征进行检索,根据检索结果进行派单。2.如权利要求1所述的基于知识图谱的城市热线派单方法,其特征在于,对城市热线数据进行预处理步骤包括:通过对重要的实体类进行查询确定重复数据,将重复数据进行删除操作;通过对在图数据库中实体类无法与属性类进行关系构建的派单进行查询确定有误数据,对有误数据进行清洗操作。3.如权利要求2所述的基于知识图谱的城市热线派单方法,其特征在于,对有误数据进行清洗操作的具体步骤为:根据所有变量选择方法和数据预处理方式得到若干种组合清洗方式,将各种组合清洗方式基于有误数据采用不同的拟合模型进行拟合对比,选取拟合对比效果最高的组合清洗方式对有误数据进行清洗操作。4.如权利要求3所述的基于知识图谱的城市热线派单方法,其特征在于,变量选择方法包括:方差分析法、卡方检验法、互信息法或Copula熵法。5.如权利要求4所述的基于知识图谱的城市热线派单方法,其特征在于,数据预处理方式包括定量变量处理和定性变量处理,定量变量处理包括:不处理、正态化、标准化、归一化、先正态化后归一化、先标准化后归一化、先归一化后标准化、先正态化再标准化后归一化和先正态化再归一化后标准化;定性变量处理包括不引入哑变量或引入哑变量。6.如权利要求1所述的基于知识图谱的城市热线派单方法,其特征在于,对预处理后的热线数据集使用企业建模法构建城市热线本体的具体步骤为:根据热线数据集的热线内容得到激励...

【专利技术属性】
技术研发人员:陈作海钱恒高永超
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1