一种基于人工智能的智慧社区知识库体系的快速建立方法技术

技术编号:30437492 阅读:18 留言:0更新日期:2021-10-24 17:40
本发明专利技术提出了一种基于人工智能下社区知识库体系的快速建立方法,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句;对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对聊天语句进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案;对中文分词的实体词条进行频次判断,选取频次达到阈值的实体词条,对比更新本地问题标签库。本发明专利技术不仅能够有效针对新兴知识快速自动的完善社区知识库,避免了人工操作的麻烦,保证了知识库的时效性,并且能够自动追踪热点话题,提高了知识库的专业覆盖量。的专业覆盖量。的专业覆盖量。

【技术实现步骤摘要】
一种基于人工智能的智慧社区知识库体系的快速建立方法


[0001]本专利技术涉及计算机应用领域,特别是一种基于人工智能下社区知识库体系的快速建立方法。

技术介绍

[0002]自然语言中存在人类生活中的各类事件的描述,一个动作或一个历史事件,同时也包括事件产生的事件、地点、人物、状态以及事件之间的联系。随着互联网时代的兴起,人们的沟通越来越多的依赖QQ、微信等社交软件来进行沟通交流,获取信息,而这些信息往往呈现出海量、剧增、冗余等特性。为了能够更加快速有效的监控和运用其中有效的信息,人为的收集分析显然无法解决效率问题,计算机应用能够自动分析文本消息显得尤为重要,这关系到逐渐兴起的人工智能对话在社区治理领域的应用能力。
[0003]在社区治理中,使用社区专业领域的知识库结合人工智能对话系统,相较于其他传统语料检索的对话系统,具备了社区民生等专有知识的识别能力,能够更懂老百姓的话,让老百姓觉得是在和一位专业的社区网络员在聊天。但是,传统的知识库更多的追求领域覆盖率,专业领域知识的挖掘不够,往往在某个行业内的回复内容不够准确,知识也相对陈旧,更新频率还远远达不到标准。

技术实现思路

[0004]本专利技术的目的在于提出了一种基于人工智能下社区知识库体系的快速建立方法。
[0005]实现本专利技术目的的技术解决方案为:一种基于人工智能下社区知识库体系的快速建立方法,包括如下步骤:
[0006]第一步,以社区为单位建立微信群;
[0007]第二步,基于建立的微信群,以街道为单位植入群机器人自动收集聊天信息;
[0008]第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句;
[0009]第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对聊天语句进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤,得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案;
[0010]第五步,对中文分词的实体词条进行频次判断,选取频次达到阈值的实体词条,对比更新本地问题标签库。
[0011]进一步的,第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句,其中,有效聊天语句是剔除表情、语音和视频以后的文字信息。
[0012]进一步的,第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对民生类问题进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案,具体方法为:
[0013]步骤4

1、初步分类,对初步筛选后的数据进行粗略分类,按照事先定义的分类用问题标签批量查找出相关聊天内容,以问答形式给问题标签存储在知识库的问答数据表;
[0014]步骤4

2、结合语义和意图分析技术,针对有问题标签的语句,将陈述语句经过候选答案抽取、关系推演、吻合程度判断、噪声过滤这些步骤得到答案匹配度,将匹配度最高的陈述句标识为该问题标签的最佳答案;
[0015]步骤4

3、循环步骤4

2,处理定时任务下的所有陈述句,得到准确的问答知识库。
[0016]一种基于人工智能下社区知识库体系的快速建立系统,基于任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。
[0017]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。
[0018]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。
[0019]本专利技术与现有技术相比,其显著优点为:(1)可以有效快速的收集居民提出的各种民生问题。(2)不仅能够有效针对新兴知识快速自动的完善社区知识库,同时避免了人工操作的麻烦,保证知识库的时效性。(3)自动追踪热点话题,提高了知识库的专业覆盖量。
附图说明
[0020]图1是本专利技术基于人工智能下社区知识库体系的快速建立方法的流程图。
具体实施方式
[0021]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0022]如图1所示,一种基于人工智能下社区知识库体系的快速建立方法,其步骤如下:
[0023]步骤1、数据采集
[0024]以社区为单位建立微信群,目前微信最能有效快速反映出老百姓的关注点,依托微信群机器人的强大功能,可以自动快速收集老百姓的关注话题,具体过程如下:
[0025]步骤1

1、社工建群,社区网络员针对自己管辖范围的小区进行建群,群名按照一定规律比如小区名称几群这样,方便居民可以快速加入微信群;
[0026]步骤1

2、居民入群,当微信群建立后,由各居委会组织引导居民加入微信群。
[0027]步骤2、数据提取
[0028]基于第一步微信群植入群机器人,可以7*24小时全天候在线为民服务不打烊,是数据分析统计的基石,具体过程如下:
[0029]以街道为单位在建立的微信群中植入微信机器人,当各街道的微信群都建立完成后,需要把微信机器人加入每个微信群中,建立起应用和居民的联系。
[0030]步骤3、数据筛选
[0031]采集到居民的对话后,针对民生相关问题进行筛选,具体过程如下:
[0032]根据筛选规则,将收集的所有文字(非表情、语音、视频等)聊天数据保存至各社区
的聊天记录库中。
[0033]步骤4、数据分类
[0034]对上一步的有效语料以现有智能分词技术进行话题分类,结合语义分析将陈述句标识答案匹配度,具体过程如下:
[0035]步骤4

1、初步分类,对初步筛选后的数据进行粗略分类,按照事先定义的分类用问题标签批量查找出相关聊天内容,以问答形式给问题标识标签存储在知识库的问答数据表;
[0036]步骤4

2、结合现有语义和意图分析技术,针对有问题标签的语句,将陈述语句经过候选答案抽取、关系推演、吻合程度判断、噪声过滤这些步骤得到答案匹配度,将匹配度最高的陈述句标识为所述问题的最佳答案。
[0037]步骤5、知识库完善
[0038]设定定时任务,循环步骤4中的答案匹配操作,不断优化各民生问题的答案使知识库得以完善,具体过程如下:
[0039]步骤5

1、创建定时任务,抽选问题标签的语句;
[0040]步骤5

2、筛选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能下社区知识库体系的快速建立方法,其特征在于,包括如下步骤:第一步,以社区为单位建立微信群;第二步,基于建立的微信群,以街道为单位植入群机器人自动收集聊天信息;第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句;第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对聊天语句进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤,得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案;第五步,对中文分词的实体词条进行频次判断,选取频次达到阈值的实体词条,对比更新本地问题标签库。2.根据权利要求1所述的基于人工智能下社区知识库体系的快速建立方法,其特征在于,第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句,其中,有效聊天语句是剔除表情、语音和视频以后的文字信息。3.根据权利要求1所述的基于人工智能下社区知识库体系的快速建立方法,其特征在于,第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对民生类问题进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案,具体方法...

【专利技术属性】
技术研发人员:崔俊赵凯
申请(专利权)人:南京市栖霞区民政事务服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1