【技术实现步骤摘要】
本专利技术涉及自然语言处理,更具体地涉及基于知识图谱的智能问答系统。
技术介绍
1、随着信息公开化进程的推进,越来越多的政策文件向公众开放,公众对政策信息的获取和解读需求日益增加,然而,政策文件通常内容庞杂,包含大量专业术语和复杂条款,公众在理解和运用这些政策时常常面临困难,现有的政策问答系统主要依赖预设规则、文本检索和关键词匹配来提供解答,但是仍然存在以下缺陷:
2、(1) 回答精度低:传统的问答系统通常依赖预设的规则和关键词匹配来生成回答,缺乏对文本语义的深层次理解,这种方式容易导致解读上的偏差,最终生成的答案常常与用户的实际需求不符;尤其是在面对新出台的政策或政策频繁变化的情况下,传统系统的适应性显得尤为不足,难以根据政策内容的语义关联性进行推理,从而无法生成精准的解答;
3、(2)信息检索效率低:现有系统在处理海量的政策文件时,往往难以快速准确地定位相关内容,用户通常需要多次尝试不同的关键词组合才能获得所需信息,降低了使用效率;传统的检索方式在面对多样化的问答需求时,难以提供全面的答案,特别是在用户提问涉
...【技术保护点】
1.基于知识图谱的智能问答系统,其特征在于:包括:
2.根据权利要求1所述的基于知识图谱的智能问答系统,其特征在于:所述目标数据即官方网站的政策文件、法规条例、专家解读文章以及媒体报道;所述目标数据的采集可通过采用高效的抓取工具包进行采集,定期从网站与新闻平台中自动收集政策和法规信息;所述数据预处理包括数据清洗与文本数据处理,所述文本数据处理包括分词、去除停用词以及进行词形还原。
3.根据权利要求2所述的一种基于知识图谱的智能问答系统,其特征在于:所述命名实体识别模型即BERT-NER模型,所述命名实体识别模型可以处理长文本输入,利用上下文信息
...【技术特征摘要】
1.基于知识图谱的智能问答系统,其特征在于:包括:
2.根据权利要求1所述的基于知识图谱的智能问答系统,其特征在于:所述目标数据即官方网站的政策文件、法规条例、专家解读文章以及媒体报道;所述目标数据的采集可通过采用高效的抓取工具包进行采集,定期从网站与新闻平台中自动收集政策和法规信息;所述数据预处理包括数据清洗与文本数据处理,所述文本数据处理包括分词、去除停用词以及进行词形还原。
3.根据权利要求2所述的一种基于知识图谱的智能问答系统,其特征在于:所述命名实体识别模型即bert-ner模型,所述命名实体识别模型可以处理长文本输入,利用上下文信息识别政策文本中的实体和关系;所述实体和关系转换为图谱中的节点和边,所述实体即政策文本,所述关系即实体间的关系;使用知识图谱符号将提取到的实体与关系表示为三元组,所述三元组为主体、谓词以及客体;三元组表示了政策实体之间的关系结构。
4.根据权利要求3所述的基于知识图谱的智能问答系统,其特征在于:所述初步答案即智能问答模块所生成的答案;所述进一步问题为进一步的细节问题与补...
【专利技术属性】
技术研发人员:程德生,万晶,张鹤,白新宇,李阳,
申请(专利权)人:杭州中软安人网络通信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。