一种保险条款咨询自动回答的方法技术

技术编号:39655071 阅读:7 留言:0更新日期:2023-12-09 11:23
本发明专利技术提供了一种保险条款咨询自动回答的方法

【技术实现步骤摘要】
一种保险条款咨询自动回答的方法、介质及系统


[0001]本专利技术属于计算机
,具体而言,涉及一种保险条款咨询自动回答的方法

介质及系统


技术介绍

[0002]保险作为现代社会的重要经济行业,不仅为人们提供了重要的财产保障,同时也为增强社会安全感和生活幸福感做出了巨大贡献

目前保险条款作为“保险合同”的重要组成部分,常常被认为是难懂的,漫长的

简单而言,大部分的客户没有精力完全阅读保险条款

[0003]常规传统保险条款咨询是指通过传统的人工方式,通过电话

邮件或面对面等形式进行保险条款解读和咨询的服务

首先,由于人力资源的限制,保险公司或服务提供商可能无法提供即时的响应

客户可能需要等待较长的时间才能获得咨询回答,特别是在繁忙时期或高峰时段

这种延迟可能会影响客户的满意度,并可能导致错过一些重要的时机或决策窗口

其次,传统咨询的高效性受到咨询人员的能力和工作效率的影响

每个咨询人员的知识水平和解答能力可能存在差异,这可能导致回答的质量和速度不一致

一些复杂或特殊的问题可能需要更长的时间和更多的研究才能得到解决,降低了咨询的高效性

[0004]传统咨询可能受到咨询人员的知识水平和经验的限制

即使是经验丰富的咨询人员也可能无法涵盖所有保险条款的细节和变化

复杂的保险产品和条款可能需要进一步的研究和解读,而咨询人员可能无法提供最新和全面的信息

在传统咨询中,记录和组织大量的咨询信息可能会面临挑战,特别是在后续查询

回顾和审核时

[0005]传统保险条款咨询的可扩展性也存在一些挑战

随着企业的规模扩大或客户需求的增加,保险公司可能需要大量的咨询人员来满足客户的需求

这可能导致人力资源和成本的增加,并可能限制服务的扩展能力

此外,保险条款咨询的可扩展性还受到服务响应时间和回答质量的影响

如果需要投入更多的时间和资源来确保准确的咨询回答,那么响应时间可能变长,限制了可扩展性


技术实现思路

[0006]有鉴于此,本专利技术提供一种保险条款咨询自动回答的方法

介质及系统,提高了自动回答系统的高效性

准确性

便携性以及可扩展性

[0007]本专利技术是这样实现的:
[0008]本专利技术的第一方面提供一种保险条款咨询自动回答的方法,其中,包括以下步骤:
[0009]S10、
获取用户上传的保险条款
PDF
文档;
[0010]S20、

PDF
文档进行解析,生成计算机可识别的文本记为第一文本;
[0011]S30、
对所述第一文本进行包括分词处理

语义分析

关键词提取

业务模型匹配的信息提取处理,得到
PDF
文档的重要信息,记为文档信息;
[0012]S40、
获取用户的咨询问题,并对咨询问题进行包括分词处理

语义分析

关键词提
取,得到问题关键词;
[0013]S50、
使用问题模型对问题关键词进行优化,得到问题要素;
[0014]S60、
根据得到的问题要素,在预先设置好的保险条款知识库中,自动差值匹配度最高的答案作为参考答案;
[0015]S70、
对参考答案进行敏感词过滤,生成咨询答案并输出给用户;
[0016]其中,所述业务模型和所述问题模型均为基于大语言模型进行微调得到的

[0017]在上述技术方案的基础上,本专利技术的一种保险条款咨询自动回答的方法还可以做如下改进:
[0018]其中,所述对
PDF
文档进行解析,生成计算机可识别的文本记为第一文本,具体步骤包括:
[0019]过滤无效字符,如页眉页脚无关文本;
[0020]规范文字排版,将文本内容重新排版成结构化的段落;
[0021]执行文字识别,对含有图像的文本区域进行
OCR
识别,提取文本;
[0022]执行中文分词,将文本划分为词语;
[0023]保存提取的结构化文本内容作为计算机可识别的第一文本

[0024]采用上述改进方案的有益效果为:通过对
PDF
文档进行解析,生成计算机可识别的文本可以帮助将
PDF
文档中的内容解析为计算机可识别的文本,从而方便进行进一步的文本分析

搜索

处理或提取关键信息等操作

具体实现时,可根据所选的
PDF
解析库的文档和示例代码进行操作

[0025]进一步的,所述对所述第一文本进行包括分词处理

语义分析

关键词提取

业务模型匹配的信息提取处理的步骤,具体包括:
[0026]步骤一,分词处理:
[0027]构建词典;
[0028]从所述第一文本的左边界开始,使用正向最大匹配算法,选择出现的最长词进行匹配;若匹配成功,则将该词加入到词序列,并继续从该词的右边界开始向右匹配,若匹配不成功,则逐步减少词的长度,直到在所述词典中找到匹配词为止;重复步骤,直到整个文本被浏览完毕,得到最终的词序列;
[0029]步骤二,语义分析:
[0030]使用预训练好的词向量模型,获取每个词的对应词向量;
[0031]计算所述词向量之间的相似度,分析所述词序列中词语之间的语义关联情况;
[0032]步骤三,关键词提取:
[0033]使用
TextRank
算法,构建词图;
[0034]将每个词作为所述词图中的一个节点,若两个词的相似度大于阈值,则在所述两个词之间建立一条边,所述边的权重为所述两个词的相似度的值;
[0035]在所述词图上进行
PageRank
计算,迭代计算每个词的
PageRank
值,作为关键词的排序依据,选择排名最高的词作为关键词;
[0036]步骤四,业务模型匹配:
[0037]将提取的所述关键词与预先建立的业务模型进行解释和替换;
[0038]通过与所述业务模型的匹配,将所述关键词标准化,使所述关键词符合所述业务
模型的要求

[0039]进一步的,所述将提取的所述关键词与预先建立本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种保险条款咨询自动回答的方法,其特征在于,包括以下步骤:
S10、
获取用户上传的保险条款
PDF
文档;
S20、

PDF
文档进行解析,生成计算机可识别的文本记为第一文本;
S30、
对所述第一文本进行包括分词处理

语义分析

关键词提取

业务模型匹配的信息提取处理,得到
PDF
文档的重要信息,记为文档信息;
S40、
获取用户的咨询问题,并对咨询问题进行包括分词处理

语义分析

关键词提取,得到问题关键词;
S50、
使用问题模型对问题关键词进行优化,得到问题要素;
S60、
根据得到的问题要素,在预先设置好的保险条款知识库中,自动差值匹配度最高的答案作为参考答案;
S70、
对参考答案进行敏感词过滤,生成咨询答案并输出给用户;其中,所述业务模型和所述问题模型均为基于大语言模型进行微调得到的
。2.
根据权利要求1所述的一种保险条款咨询自动回答的方法,其特征在于,所述对
PDF
文档进行解析,生成计算机可识别的文本记为第一文本,具体步骤包括:过滤无效字符,如页眉页脚无关文本;规范文字排版,将文本内容重新排版成结构化的段落;执行文字识别,对含有图像的文本区域进行
OCR
识别,提取文本;执行中文分词,将文本划分为词语;保存提取的结构化文本内容作为计算机可识别的第一文本
。3.
根据权利要求2所述的一种保险条款咨询自动回答的方法,其特征在于,所述对所述第一文本进行包括分词处理

语义分析

关键词提取

业务模型匹配的信息提取处理的步骤,具体包括:步骤一,分词处理:构建词典;从所述第一文本的左边界开始,使用正向最大匹配算法,选择出现的最长词进行匹配;若匹配成功,则将该词加入到词序列,并继续从该词的右边界开始向右匹配,若匹配不成功,则逐步减少词的长度,直到在所述词典中找到匹配词为止;重复步骤,直到整个文本被浏览完毕,得到最终的词序列;步骤二,语义分析:使用预训练好的词向量模型,获取每个词的对应词向量;计算所述词向量之间的相似度,分析所述词序列中词语之间的语义关联情况;步骤三,关键词提取:使用
TextRank
算法,构建词图;将每个词作为所述词图中的一个节点,若两个词的相似度大于阈值,则在所述两个词之间建立一条边,所述边的权重为所述两个词的相似度的值;在所述词图上进行
PageRank
计算,迭代计算每个词的
PageRank
值,作为关键词的排序依据,选择排名最高的词作为关键词;步骤四,业务模型匹配:将提取的所述关键词与预先建立的业务模型进行解释和替换;
通过与所述业务模型的匹配,将所述关键词标准化,使所述关键词符合所述业务模型的...

【专利技术属性】
技术研发人员:李闯王合平张春剑吴凯
申请(专利权)人:众淼创新科技青岛股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1