一种基于历史案件大数据的智能问答方法及系统技术方案

技术编号:28059794 阅读:38 留言:0更新日期:2021-04-14 13:35
本发明专利技术公开了一种基于历史案件大数据的智能问答方法及系统,其中该方法包括:步骤1,利用倒排索引建立法律法规、规章制度的法律库,构建倒排索引法律库,步骤3,构建法律与诉求问题的适用度计算模型,选取适用法律,步骤4,结合问题主题描述T计算优化系数,步骤5,返回适合问题Question答案;通过产品自动回答申请人或使用者的问题,帮助申请人智能解决问题,解放相关工作部门的人力物力;通过对匹配效率的提示使得系统能够实时回答,优化使用者体验。此外,本系统考虑到了申请人的情感状态,能够更好的安抚申请人情绪,避免出现情绪激动所产生的不理性行为。所产生的不理性行为。

【技术实现步骤摘要】
一种基于历史案件大数据的智能问答方法及系统


[0001]本专利技术涉及涉及自然语言处理、知识图谱和智能案件处理领域,具体涉及一 种基于历史案件大数据的智能问答方法及系统。

技术介绍

[0002]目前的案件处理仍然是传统的申请人员通过线下/线上的方式提交请求申请, 相关工作部门根据相关法律法规、工作规范、案例经验等形成相应的解决方案反 馈给申请人。申请人缺乏有效的智能自助工具无法判断自身请求的合理合法性以 及获取法律法规所规定的解决方案,部分申请人在难以快速获取有效的反馈时会 采取不理性的措施。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:申请人缺 乏自主问答系统,对于自身诉求无法获取可以参考的法律条文、规章制度,无法 提前了解自身诉求的合理性以及解决方案。此外,申请人的口语化描述与法律条 文的书面化描述存在较大差异,普通的检索系统无法准确回答相关问题且检索效 率低下。无法根据申请人的使用体验进行系统优化。

技术实现思路

[0004]为了克服现有技术的不足,本公开实施例提供了一种基于历史案本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于历史案件大数据的智能问答方法,其特征在于,该方法包括如下步骤:步骤1,利用倒排索引建立法律法规、规章制度的法律库,构建倒排索引法律库存储案件处理需要的法律法规文本、规章制度文本中每一章或每一节或每一条的文本数据,通过倒排索引建立法律库,具体的,倒排索引是指将文本进行分词,通过词a构建文档集合S(a)={文档1,文档2,文档3,

},文档集合S(a)中的每个文档是包含词a的一条法律条文,词a就是索引词语,而集合S(a)就是对应的值;步骤2,提取请求人语音问题的文本通过语音识别技术识别请求人通过语音方式描述的诉求问题的主题及具体问题,将描述的诉求问题转换为主题描述T和问题文本描述Q,对文本描述Q进行细粒度分词得到分词结果segment(Q){Q1,Q2,Q3,....};步骤3,构建法律与诉求问题的适用度计算模型,选取适用法律;通过分词结果segment(Q),对于segment(Q)中的每个词语Qi(i=1,2,3,

),从倒排索引法律库获取包含词语Qi的文档S(Qi),对于S(Qi)中的每个文档也就是法律条文L,根据tf

idf算法设计模型计算不同法律条文L与词语Qi的适用度,适用度越高的法律条文越适合作为问题的答案;步骤4,结合问题主题描述T计算优化系数;通过对问题主题描述T在不分词的基础上,优化适用度计算模型,设计主题描述T与法律条文L的优化系数len(T),len(L)分别是主题描述T,法律条文L的字数在优化系数设计时,当主题描述T字数越长,且法律条文L越短时,法律条文L包含了主题描述T的可能性越低,所以此种情况下法律条文L包含了主题描述T的适用度应当给予更高的值,γ(T,L)的表达式满足了这一点,且设置了上限阈值,避免优化系数过大;步骤5,返回适合问题Question答案;结合步骤3和步骤4的结果,得到问题Question与法律条文L的适用度:Score(L,Question)=Score(L,Q)*γ(T,L)通过与问题的适用度计算,得到适用度从高到低的法律条文,根据需求选取其中一定数量适用度最高的法律条文作为答案。2.根据权利要求1所述的一种基于历史案件大数据的智能问答方法,其特征在于,步骤1还包括对于倒排索引中的索引词语,根据拼音首字母按顺序排序。3.根据权利要求1所述的一种基于历史案件大数据的智能问答方法,其特征在于,步骤1所述将文本进行分词为:采用细粒度的分词技术,提取出文本中所有的词语。4.根据权利要求1

3任一项所述的一种基于历史案件大数据的智能问答方法,其特征在于,步骤2还包括提取请求人的情感,根据语音的情感分析方法识别申请人描述问题时的情感状态类别,具体的,情感状态类别包括正面、中度、负面、极端激动。
5.根据权利要求1

3任一项所述的一种基于历史案件大数据的智能问答方法,其特征在于,当步骤2中问题文本描述Q过长时,先通过自动文摘提取技术筛选出问题描述的文摘,对文摘进行细粒度分词。6.根据权利要求5所述的一种基于历史案件大数据的智能问答方法,其特征在于,提取技术筛选出问题描述的文摘,具体为,将问题文本描述Q以标点符号为间隔拆分为若干个句子,对于每个句子Sent,去除句子中的语气词、形容词,保留名词、动词、专有名词作为句子的保留词,统计这些词的总字数后除以句子自身字数得到句子的分值R(Sent),通过迭代更...

【专利技术属性】
技术研发人员:陈贵龙周金明
申请(专利权)人:权利要求书三页说明书八页
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1