一种基于大数据的律师评估方法及推荐方法技术

技术编号:18894828 阅读:30 留言:0更新日期:2018-09-08 11:07
本发明专利技术属于互联网与大数据分析技术领域,公开了一种基于大数据的律师评估方法及推荐方法。本发明专利技术中的律师评估方法,首先采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;接着剔除掉无效数据,形成有效数据库;接着进行评估得到每个律师的专业水平数据及擅长领域数据;最后进行存储。本发明专利技术中的律师推荐方法,首先获取法律问题,并进行分词处理、评估相似度,得到其所属的专业领域,筛选出擅长当前专业领域的律师;接着根据专业水平数据,对筛选出的律师进行排序,然后进一步筛选后将律师信息输出至人机界面。本发明专利技术可以准确评价律师的专业水平及擅长领域,推荐准确性高,能够有效提升用户体验度。

A lawyer evaluation method and recommendation method based on big data

The invention belongs to the technical field of Internet and large data analysis, and discloses a lawyer evaluation method and a recommendation method based on large data. The lawyer evaluation method in the invention firstly collects the legal questions issued by users and the answers of lawyers to the corresponding legal questions to form a database; then eliminates invalid data to form an effective database; then evaluates the professional level data and the data of each lawyer's field of expertise; and finally stores them. . The lawyer recommendation method in the invention firstly obtains legal problems, processes word segmentation, evaluates similarity, obtains the professional field to which the lawyer belongs, screens out the lawyer who is good at the current professional field, then sorts the selected lawyers according to the professional level data, and then outputs the lawyer information after further screening. To the man-machine interface. The invention can accurately evaluate the lawyer's professional level and field of expertise, and has high recommendation accuracy, and can effectively improve the user experience.

【技术实现步骤摘要】
一种基于大数据的律师评估方法及推荐方法
本专利技术属于互联网与大数据分析
,具体涉及一种基于大数据的律师评估方法及推荐方法。
技术介绍
在互联网+、大数据及人工智能的背景下,法律行业也正在不断创新。“法律机器人”、智能法律服务等服务方式为公众提了供质优价廉的法律咨询服务,提高了律师的服务效率,同时为法官提供了更加精准的判决参考,由此也促进了国家的法治建设、社会公平与公正。由于法律行业的特殊性,特别是受案情本身的复杂性、描述的不规则等因素影响,人工智能在法律领域的应用遇到极大的挑战。为了推进法律人工智能的建设,现有的技术中出现了连接有法律咨询需求的用户与律师之间的互联网平台,用户可就自己遇到的法律问题向律师平台请求咨询,平台接收到问题后,根据咨询的问题推荐与盖问题最相关的几个律师,让这几个律师回复该用户的问题,以解决用户的法律咨询需求。目前,传统的推荐系统大致可以分为基于用户相似度、基于商品相似度或两种相似度结合的推荐系统。这些传统的推荐方法与系统在专业性很强的律师领域仍然存在许多有待克服的问题以提高其实用性。语义相似度的度量是律师专业水平和擅长领域判断的重要内容。律师推荐系统的问答数据的文本间相似度的度量直接导致律师的专业水平的评定和擅长领域的判定。当两个概念元素在语义上具有某些共同特征时,表示为他们语义相似。传统的语义距离只考虑了概念间的上下位关系,忽略了其他关系的影响,比如,等同关系、矛盾关系、互补关系、动作关系、空间关系等等,显然导致不能完整反映出概念的语义距离。研究发现传统采用词频统计和余弦相似度等方法已经不能很好地度量律师问答和领域之间的相似度,从而使得律师推荐的专业度准确性大大降低,给用户及提供咨询答复的律师均造成了极大的不便。
技术实现思路
为了解决现有技术存在的上述问题,本专利技术目的在于提供一种可以准确评价律师的专业水平及擅长领域、推荐准确性高、能够有效提升用户体验度的基于大数据的律师评估方法及推荐方法。本专利技术所采用的技术方案为:一种基于大数据的律师评估方法,包括以下步骤:S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库;S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据;S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。作为优选,所述的步骤S2中,进行预处理的具体步骤如下:S201.将步骤S1中的数据库中法律问题与预存的无效问题进行比对,将比对结果一致的法律问题及其对应的答复进行剔除,形成初次预处理数据库;S202.对步骤S201中的初次预处理数据库中的法律问题的文本长度L设置模型参考阈值k,将文本长度L<参考阈值k的法律问题及其对应的答复进行剔除,形成有效数据库。作为优选,所述的步骤S3中,得到专业水平数据的具体步骤如下:S301.将当前律师在回答法律问题的所有答复信息中的关键词与法律专业领域的词汇库进行对比分析,通过词语语义相似度得到有效数据库中所有律师的专业水平的第一排名;S302.将当前律师在回答法律问题的所有答复信息中引用法律条文的答复信息数目Nlaw与所有的答复信息数目N0进行计算,通过Nlaw/N0的比值得到有效数据库中所有律师的专业水平的第二排名;S303.将当前律师在回答法律问题的所有答复信息的文本长度分别进行基于对数函数的计算,通过答复信息的充实程度得到有效数据库中所有律师的专业水平的第三排名,所述的答复信息的充实程度需满足:其中,Li为当前律师对第i条法律问题进行答复时对应的答复信息的文本长度,m为常数,N0为数据库中当前律师回复的所有法律问题的数目;S304.将当前律师在回答法律问题的所有答复信息与差答复关键词集合Tkey分别进行比对,当一条答复信息出现Tkey即判定当前答复信息为差答复,通过差答复的数量得到有效数据库中所有律师的专业水平的第四排名;S305.将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断,通过当前律师的答复相似度得到有效数据库中所有律师的专业水平的第五排名;S306.通过S301中的第一排名、S302中的第二排名、S303中的第三排名、S304中的第四排名及S305中的第五排名得到有效数据库中所有律师的专业水平的最终排名,所述的最终排名即为专业水平数据。作为优选,所述的步骤S305中,将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断时,设Ak={wk1,wk2,wk3,…,wki,…,wkk}表示的是词语个数为k的一条答复信息的词集,其中,wki表示Ak中的第i个词语;设Ap={wp1,wp2,wp3,…wpi,…,wpp}表示的是词语个数为p的答复信息的词集,其中,wpi表示Ap中的第i个词语;Mijn为第n次去掉矩阵Skp的第i行和第j列的余子阵;答复信息Ak和答复信息Ap的相似矩阵记为Skp=(sij),其中sij=TEXTSIM(ωki,wpj)(i=1,2,3,…,k;j=1,2,3,…,p);答复信息Ak和答复信息Ap的相似度的判断步骤如下:S305a.找出相似矩阵Skp的第1行的最大值在第i列,这个最大值记为m1,再去掉矩阵中的这个最大值所在的行列,即去掉矩阵Skp的第1行和第i列得到余子阵M1i1;S305b.找余子阵M1i1第1行的最大值在第j列,这个最大值记为m2,再去掉矩阵M1i1中第1行的这个最大值所在的行列,即去掉矩阵M1i1的第1行和第j列得到余子阵M1j2;S305c.重复步骤S305a与步骤S305b,直到得到余子阵为空矩阵,则答复信息Ak和答复信息Ap之间的相似度满足:l=min(p,k),其中,l为查找的次数;TEXTSIM(Ak,Ap)的值越大,表示答复信息Ak和答复信息Ap的相似度越高。作为优选,所述的步骤S4中,得到擅长领域数据时,统计不同的法律的专业领域的专业词语,并将当前律师在回答法律问题的所有答复信息中关键字与各个专业领域的专业词语分别进行比对,通过比对结果得到擅长领域数据。作为优选,将当前律师在回答法律问题的所有答复信息中关键字与各个专业领域的专业词语分别进行比对时,具体步骤如下:S401a.将有效数据库中的每个律师的答复信息进行分组处理,即分成每一个问答对;S401b.将步骤S401a中得到的问答对中的答复信息的文本进行特征词汇提取;S401c.将步骤S401b中提取出的特征词汇和专业领域词语Sp(p为0,1,2,3,4,…,T)计算相似度值,然后得到每个特征词汇所属的专业领域,并为每个特征词汇标记领域标签,得到标签特征词汇;S401d.将步骤S401c中得到的标签特征词汇进行分类处理,则含有最多数目的标签特征词汇的专业领域即为当前律师最擅长的专业领域,由此得到当前律师的擅长领域信息。作为优选,将当前律师在回答法律问题的所有答复信息中关键字与各个专业领域的专业词语分别进行比对时,还包括以下步骤:S401e.采集步骤S401a中得到的问答对中的法律问题的数量,设当前律师在任一专业领域中答复的法律问题为Nfield,当前律师本文档来自技高网
...

【技术保护点】
1.一种基于大数据的律师评估方法,其特征在于:包括以下步骤:S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库;S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据;S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。

【技术特征摘要】
1.一种基于大数据的律师评估方法,其特征在于:包括以下步骤:S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库;S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据;S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。2.根据权利要求1所述的基于大数据的律师评估方法,其特征在于:所述的步骤S2中,进行预处理的具体步骤如下:S201.将步骤S1中的数据库中法律问题与预存的无效问题进行比对,将比对结果一致的法律问题及其对应的答复进行剔除,形成初次预处理数据库;S202.对步骤S201中的初次预处理数据库中的法律问题的文本长度L设置模型参考阈值k,将文本长度L<参考阈值k的法律问题及其对应的答复进行剔除,形成有效数据库。3.根据权利要求1所述的基于大数据的律师评估方法,其特征在于:所述的步骤S3中,得到专业水平数据的具体步骤如下:S301.将当前律师在回答法律问题的所有答复信息中的关键词与法律专业领域的词汇库进行对比分析,通过词语语义相似度得到有效数据库中所有律师的专业水平的第一排名;S302.将当前律师在回答法律问题的所有答复信息中引用法律条文的答复信息数目Nlaw与所有的答复信息数目N0进行计算,通过Nlaw/N0的比值得到有效数据库中所有律师的专业水平的第二排名;S303.将当前律师在回答法律问题的所有答复信息的文本长度分别进行基于对数函数的计算,通过答复信息的充实程度得到有效数据库中所有律师的专业水平的第三排名,所述的答复信息的充实程度需满足:其中,Li为当前律师对第i条法律问题进行答复时对应的答复信息的文本长度,m为常数,N0为数据库中当前律师回复的所有法律问题的数目;S304.将当前律师在回答法律问题的所有答复信息与差答复关键词集合Tkey分别进行比对,当一条答复信息出现Tkey即判定当前答复信息为差答复,通过差答复的数量得到有效数据库中所有律师的专业水平的第四排名;S305.将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断,通过当前律师的答复相似度得到有效数据库中所有律师的专业水平的第五排名;S306.通过S301中的第一排名、S302中的第二排名、S303中的第三排名、S304中的第四排名及S305中的第五排名得到有效数据库中所有律师的专业水平的最终排名,所述的最终排名即为专业水平数据。4.根据权利要求3所述的基于大数据的律师评估方法,其特征在于:所述的步骤S305中,将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断时,设Ak={wk1,wk2,wk3,…,wki,…,wkk}表示的是词语个数为k的一条答复信息的词集,其中,wki表示Ak中的第i个词语;设Ap={wp1,wp2,wp3,…wpi,…,wpp}表示的是词语个数为p的答复信息的词集,其中,wpi表示Ap中的第i个词语;Mijn为第n次去掉矩阵Skp的第i行和第j列的余子阵;答复信息Ak和答复信息Ap的相似矩阵记为Skp=(sij),其中sij=TEXTSIM(ωki,wpj)(i=1,2,3,…,k;j=1,2,3,…,p);答复信息Ak和答复信息Ap的相似度的判断步骤如下:S305a.找出相似矩阵Skp的第1行的最大值在第i列,这个最大...

【专利技术属性】
技术研发人员:李明奇杨开平王志勇覃思义李良何国良张勇李厚彪李小平
申请(专利权)人:成都智联数创科技有限公司
类型:发明
国别省市:四川,51

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1