The invention belongs to the technical field of Internet and large data analysis, and discloses a lawyer evaluation method and a recommendation method based on large data. The lawyer evaluation method in the invention firstly collects the legal questions issued by users and the answers of lawyers to the corresponding legal questions to form a database; then eliminates invalid data to form an effective database; then evaluates the professional level data and the data of each lawyer's field of expertise; and finally stores them. . The lawyer recommendation method in the invention firstly obtains legal problems, processes word segmentation, evaluates similarity, obtains the professional field to which the lawyer belongs, screens out the lawyer who is good at the current professional field, then sorts the selected lawyers according to the professional level data, and then outputs the lawyer information after further screening. To the man-machine interface. The invention can accurately evaluate the lawyer's professional level and field of expertise, and has high recommendation accuracy, and can effectively improve the user experience.
【技术实现步骤摘要】
一种基于大数据的律师评估方法及推荐方法
本专利技术属于互联网与大数据分析
,具体涉及一种基于大数据的律师评估方法及推荐方法。
技术介绍
在互联网+、大数据及人工智能的背景下,法律行业也正在不断创新。“法律机器人”、智能法律服务等服务方式为公众提了供质优价廉的法律咨询服务,提高了律师的服务效率,同时为法官提供了更加精准的判决参考,由此也促进了国家的法治建设、社会公平与公正。由于法律行业的特殊性,特别是受案情本身的复杂性、描述的不规则等因素影响,人工智能在法律领域的应用遇到极大的挑战。为了推进法律人工智能的建设,现有的技术中出现了连接有法律咨询需求的用户与律师之间的互联网平台,用户可就自己遇到的法律问题向律师平台请求咨询,平台接收到问题后,根据咨询的问题推荐与盖问题最相关的几个律师,让这几个律师回复该用户的问题,以解决用户的法律咨询需求。目前,传统的推荐系统大致可以分为基于用户相似度、基于商品相似度或两种相似度结合的推荐系统。这些传统的推荐方法与系统在专业性很强的律师领域仍然存在许多有待克服的问题以提高其实用性。语义相似度的度量是律师专业水平和擅长领域判断的重要内容。律师推荐系统的问答数据的文本间相似度的度量直接导致律师的专业水平的评定和擅长领域的判定。当两个概念元素在语义上具有某些共同特征时,表示为他们语义相似。传统的语义距离只考虑了概念间的上下位关系,忽略了其他关系的影响,比如,等同关系、矛盾关系、互补关系、动作关系、空间关系等等,显然导致不能完整反映出概念的语义距离。研究发现传统采用词频统计和余弦相似度等方法已经不能很好地度量律师问答和领域之间的相 ...
【技术保护点】
1.一种基于大数据的律师评估方法,其特征在于:包括以下步骤:S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库;S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据;S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。
【技术特征摘要】
1.一种基于大数据的律师评估方法,其特征在于:包括以下步骤:S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库;S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据;S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。2.根据权利要求1所述的基于大数据的律师评估方法,其特征在于:所述的步骤S2中,进行预处理的具体步骤如下:S201.将步骤S1中的数据库中法律问题与预存的无效问题进行比对,将比对结果一致的法律问题及其对应的答复进行剔除,形成初次预处理数据库;S202.对步骤S201中的初次预处理数据库中的法律问题的文本长度L设置模型参考阈值k,将文本长度L<参考阈值k的法律问题及其对应的答复进行剔除,形成有效数据库。3.根据权利要求1所述的基于大数据的律师评估方法,其特征在于:所述的步骤S3中,得到专业水平数据的具体步骤如下:S301.将当前律师在回答法律问题的所有答复信息中的关键词与法律专业领域的词汇库进行对比分析,通过词语语义相似度得到有效数据库中所有律师的专业水平的第一排名;S302.将当前律师在回答法律问题的所有答复信息中引用法律条文的答复信息数目Nlaw与所有的答复信息数目N0进行计算,通过Nlaw/N0的比值得到有效数据库中所有律师的专业水平的第二排名;S303.将当前律师在回答法律问题的所有答复信息的文本长度分别进行基于对数函数的计算,通过答复信息的充实程度得到有效数据库中所有律师的专业水平的第三排名,所述的答复信息的充实程度需满足:其中,Li为当前律师对第i条法律问题进行答复时对应的答复信息的文本长度,m为常数,N0为数据库中当前律师回复的所有法律问题的数目;S304.将当前律师在回答法律问题的所有答复信息与差答复关键词集合Tkey分别进行比对,当一条答复信息出现Tkey即判定当前答复信息为差答复,通过差答复的数量得到有效数据库中所有律师的专业水平的第四排名;S305.将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断,通过当前律师的答复相似度得到有效数据库中所有律师的专业水平的第五排名;S306.通过S301中的第一排名、S302中的第二排名、S303中的第三排名、S304中的第四排名及S305中的第五排名得到有效数据库中所有律师的专业水平的最终排名,所述的最终排名即为专业水平数据。4.根据权利要求3所述的基于大数据的律师评估方法,其特征在于:所述的步骤S305中,将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断时,设Ak={wk1,wk2,wk3,…,wki,…,wkk}表示的是词语个数为k的一条答复信息的词集,其中,wki表示Ak中的第i个词语;设Ap={wp1,wp2,wp3,…wpi,…,wpp}表示的是词语个数为p的答复信息的词集,其中,wpi表示Ap中的第i个词语;Mijn为第n次去掉矩阵Skp的第i行和第j列的余子阵;答复信息Ak和答复信息Ap的相似矩阵记为Skp=(sij),其中sij=TEXTSIM(ωki,wpj)(i=1,2,3,…,k;j=1,2,3,…,p);答复信息Ak和答复信息Ap的相似度的判断步骤如下:S305a.找出相似矩阵Skp的第1行的最大值在第i列,这个最大...
【专利技术属性】
技术研发人员:李明奇,杨开平,王志勇,覃思义,李良,何国良,张勇,李厚彪,李小平,
申请(专利权)人:成都智联数创科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。