当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于众包及图谱技术的知识共享服务方法技术

技术编号:20075121 阅读:15 留言:0更新日期:2019-01-15 00:39
本发明专利技术公开了一种基于众包及图谱技术的知识共享服务方法,包括:步骤1,建立知识图谱,计算出知识图谱中每个知识点的重要性保存在数据库中;步骤2,根据用户发布的题目任务经过语义解析转换为逻辑表达式,在知识图谱中查询到相关的知识点;步骤3,寻找对该任务对应知识点掌握度前Topk的用户并通过众包推荐给这些用户;步骤4,接受该题目任务的若干个用户根据回答时间在该平台上记录下自己的回答;步骤5,发布题目的用户以及浏览该问题的用户根据不同回答者的答案分别对不同回答者的答案进行评分;步骤6,发布题目用户发布的奖励在回答者不超过回答时间的情况下根据发布题目用户对回答的满意度进行权重奖励。

A Knowledge Sharing Service Method Based on Crowdsourcing and Mapping Technology

The invention discloses a knowledge sharing service method based on crowdsourcing and Atlas technology, which includes: step 1, establishing knowledge atlas, calculating the importance of each knowledge point in knowledge atlas, and storing it in database; step 2, transforming it into logical expression through semantic parsing according to user-published topic tasks, and querying relevant knowledge points in knowledge atlas; step 3, searching for relevant knowledge points in knowledge atlas; The users of Topk who have mastered the knowledge points before the task are recommended to these users through crowdsourcing; step 4, several users who accept the task record their answers on the platform according to the response time; step 5, the users who publish the topic and the users who browse the question score the answers of different respondents according to the answers of different respondents; step 6, the users who browse the question score the answers of different respondents according to the answers of different respondents. Rewards issued by users of publishing topics are rewarded by weight according to the satisfaction degree of users of publishing topics when the respondents do not exceed the response time.

【技术实现步骤摘要】
一种基于众包及图谱技术的知识共享服务方法
本专利技术涉及知识共享服务领域,尤其涉及一种基于众包及图谱技术的知识共享服务方法。
技术介绍
近年来,随着社会的进步和人们生活水平的提高,人们逐渐进入共享经济时代,小到充电宝,大到房屋,都可以实现共享,知识也不例外。知识共享的本质是以打破不同知识拥有者之间的壁垒为基础,实现知识在一定范围内的自由流动和使用,使组织降低知识获取成本,并有利于知识的应用与创新。知识共享服务平台中问答系统分为自动问答系统和互动问答系统。自动问答系统主要基于语义匹配进行检索得到答案,互动问答系统采用网络协作的方式提供了一个交流平台,将所有用户组成了一个高效的社会协作网,打破了不同知识拥有者的壁垒,互相解决对方的问题。互动问答系统中完整的问题描述相对于自动问答系统中关键词匹配中更能清晰地表达问题,此外,互动问答系统中允许其他用户回答问题可以解决一些需要推理或者归纳总结的问题。在考研背景下,问题常常是一些不能直接得到答案的问题,往往需要进行推理演算或者归纳总结得到答案的问题,更适用于互动问答系统。另一方面,在当今信息爆炸的时代,网络上充斥着各种各样的知识。一个考研的问题搜索出来的结果可能多种多样,对问题标签分类的不正确可能导致得到的答案完全不符合希望得到解答的学生的需求。考研背景下的互动问答是一个知识共享平台的潜在应用场景。考研背景下的基于众包及图谱技术的知识共享服务平台正好可以帮助考研的学生在线上随时随地解决自己平时遇到的困难问题,而不用跟辅导老师约时间来解惑,高效方便地解决自己的问题。另一方面,对于学生来说,把问题提出来得到百家之言可以扩宽解题思路,而不是局限于辅导老师的某一种解法,并且共享平台上为某道题设置的奖励比特地请一个辅导老师解答问题花费少很多。综上所述,研究基于众包及图谱技术的知识共享服务平台成了一件非常有意义的事情。目前的知识共享服务平台主要是通过对问题进行分类标签来得到相关分类标签的用户的解答,对问题分类标签的不合理以及分类标签范围过大等问题会影响知识共享服务的体验。运用知识图谱中细粒度的知识点以及对知识点的掌握度来推荐用户回答问题来改善问题解答的双方的满意度从而达到高效的知识共享。随着知识图谱技术的发展和成熟,研究考研背景下的知识共享服务平台为考研学子提供互动问答,高效、实惠地解决考研学子学习中的问题是符合实际情况的。
技术实现思路
专利技术目的:本专利技术主要针对基于考研背景下的知识共享服务平台,弥补现有知识共享服务平台在此适用背景下的不足,提供一种基于众包及图谱技术的知识共享服务方法。为了解决上述技术问题,本专利技术公开了一种基于众包及图谱技术的知识共享服务方法,包括以下步骤:步骤1,建立一个知识图谱,并计算出知识图谱中每个知识点的重要性,将其保存在图数据库中;步骤2,将用户发布的题目任务经过语义解析转换为逻辑表达式,在知识图谱中查询到用户发布的题目任务相关的知识点;步骤3,寻找对步骤2查询到的知识点掌握度前Topk的用户,并通过众包将用户发布的题目任务推荐给这些用户;步骤4,接受该题目任务的用户根据回答时间,记录下自己的回答;步骤5,发布题目的用户以及浏览该问题的用户根据不同回答者的答案分别对不同回答者的答案进行评分,评分用于计算回答者对相关知识点的掌握程度;步骤6,发布题目用户发布奖励金,在回答者不超过回答时间的情况下根据发布题目用户对回答的满意度进行权重奖励。步骤1包括如下步骤:步骤1-1,根据当年发布的统考科目的考研大纲或者沿用去年的考研大纲通过KNN算法加CRF模型进行实体抽取,通过共现关联与句法分析发现实体之间的关系进行信息抽取并人工矫正建立一个知识图谱,存储在图数据库中,整个知识图谱呈现一个图的形式,图中的节点表示知识点,图中的边表示知识点之间的关系,每个知识点表示为fact=(factid,factname,label),其中factid表示知识点id,factname表示知识点,label表示知识点的标签;每个关系表示为relationship=(startid,endid,relation,type),其中startid,endid分别表示关系起始的知识点id和关系中止的知识点id,elation表示是一种具体的属性或者一种具体的关系,type表示具体的属性值或者关系;步骤1-2,利用PageRank算法计算出知识图谱中每个知识点的重要性,计算每个知识点的重要性公式如下:其中,PRi表示知识点i的重要性,Mi表示所有对知识点i有出链的知识点的集合,L(j)是知识点j的出链数目,N是知识点总数,α为一个常数。此处α=0.85。步骤2包括如下步骤:步骤2-1,将用户发布的题目任务进行解析,具体为:通过结巴分词,停用词表去停用词,stanford-postagger词性标注,基于序列标注的依存句法分析,每个任务解析后表示为problem=(fact1,relationship1,fact2,relationship2,…factn,relationshipn),其中facti表示题目任务涉及到的第i个知识点,relationshipi表示第i个知识点和第i+1个知识点之间的关系,i取值为1~n;步骤2-2,在知识图谱中查找连接步骤2-1解析的知识点及关系的子图并转换为相应的图查询,这些翻译过的图查询被提交给图数据库,图数据库返回问题任务在知识图谱中对应的知识点id以及与知识点及关系相连的知识点id。返回结果表示为probleminfo=(problemid,factid1,factid2,…factidn),其中problemid表示题目任务id,factidi表示题目任务涉及到的第i个知识点的id,i取值为1~n。步骤3包括如下步骤:步骤3-1,计算用户对题目任务相关的知识点的掌握度,用户的信息表示为UserInfo=(userid,masterScore1,masterScore2,…masterScoreN),其中userid表示用户的id,masterScoreN表示用户对知识点N的掌握度,初始时为0,后根据用户回答问题计算对每个知识点的掌握度进行更新。通过知识点id得到用户对知识点i的掌握度masterScorei;对每个用户计算对题目任务相关的n个知识点总的掌握度,选择掌握度最大的k个用户,k取值自然数,掌握度E计算公式如下:其中|P|表示题目任务中包含的知识点个数,masterScorei表示用户对知识点i的掌握度,PRi表示知识点i的重要性;步骤3-2,通过众包将该题目任务推送给这k个对题目任务掌握度较好的用户,用户上线后即能够收到题目任务自愿进行解答,k一般取值为10。步骤4中,接受到题目任务的用户记录下自己的回答,回答根据时间顺序进行显示。步骤5包括如下步骤:步骤5-1,出题人收到回答后对回答者的答案进行评分,每条回答记录表示为record=(answerid,userid,score),其中answerid表示回答id,userid表示回答者的id,score表示出题人对该回答的满意程度,score取值集合为{-2,-1,1,2,3},-2对应非常不满意,-1对应不满意,1对应一般,2对应满意,3对应非常满意;步骤5-2,浏览问题的用户本文档来自技高网
...

【技术保护点】
1.一种基于众包及图谱技术的知识共享服务方法,其特征在于,包括以下步骤:步骤1,建立一个知识图谱,并计算出知识图谱中每个知识点的重要性,将其保存在图数据库中;步骤2,将用户发布的题目任务经过语义解析转换为逻辑表达式,在知识图谱中查询到用户发布的题目任务相关的知识点;步骤3,寻找对步骤2查询到的知识点掌握度前Topk的用户,并通过众包将用户发布的题目任务推荐给这些用户;步骤4,接受该题目任务的用户根据回答时间,记录下自己的回答;步骤5,发布题目的用户以及浏览该问题的用户根据不同回答者的答案分别对不同回答者的答案进行评分,评分用于计算回答者对相关知识点的掌握程度;步骤6,发布题目用户发布奖励金,在回答者不超过回答时间的情况下根据发布题目用户对回答的满意度进行权重奖励。

【技术特征摘要】
1.一种基于众包及图谱技术的知识共享服务方法,其特征在于,包括以下步骤:步骤1,建立一个知识图谱,并计算出知识图谱中每个知识点的重要性,将其保存在图数据库中;步骤2,将用户发布的题目任务经过语义解析转换为逻辑表达式,在知识图谱中查询到用户发布的题目任务相关的知识点;步骤3,寻找对步骤2查询到的知识点掌握度前Topk的用户,并通过众包将用户发布的题目任务推荐给这些用户;步骤4,接受该题目任务的用户根据回答时间,记录下自己的回答;步骤5,发布题目的用户以及浏览该问题的用户根据不同回答者的答案分别对不同回答者的答案进行评分,评分用于计算回答者对相关知识点的掌握程度;步骤6,发布题目用户发布奖励金,在回答者不超过回答时间的情况下根据发布题目用户对回答的满意度进行权重奖励。2.根据权利要求1所述的方法,其特征在于,步骤1包括如下步骤:步骤1-1,建立一个知识图谱,存储在图数据库中,整个知识图谱呈现一个图的形式,图中的节点表示知识点,图中的边表示知识点之间的关系,每个知识点表示为fact=(factid,factname,label),其中factid表示知识点id,factname表示知识点,label表示知识点的标签;每个关系表示为relationship=(startid,endid,relation,type),其中startid,endid分别表示关系起始的知识点id和关系中止的知识点id,relation表示是一种具体的属性或者一种具体的关系,type表示具体的属性值或者关系;步骤1-2,利用PageRank算法计算出知识图谱中每个知识点的重要性,计算每个知识点的重要性公式如下:其中,PRi表示知识点i的重要性,Mi表示所有对知识点i有出链的知识点的集合,L(j)是知识点j的出链数目,N是知识点总数,α为一个常数。3.根据权利要求2所述的方法,其特征在于,步骤2包括如下步骤:步骤2-1,将用户发布的题目任务进行解析,每个任务解析后表示为problem=(fact1,relationship1,fact2,relationship2,...factn,relationshipn),其中facti表示题目任务涉及到的第i个知识点,relationshipi表示第i个知识点和第i+1个知识点之间的关系,i取值为1~n;步骤2-2,在知识图谱中查找连接步骤2-1解析的知识点及关系的子图并转换为相应的图查询,这些翻译过的图查询被提交给图数据库,图数据库返回问题任务在知识图谱中对应的知识点id以及与知识点及关系相连的知识点id,返回结果表示为probleminfo=(problemid,factid1,factid2,...factidn),其中problemid表示题目任务id,factidi表示题目任务涉及到的第i个知识点的id,i取值为1~n。4.根据权利要求3所述的方法,其特征在于,步骤3包括如下步骤:步骤3-1,计算用户对题目任务相关的知识点的掌握度,用户的信息表示为UserInfo=(userid,...

【专利技术属性】
技术研发人员:聂红丽窦睿涵戴海鹏
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1