【技术实现步骤摘要】
基于区块链与自然语言处理的众包数据库构建方法及装置
本专利技术涉及一种基于区块链与自然语言处理的众包数据库构建方法及系统,属于网络空间安全
技术介绍
传统的数据库在处理数据时没有容错能力,当数据缺失或用户输入与标准答案有丝毫偏差的SQL语句时,常常得不到正确答案。例如当用户输入“JNU”,但数据库中表示“JNU”含义的词为“JinanUniversity”时,数据库搜索不到“JinanUniversity”因此返回错误信息。众包是克服这一问题的有效方法,众包可以利用不同领域的专业人士来灵活处理问题,而且人的变通能力使得工作者可以很容易地将“JinanUniversity”替换“JNU”,从而得到正确答案。近年来,专业的众包平台越来越多,它们的出现有效地解决了某些特定行业内的现实需求。众包通过互联网完成任务后获取报酬的形式,突破地域、时间限制,促进了各种资源的优化利用。然而,若基于现有众包数据库平台完成众包,雇主和工作者需要依靠可信的第三方来进行任务的接受、交易以及评估工作,依靠第三方可能会出现单点故障、隐私 ...
【技术保护点】
1.一种基于区块链与自然语言处理的众包数据库构建方法,其特征在于,所述方法包括:/n接收雇主根据语音导航选择的众包任务类型;/n接收雇主根据语音导航输入的众包任务以及相应的任务附件;/n接收雇主根据语音导航输入的任务相关信息;其中,所述任务相关信息包括允许申请的工作者总人数、众包任务需要的人数、任务完成时间、信誉要求、雇主的公钥、众包任务的酬金、奖励以及违约金;/n利用自然语言解析技术,根据任务模板合约的众包任务格式,将自然语言式众包任务转换为SQL式众包任务,并提取任务相关信息;/n更新任务模板合约,将SQL式众包任务替换任务模板合约中的自然语言式众包任务,生成最终任务模 ...
【技术特征摘要】
1.一种基于区块链与自然语言处理的众包数据库构建方法,其特征在于,所述方法包括:
接收雇主根据语音导航选择的众包任务类型;
接收雇主根据语音导航输入的众包任务以及相应的任务附件;
接收雇主根据语音导航输入的任务相关信息;其中,所述任务相关信息包括允许申请的工作者总人数、众包任务需要的人数、任务完成时间、信誉要求、雇主的公钥、众包任务的酬金、奖励以及违约金;
利用自然语言解析技术,根据任务模板合约的众包任务格式,将自然语言式众包任务转换为SQL式众包任务,并提取任务相关信息;
更新任务模板合约,将SQL式众包任务替换任务模板合约中的自然语言式众包任务,生成最终任务模板合约;
将编译后的最终任务模板合约发送至区块链平台,以使区块链平台中各个节点对智能合约信息进行确认,在确认完成后,将任务注册信息保存至区块链平台中。
2.根据权利要求1所述的众包数据库构建方法,其特征在于,所述方法还包括:
当工作者选择向雇主申请接受SQL式众包任务后,接收工作者提交的任务初步解决方案;
接收雇主根据任务初步解决方案、工作者的信誉值以及工作者的历史评价选择的工作者信息;
接收工作者在处理任务的过程中定期发布的任务状态信息,在任务汇总合约中不断更新任务状态信息,以使雇主能够查询当前任务状态信息;
若在任务完成时间内接收到工作者发布的任务结果,则将任务结果发送至区块链平台,同时在任务汇总合约中将任务状态信息由“待完成”更新为“待评估”;其中,所述任务结果为工作者利用雇主的公钥加密的任务结果;
若雇主在规定的时间内对工作者进行评价,则根据雇主的评价结果进行相应的处理;若雇主未在规定时间内对工作者进行评价,在任务汇总合约中将任务状态信息由“待确认结果”更新为“完成”,按照任务模板合约将众包任务的酬金转给工作者,在用户汇总合约中增加工作者的“信誉值”;
若在任务完成时间内未接收到工作者发布的任务结果,则在任务汇总合约中将任务状态信息由“待完成”更新为“取消”,在用户汇总合约中减少工作者的“信誉值”,同时按照任务模板合约向雇主支付违约金,并在用户汇总合约中进行记录。
3.根据权利要求2所述的众包数据库构建方法,其特征在于,所述根据雇主的评价结果进行相应的处理,具体包括:
若雇主在评价中更新为“满意”,则按照任务模板合约将众包任务的酬金转给工作者,在任务汇总合约中将任务状态信息由“待评估”更新为“完成”,在用户汇总合约中增加工作者的“信誉值”,以及将任务相关信息更新到“用户已完成任务列表”;
若雇主在评价中更新为“不满意”,在任务汇总合约中将任务状态信息由“待评估”更新为“待确认结果”,在用户汇总合约中减少工作者的“信誉值”,若在规定时间内接收到工作者提交的上诉信息,则将上诉信息发送至区块链平台,以使区块链平台的其他节点共同评估任务结果,若评估结果为“任务结果符合雇主要求”,则在任务汇总合约中将任务状态信息由“待确认结果”更新为“完成”,按照任务模板合约将众包任务的酬金转给工作者,在用户汇总合约中增加工作者的“信誉值”,若评估结果为“任务结果不符合雇主要求”,则在任务汇总合约中将任务状态信息由“待确认结果”更新为“完成”;若在规定时间内未接收到工作者提交的上诉信息,则在任务汇总合约中将任务状态信息由“待确认结果”更新为“完成”。
4.根据权利要求1-3任一项所述的众包数据库构建方法,其特征在于,所述利用自然语言解析技术,根据任务模板合约的众包任务格式,将自然语言式众包任务转换为SQL式众包任务通过以下函数实现:
Tokenization()函数、Extract()函数、Filter()函数、Simplify()函数、Pos_tag()函数和Map()函数;
所述Tokenization()函数,用于将众包任务questionn分解为单个标记并保存在数组S中;
所述Extract()函数,用于提取众包任务questionn中的Vaction以及任务附件中的数据库表的表名table_name,属性名attr_namek,k=1,2,......l,其中l为属性的个数;
所述Filter()函数,用于过滤数组S中的标点符号以及不重要的单词,S_use=S-stop_words;其中,stop_words为保存无意义的词或无效词的数组;
所述Simplify()函数,用于简化S_use中的单词,去掉单数及复数,将简化后的单词放在S_use’中;
所述Pos_tag()函数,包括词性标记和属性标记,词性标记用于对S_use’中的单词逐一分析,贴上VB、NN、JJ、RB、IN、TO、NNP、NNS的标签;其中,VB为动词,NN为名词,JJ为形容词,RB为副词,IN为介词,TO为介词to,NNP为专有名词,NNS为复数形式的名词,WDT为what限定词,将带有词性标记的单词存入数组S_use_tag1中;属性标记用于对S_use_tag1中的单词逐一分析,对于与table_name,attr_namek相等的单词分别标...
【专利技术属性】
技术研发人员:孟家乐,杨安家,李勇标,王琨,刘晓冬,李明,
申请(专利权)人:暨南大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。