The invention unveiled a method for pricing personal large data based on the size of a tuple. First carries on the investigation to the data attributes affect the data value, and then analyzes the information entropy and data reference value weight, impact index, cost data and other factors on the data tuple value calculation method, a data tuple value is derived, the method can be adjusted according to the parameters, and the size of the data increases with decreasing data cost and to improve the quality of data, each data transaction will get more benefits. Finally, a specific example is used to verify the correctness and effectiveness of the pricing method.
【技术实现步骤摘要】
一种基于元组粒度的个人大数据定价方法所属
本专利技术涉及大数据
,尤其是涉及一种基于元组粒度的个人大数据定价方法。
技术介绍
随着大数据的巨大价值被重新认识以及计算机存储成本的下降,对个人信息的收集数量达到前所未有的水平。这些数据的经济价值恰好验证了了许多互联网公司从搜索引擎、社会媒体网站以及销售这些信息等方面所取得的成功。但是,由于隐私等相关问题,大量潜在的有用私有数据不能被利益相关者所访问。无论是对于数据拥有者还是企图分析它的机构来说,个人大数据本身具有很大的价值。通常,个人大数据是指涉及个人隐私的特征行为数据,是个人生活活动或工作中产生的、个人可以拥有或控制的数据。个人大数据具有快速的数据流转、多样的数据类型、复杂的数据来源等特点,主要包括个人基础信息以及个人收支、财产、朋友圈、健康、教育、观点以及个人感知数据等信息。虽然个人大数据本身蕴藏着巨大的商业价值,但往往被个人所忽略。数字技术的使用本应该使个人成为商业、经济系统中服务和商品的参与提供者和共同创造者。然而,目前的数据产品、定价和交易机制几乎完全绕开个人用户。基于此,本专利技术提出了一种基于元组粒度的个人大数据定价方法。通过对影响数据价值的数据属性进行调查,然后分析了信息熵、价值权重、数据引用指数、数据成本等因素对数据元组价值的影响,推导出一个数据元组价值计算方法,该方法可根据参数动态调整,随着数据规模的增加、数据成本的降低以及数据质量的提高。从而使得个人、数据交易平台和数据需求方都能从数据交易中受益,实现一个互惠共赢、数据普惠的数据交易生态系统。
技术实现思路
本专利技术旨在提出一种基于元组 ...
【技术保护点】
一种基于元组粒度的个人大数据定价方法,其特征在于该方法的步骤如下:1)度量个人大数据数据元组价格的特征量:本专利技术根据数据包的整体价格,利用数据的信息熵、引用指数、价值权重三个特征量来反向推出数据包每个数据元组的价格:●信息熵:信息熵是一个与事物发生的可能性相关的属性,它是概率分布的非负函数,刻画了信息的不确定性;信息的熵越大,信息的不确定性越大;●数据引用指数:数据引用指数是指某个用户的数据元组至少有r条被购买r次,把这个最大值称作用户的数据引用指数;数据引用指数越大,用户的数据元组价值越大;●价值权重:价值权重是一个体现数据元组价值的属性;价值权重越大,数据元组的价值越大;2)获取每一个数据元组的信息熵qi:假设数据包有n条数据元组,每条数据元组有k个属性,则第i条数据元组的第j个数据项出现的概率为:
【技术特征摘要】
1.一种基于元组粒度的个人大数据定价方法,其特征在于该方法的步骤如下:1)度量个人大数据数据元组价格的特征量:本发明根据数据包的整体价格,利用数据的信息熵、引用指数、价值权重三个特征量来反向推出数据包每个数据元组的价格:●信息熵:信息熵是一个与事物发生的可能性相关的属性,它是概率分布的非负函数,刻画了信息的不确定性;信息的熵越大,信息的不确定性越大;●数据引用指数:数据引用指数是指某个用户的数据元组至少有r条被购买r次,把这个最大值称作用户的数据引用指数;数据引用指数越大,用户的数据元组价值越大;●价值权重:价值权重是一个体现数据元组价值的属性;价值权重越大,数据元组的价值越大;2)获取每一个数据元组的信息熵qi:假设数据包有n条数据元组,每条数据元组有k个属性,则第i条数据元组的第j个数据项出现的概率为:数据包第i条数据元组的熵为:其中,xij表示第...
【专利技术属性】
技术研发人员:郭兵,沈艳,申云成,曹亚波,段旭良,张洪,董祥千,黄义纯,王丹,张鹏博,
申请(专利权)人:成都数银科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。