【技术实现步骤摘要】
一种平衡共赢的数据资产定价机制
本专利技术涉及数据资产交易与共享,尤其是从数据资产供应链的视角提出了一个平衡共赢定价机制等相关问题。
技术介绍
“数据资产”的概念最早出现在20世纪70年代,指的是个体“持有的政府债券、公司债券和实物债券等资产”。经过几十年信息技术和大数据技术的发展,数据成为资产,已经是行业共识。目前的数据资产主要指由个人或企业拥有或者控制的,能够带来经济利益或者具有服务潜力的数据资源。数据资产以物理或电子的方式记录,包括由数据组成的任何实体和信息化资源,如系统或应用程序的输出文件、文档、Web页面、图片、电子数据等。数据资产交易一般指数据资产所有权的转移,是传统的数据资产供给方式。数据资产共享一般保留数据资产的产权和管理权,一般包括有偿服务和免费开源两种数据资产供给方式。数据资产交易和共享都指的是数据资产在不同商业实体之间的流通和转换。定价是数据资产交易和共享的基础,因涉及利润分配和激励策略而严重影响数据资产交易市场的有序发展。此外,定价数据资产有利于提高人们对私有数据的保护意识和管理意识,这对网络 ...
【技术保护点】
1.一种平衡共赢的数据资产定价机制,其特征在于如下:/nA数据资产价格评估Data asset price assessment/n古典经济学以及马克思主义经济学认为价格是价值的外在体现;现代市场经济学认为价格是由市场调节决定的;事实上,这两种说法辩证地存在,即价值和市场调节共同在影响价格的制定;本章重点介绍价值如何影响数据资产价格,而把关于市场调节的内容放到第三部分;为了可靠的计量数据资产的价格,我们先介绍一些关于价格评估的标准设定;/n1)标准设定standard setting/n标准是衡量事物优劣的基准,在不同的应用场景中被赋予了不同的涵义;所有的标准设定方法,尽管 ...
【技术特征摘要】
1.一种平衡共赢的数据资产定价机制,其特征在于如下:
A数据资产价格评估Dataassetpriceassessment
古典经济学以及马克思主义经济学认为价格是价值的外在体现;现代市场经济学认为价格是由市场调节决定的;事实上,这两种说法辩证地存在,即价值和市场调节共同在影响价格的制定;本章重点介绍价值如何影响数据资产价格,而把关于市场调节的内容放到第三部分;为了可靠的计量数据资产的价格,我们先介绍一些关于价格评估的标准设定;
1)标准设定standardsetting
标准是衡量事物优劣的基准,在不同的应用场景中被赋予了不同的涵义;所有的标准设定方法,尽管其很详尽、系统化,仍不能脱离人的主观判断;从这个意义上看,标准并不能完全客观的设定,只能一定程度反应客观事实;在本文,我们讨论了价值量、隐私损失等级和权限开放等级三类标准设定;隐私损失等级越大代表隐私损失越大;权限开放等级越大则表示权限损失越大;
隐私损失容忍度指的是数据所有者能接受的最大隐私损失量;注意,隐私损失容忍度不同于隐私损失;比如,John的隐私损失容忍度为0.3;数据需求方对数据的隐私损失要求为0.2(或者任意小于等于0.3的值);那么,系统在提供数据时将纳入John的数据,并按0.2对数据进行加噪;当然,隐私损失补偿也会按照0.2来计算,因为实际的隐私损失是0.2;反之,如果数据需求方对数据的隐私损失要求为0.4(或者任意大于0.3的值);那么,系统在提供数据时将不纳入John的数据,因为John不能接受比0.3大的隐私损失并且系统必须满足John的隐私保护需求;
2)属性选择Attributeselection
影响数据资产价格的因素有许多,比如成本、质量、时效、可信度、数量等;所以几乎不可能设计出一个覆盖所有价格相关因素的定价机制;为了通用地、合理地定价数据资产,我们研究了多种典型数据资产的定价策略;这包括数字媒体(图像、音频、视频)、知识产权和软件即服务产品的定价策略;在此基础上,我们选出了成本、数据质量、数据权威度、隐私损失和权限等级五个主要属性用于评估数据资产的价格;
·成本cost
成本是指卖方生产数据资产的各种成本,由固定成本和边际成本构成;固定成本指一个组织或企业收集、整合和加工数据,然后形成第一个中间数据产品或最终数据产品的成本;边际成本指每新增一个单位的数据产品所增加的成本;由于数据资产具有数量大的特性,其固定成本相对很小;因此在估计数据资产的成本时,常常指边际成本;
·数据质量DataQuality
数据质量是保障数据分析结论有效和准确的基础;狭义的数据质量包括数据的准确性、及时性、完整性和一致性;数据的准确性指数据是否有错误;及时性指数据的最新程度;完整性指数据内容的完整程度;一致性指数据是否以相同的格式呈现;广义的数据质量还包括数据整体的有效性,例如,数据整体是否是可信的、数据的取样是否合理等;狭义的数据质量针对的是数据原生属性值的质量,而广义的数据质量更倾向于数据的信息质量;数据质量越好意味着数据可用性越高,因此数据资产价格和数据质量成正相关关系;
·数据权威度dataauthority
在《新现代汉语词典》中,对于权威的解释是:(1)使人信从的力量和威望;(2)是在某种范围里最有地位的人或事物;权威强调的是某个人、某种组织或某种思想体系被社会所认可、信任并自愿支持;数据权威度来源于微博用户权威度,指数据在数据市场中的影响力和社会对其信服的程度;
数据权威度由数据影响力和数据可信度两部分组成;数据影响力指数据对数据市场的作用程度及数据被传播的程度;关于数据影响力的定量评价方法有很多,如影响因子,H指数和自引率等;数据可信度指数据被公众信任和支持的程度;数据可信度与数据监管平台的可靠性、数据提供者的素质有关,比如权威机构或信用良好的用户提供的数据可信度一般较高;
数据权威度反映的是公众对于数据的评价和认可程度,对数据资产价格具有正向影响作用;
·隐私损失privacyloss
CHAOLi&RachanaNget等人指出分析数据信息会损害数据所有者的隐私,数据买方必须为此付费并且数据所有者应该因失去数据隐私而获得补偿;在本文中,数据所有者需要设置自己的隐私损失容忍度;买方选择需要的隐私损失,并根据系统检测的实际隐私损失支付相应的补偿价格;卖方和买方通过选择隐私损失等级可以控制自己的收益和支出;
数据资产交易中可能存在隐私的套利;比如,一个精明商家想获取“John是否有糖尿病”的数据信息(标记为info1);假设他已经知道John是第100号糖药病检查者,那么他就可以通过同时购买数据信息“医院前99名糖药病检查者的患病人数”(标记为info2)和数据信息“前100名糖药病检查者的患病人数”(标记为info3)来得知答案;这个例子中,info2和info3的隐私含量极低,相应的价格也极低(价格分别为1美元和2美元);但info1的隐私含量却极高,相应的该数据信息价格也极高(价格为100美元);这样一来,这个精明商家应该花100美元才能搞定的事情现在用3美元就完成了;套利交易会侵犯数据所有者的隐私,损害卖方潜在收益;因此,合理的隐私补偿机制一定是无套利的;
我们从推测糖尿病患者的例子中发现,正是数据中的细小差异导致了潜在的隐私泄露和提供了隐私套利的条件;差分隐私(DifferentialPrivacy)是一种安全计算方法,不仅可以保证对手无法从部分数据信息中了解到关于整个数据的有用信息,还可以确保对手对具体数据所有者一无所知;
Definition1:(ε-DifferentialPrivacy)ArandomizedalgorithmM:D→Rsatisfiesε-DifferentialPrivacy(orε-DP)ifforeverypairofneighboringdatasetsx,y∈Dwherexandydiffersbyonlyonerecord,andforanysetORange(M),
Pr(M(x)=O)≤eε×Pr(M(y)=O)(1)
ε-DP要求对于输入不同数据集x和y,得到相同输出结果O的概率差(用eε表示)不大;概率差描述受差分隐私保护的输出数据信息与真实数据信息的接近度;概率差越小说明差分隐私保护力度越高,此时根据输出信息推断真实信息的难度越大;隐私预算参数ε表示隐私保护程度,ε∈[0,1];本文用ε量化隐私损失等级;ε越小,隐私损失越小;
差分隐私意味着所有所有者或数据资产具有相同的隐私保护/损失等级ε;个性化差分隐私(PersonalizedDifferentialPrivacy)指在差分隐私中每个数据资产或每个数据所有者都有自己的隐私损失容忍值ε′,ε′∈[0,1];ε′-PDP保护有两种实现机制:(1)拉普拉斯机制(laplacemechanism),用于数值型结果的保护;(2)指数机制(exponentialmechanism),用于离散型结果的保护;本文在差分隐私的基础上引入个性化差分隐私既能避免由隐私泄露导致的隐私套利,又满足用户不同隐私级别的保护需求;
Definition2:(PersonalizedDifferentialPrivacy)Regardingthetolerableprivacylossε′ofeachuser,arandomizedmechanismM:D→Rsatisfiesε′-PersonalizedDifferentialPrivacy(orε′-PDP)if,foreverypairofneighboringdatasetsx,y∈Dwherexandydiffersbyonlyonerecord,andforanysetORange(M),
其中εx’表示数据集x的隐私损失容忍值,εy’表示数据集y的隐私损失容忍值,而min(εx’,εy’)表示数据集x和y较小的那个隐私损失容忍值;概率差越大,根据输出信息推断真实信息的难度越小;此时受差分隐私保护的数据信息与真实数据信息的接近度越高,数据资产价值较高;我们假设,对于一对相邻数据集,这种接近度用T(ε)表示,且对于多对相邻数据集,这种接近度用T(ε)表示,且n≥1;很容易理解数据资产价值∈(0,数据资产原始价值];如果我们用数据资产原始价值×T(ε)表示数据资产价值,那么T(ε)∈(0,1];到目前为止,我们归纳出函数T(ε)有两个充分条件:(1)(2)T(ε)∈(0,1];根据这两个充分条件,我们可以设计函数T(ε)为εi表示数据所有者的实际隐私损失;当min{εi}=0时,T(ε)取最小值当min{εi}=1时,T(ε)取最大值1;注意当min{εi}=0时,数据资产价值≠0;这很容易理解,数据隐私信息只是数据价值的一部分,因此完全脱敏的数据仍然有使用价值;当min{εi}=1时,数据资产价值=数据资产原始价值,此时数据资产的隐私不受保护;
总之,我们用εi量化数据所有者的个性化隐私损失,εi∈[0,1];并且引入个性化差分隐私保护数据所有者的潜在隐私损失和避免隐私套利;
·权限等级permissionlevel
数据资产的供给方式根据权限开放程度的不同大致可以分为以下三种:
免费开放(Openandfree):这是一种免费的数据资产供给方式;供应方把数据资产按照一定数据格式(主要是word、PDF、图片、Excel等数据格式)免费提供给需求方,比如网页资源的免费浏览、下载和转载;这种供给方式一般不限定买方对象、需求量和用途(法律规定除外),一般保留数据资产的产权和管理权,类似开源软件方式(OpenSourceSoftware)、开源数据社区(OpenDataCommunity);
有偿交易(Paidtransaction):这是一种付费的数据资产供给方式;供应方把数据资产按照一定方式有偿提供给需求方,以此获得收益或者等价交换,可以参考实物商品的交易机制;数据资产作为一种无形商品,具有易复制、易传播、易加工等多种特性;这些特性使得数据资产交易附带产权界定、产权定价等多种复杂问题;
有偿服务(PaidService):这是一种付费的供给方式;供应方为需求方提供有偿的数据服务,以此获得收益,类似实物商品的租赁机制;PaidService与paidtransaction相似却不相同,体现在它尽量避免产权、管理权等问题,仅涉及使用权和安全访问控制等问题;这种供应方式可以大大降低成本,并且一定程度上避免了产权纠纷;文献引用、软件使用权购买是典型的案例;
本文引入了多级权限的数据供给方式,让每个数据所有者都可以根据个人需求设置数据资产的权限开放等级o,o∈[0,1];o越小,权限保护水平越高;
B理论模型Theoreticalmodel
数据集:数据集是源数据的整合与封装,通常以表格的形式出现,比如报表、专有数据集;每一列代表一个特定属性;每一行是一个数据元组,对应于某一成员的数据信息;对应于行数,该数据集可能包括一个或多个成员;
数据产品:数据产品是指以数据为驱动、可以发挥数据价值去辅助用户更优的做决策甚至行动的一种产品形式;它在用户的决策和行动...
【专利技术属性】
技术研发人员:郭兵,沈艳,秦超霞,刘胜杰,苏红,张珍,周驰岷,逯峻雨,张登平,夏鑫林,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。