http://www.7klian.com

邹传伟:对数据要素的特征、代价和设置机制的劈头研究

接下来,凭据数据的经济学特征以及应用场景,接头有代表性的数据要素设置机制。
Rowley, J., 2007, “The Wisdom Hierarchy: Representation of the DIKW Hierarchy”, Journal of Information and Communication Science, 33(2): 163-180.
数据相对估值说明,同一数据在用于差异任务,利用差异阐明要领,或与差异数据组适时,浮现出的
代价是差异的。出格是,偏离数据荟萃“主流”的数据,在相对估值上大概比接近数据荟萃“主流”的数据高,这显示了“异常值”(Outlier)的代价。
在PIK模式下,数据节制者(互联网平台)相对数据主体(用户)处于主导职位,而且数据节制者往往也是数据利用者,而数据主体对本身数据缺乏节制,在数据产权上有许多恍惚不清之处。如何更正PIK模式的漏洞,是小我私家数据打点中的一个焦点问题。
数据有多个维度的技能特征,但数据的经济学特征更巨大。数据可以发生代价,因此具有资产属性。数据兼有商品和处事的特征。很大都据属于民众产物,可以由任何工钱任何目标而自由利用、改革和分享。因为大部门数据长短竞争性的,属于私人产物和民众资源的数据较少。数据的所有权不管在法令上照旧在实践中都是一个巨大问题,出格对小我私家数据。因此,把数据比喻成石油,不如把数据比喻成阳光更为符合。
2018年5月,欧盟开始实施《通用数据掩护条例》(GDPR)。GDPR给以数据主体遍及权力:第一,被遗忘权,指数据主体有官僚求数据节制者删除其小我私家数据,以制止小我私家数据被流传。第二,可携带权,指数据主体有权向数据节制者索取本人数据并自主抉择用途。第三,数据主体在自愿、基于特定目标且在与数据节制者职位均衡等环境下,授权数据节制者处理惩罚小我私家数据,但授权在法令上不具备永久效力,可随时撤回。第四,非凡类此外小我私家数据的处理惩罚条件,好比医疗数据。
于施洋、王建冬和郭巧敏,2020,《中国构建数据新型要素市场体系面对的挑战与对策》,《电子政务》2020年第3期

1.绝对估值
第二,非完全契约。数据要素
设置机制都可以暗示成一系列契约的组合。但数据应用有富厚场景,数据代价链有多个环节,数据代价缺乏客观计量尺度,这些因素使得数据要素设置机制很难在事前包围过后所有大概呈现的环境。这既会影响数据主体分享数据以及数据出产者出产数据的鼓励,也会影响数据代价在数据代价链中差异孝敬者之间的公道分派。
非排他性指的是,当或人在付费消费某种产物时,不能解除其他没有付费的人消费这一产物,可能解除的本钱很高。很大都据长短排他性的,好比天气预报数据。但通过技能和制度设计,有些范例的数据有排他性。好比,一些媒体信息终端采纳付费形式,只有付费会员才可以阅读。
第四,很大都据因为有非排他性或非竞争性,不适合参加市场生意业务。换言之,市场化设置不便是市场生意业务模式。现实中并不存在一个会合化、活动性好的数据要素市场。数据的点对点生意业务(雷同场交际易)尽量一直在产生,但很不透明且非尺度化,而且犯科数据生意业务是一个不容忽视的问题。
按照DIKW模子,从数据中提炼出信息、常识和伶俐,这隐含着数据代价链的观念。原始数据颠末处理惩罚并与其他数据整合后,再经阐明形成可动作的洞见,最终由动作发生代价。

· 数据的样天职布、时间包围和变量/属性/字段等。
与数据的技能特征对比,数据的经济学特征要巨大得多。数据可以发生代价(见后文),因此具有资产属性。数据兼有商品和处事的特征。一方面,数据可存储、可转移,雷同商品。数据可积聚,在物理上不会消减或腐蚀。另一方面,很大都据是无形的,雷同处事。数据作为资产具有许多非凡性,可以从表1的视角阐明:

第二,收入法,也就是评估数据的社会和经济影响,预测由此发生的将来现金流,再将将来现金流折现到当前。收入法在逻辑上雷同公司估值中的折现现金流法,能思量数据代价的三个要害特征,在理论上较量完善,但实施中则面对许多障碍。一是对数据的社会和经济影响建模难度很大。二是数据的期权代价如何评估。实物期权估值法是一个可选要领,但并不完美。
前面已提到,在互联网经济中,假如小我私家数据不是由用户对外提供,而是来自互联网平台对用户特征和行为的调查和记录,那么所有权就很难界定清楚。现实中,互联网平台常常为用户提供免费资讯和社交处事,方针是扩大用户量,并得到用户的留意力和小我私家数据(好比用户爱好、消费特征和社会接洽等)。在这个模式中,可以认为是用户用本身的留意力和小我私家数据调换资讯和社交处事,因此被称为PIK模式(图2)。互联网平台一方面是通过告白收入变现用户流量,另一方面基于用户小我私家数据举办精准营销和开拓信贷产物等。

鉴于数据代价的三个要害特征,数据的绝对估值较量难,没有公认要领。今朝行业实践中有几种主要要领,但都有缺陷(BIPP,2020;德勤和阿里
研究院,2019)。
· 是否为小我私家数据。小我私家数据在隐私掩护上有许多非凡性,需要专门接头。
数据代价可以从微观和宏观两个层面领略。在微观层面,信息、常识和伶俐既可以满意利用者的好奇心(即作为最终产物),更可以提高利用者的认知,辅佐他们更好做出决定(即作为中间产物),最终结果都是提高他们的效用。数据对利用者效用的提高,就反应了数据代价。在宏观层面,信息、常识和伶俐有助于提高全要素出产率,发挥乘数浸染,这也是数据代价的浮现。本文主要接头微观层面的数据代价,有以下要害特征。
第一,数据对小我私家的代价称为私人代价,数据对社会的代价称为民众代价。数据假如具有非排他性或非竞争性,就会发生外部性,并造成私人代价与民众代价之间的差别。这种外部性可正可负,没有定论。
PlatON, 2018, “PlatON: A High-Efficiency Trustless Computing Network”, https://www.platon.network/static/pdf/en/PlatON_A%20High-Efficiency%20Trustless%20Computing%20Network_Whitepaper_EN.pdf
Jia R., D. Dao, B. Wang, F. Hubis, N. Hynes, N. Gurel, B. Li, C. Zhang, D. Song, and C. Spanos, 2019, “Towards Efficient Data Valuation Based on the Shapley Value”.
计量经济学从数据中提炼信息,主要包罗:一是发明数据中隐含的纪律和模式;二是预计模子;三是检讨假说。这对应着DIKW模子的信息条理。好比,对数据做描写统计,计较变量的平均值、尺度差以及变量之间的相干系数等,是从数据中提炼信息的最简朴方法之一。计量经济学常常假设数据遵循数据生成进程(Data Generation Process),但数据生成进程的模子形式和参数取值未知,而且随机滋扰会为调查带来误差。计量经济学按照调查到的数据,预计数据生成进程,再据此检讨假说。人工智能和大数据阐明要领对数据的处理惩罚更为机动,分为预测型阐明和描写型阐明。预测型阐明是按照某些变量的取值,预测别的一些变量的取值。描写型阐明是导出、归纳综合数据中潜在接洽的模式,包罗相关、趋势、聚类、轨迹和异常等。两类阐明浮现为分类、回归、关联阐明、聚类阐明、推荐系统和异常检测等详细要领。
在现实中,因为数据范例和特征的多样性,以及数据代价缺乏客观计量尺度,今朝并不存在一个会合化、活动性好的数据要素市场。但数据的点对点生意业务(雷同场交际易)一直在产生,好比另类数据市场。这个市场中存在大量的另类数据提供商。它们对数据的处理惩罚水平从浅到深大抵可分为原始数据提供者、轻处理惩罚数据提供者和信号提供者。这个市场已成长出咨询中介、数据聚合商和技能支持中介等,作为毗连数据买方(主要是投资基金)和数据提供方之间的桥梁。个中,咨询中介为买方提供关于另类数据购置、处理惩罚及相关法令事宜的咨询,以及数据供给商信息。数据聚合商提供集成处事,买方只需和它们协商即可,无需进入市场与分手的数据提供商打交道。技能支持中介为买方提供技能咨询,包罗数据库和建模等。
第三,在互联网经济中,许多小我私家数据的所有权很难界定清楚,现实中常见PIK(Pay-in-kind)模式,本质上是用户用本身的留意力和小我私家数据调换资讯和社交处事,但PIK模式存在许多漏洞。
· 数据来历。有些数据来自第一手调查,有些数据由第一手调查者提供,尚有些数据从其它数据推导而来。数据可以来自受控尝试和抽样观测,也可以来自互联网、社交网络、物联网和家产互联网等。数据可以由人发生,也可以由呆板发生。数据可以来自线上,也可以来自线下。
3.数据会发生外部性
(一)数据代价的内在
第三,数据信托模式。按照BIPP(2020)的先容,数据信托可以采纳差异形式,好比法令信托、契约、公司以及民众和社区信托等。数据信托的主要方针包罗:一是使数据可被共享;二是促进民众好处以及数据分享者的私人好处;三是尊重那些对数据有法令权利的人的好处;四是确保数据以合乎伦理和数据信托法则的方法共享。
第二,数据有期权代价。新时机和新技能会让已有数据发生新代价。在许多场所中,收集数据不只是为了当下的需求,也有助于晋升将来的福利。
第一,差异人的阐明要领纷歧样,从同样数据中提炼出的信息、常识和伶俐可以相差很大。好比,在科学史上,许多科学家深入
研究一些公共习觉得常的现象并做出了重大发明。重物落地之于牛顿,闪电之于富兰克林,海水的蓝色之于拉曼,与它们对公共的代价是完全纷歧样的。再好比,在经济学中,差异的经济学家对同样的经济数据常常做出完全纷歧样的解读。
这些机制都致力于办理数据要素设置中的两个突出问题。第一,信息差池称。数据要素设置机制涉及多个好处纷歧致的参加方。好比,数据主体往往不清楚本身数据在何时、因何方针或有何效果而被收集。数据出产者不清楚数据主体是否选择性披露数据,以及在知道本身的数据被收集时是否会有针对性地调解行为,也不清楚出产出的数据对差异数据利用者的代价。数据利用者在事前很难完全相识数据对本身的代价。好比,数据相对估值就是在过后举办的。
许多文章把数据比喻成新经济的石油。这个比喻实际上禁绝确。石油是竞争性和排他性的,产权可以清楚界定,作为私人产物形成了现货和期货等巨大的市场生意业务模式。很大都据难以清晰界定所有权,作为民众产物或准民众产物难以有效参加市场生意业务。因此,把数据比喻成阳光更为符合。
在数据相对估值中,常见数据分组要领包罗:一是变量/字段一样,但属于差异的调查样本;二是同样的调查样本,但变量/字段差异。对常见预测性任务和描写性任务,统计学和数据科学成立了量化评估指标。好比,对预测任务,需做样本外检讨,评估预测误差。在预测变量是离散型时,常用精确率、错误率以及操纵特征(Receiver Operating Characteristic,ROC)曲线下方面积等指标。在预测变量是持续型时,常用尺度误差。对描写任务,需用样本数据评估模子拟合结果,线性模子一般用R平方,非线性模子一般用似然函数(需对滋扰项漫衍做出假设)。

(二)数据的经济学特征
因此,需要通过制度设计和暗码学技能等精良界定用户作为数据主体以及互联网平台作为数据节制者的权利,这会为他们之间的经济好处干系发生显著影响。
第三,数据颠末认知进程处理惩罚后获得信息,给出关于谁(Who)、什么(What)、那里(Where)和何时(When)等问题的谜底。信息是有组织和布局化的数据,与特定方针和情景有关,因此有代价和意义。好比,按照信息论,信息能削减用熵怀抱的不确定性。
小我私家数据打点的焦点问题隐私掩护。隐私涉及小我私家与他人、私有与果真的界线,是小我私家尊严、自主和自由的重要方面(Acquisti et al., 2016)。隐私不排出共享小我私家书息,而是要有效节制共享进程,在掩护和共享小我私家数据之间做好均衡。对小我私家数据,节制权和隐私掩护的重要性高出所有权。这一点在GDPR中有浮现。
按照表1,很大都据属于民众产物,可以由任何工钱任何目标而自由利用、改革和分享。好比,当局宣布的经济统计数据和天气预报数据。一些数据是俱乐部产物,属于准民众产物,好比前面提到的收费媒体信息终端。大部门数据长短竞争性的,因此属于私人产物和民众资源的数据较少。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章阅读