培育和发展数据要素市场已经成为当前和今后一段时期的重要课题。针对数据资产确权、定价以及数据市场规则、制度以及新型数据市场基础设施的研究也非常活跃。本文拟从微观的视角,就数据资产如何形成、交易以及数据资产市场的结构和功能作一些初步的研究和探讨。
数据被确定为生产要素后 [1] ,数据资产的概念正逐渐形成共识。但数据如何从存储在介质上的电子记录成为数据资产的呢?
数据集(Data Sets)可以看作是数据资产市场的原子级结构[2] 。数据集通常都有明确的规范,包括数据从哪采集、采取什么样的格式记录等。每个数据集都可用元数据架构(MetaData)来描述。一个或多个数据集的所有数据构成数据资源(Data Resources)。数据资源并不能天然的成为数据资产,需要资产化的过程。一般的,数据资源只有经过确权,同时满足“可计量、可交付和经济价值可实现”的基本要件后,才可以称为数据资产(Data Assets)。事实上,很多数据资源由于种种原因(例如涉及公共安全、敏感隐私等),无法满足上述条件,因此不能成为数据资产,也就无法按照市场化的方式进行定价和交易。数据资源资产化(Capitalization)的一般过程示意图如下:
数据治理、数据融合、数据安全、流程和规范等是数据资源资产化的主要内容。通过资产化过程,数据资源
才能成为数据资产
。数据资产的交易、流通就自然的形成数据资产市场
。从前面的描述可以看出,数据资产市场
是数据要素市场的一个子集
。
确权是数据资产化过程中最重要,也是最核心的部分。数据产权(Data Property Right)的完整构成非常复杂 [3](见下图)。在实践中,很难逐项对这些数据权利(Data Rights)进行准确确权。有很多研究指出,数据产权是一种特殊的产权,建议拟定数权法(Data Rights Law)来规制数据产权,以激励相容为原则,促进数据资产的流通、交易 [4]。 在没有出台数权法之前,折衷的办法是,根据现有法律和市场的情况 [5],有选择的对一些权利进行确权 [6]。
即便对于来自同一数据资源形成的数据资产,由于其权利构成不同,定价以及交付的方式也会截然不同。例如,有一个消费者的数据集
,在资产化过程中,对是否能跨境使用设置了两种不同的权利属性,也就形成了两种不同的数据资产
(只能在本国境内使用)和
(不仅可以在本国境内,也可以跨境使用)。很显然,这两种资产的定价、交付方式都会有显著的差异。如下示意图表示同一个数据集
经过不同的权利设置形成两种不同的数据资产:
(拥有权利A和C)、
(拥有权利A,B)。
原始数据资源形成的数据资产,经过开发,也会形成新的数据资产。拥有不同数据血缘(Data Lineage)关系的数据资产如何进行融合、再加工形成新的数据资产的示意图如下:
数据开发过程需要进行投资或做出创造性的活动,由此产生的新的数据资产的确权问题相比原始数据所有权确权更复杂、也更困难。这个问题可以形式化的表述如下:数据资产
作为输入,经过生产函数 (数据开发过程的抽象)输出为数据资产
:
。那么附属在
上的权利如何、以及怎么在生产函数作用下变换?
一种情况是,附属的权利在函数作用下始终保持不变。另一种情况是,附属的权利在函数作用下变化。当面临多输入的情况时,附属在各自资产上的权利的变换情况就更加复杂,确权就需要更完善的法律和技术手段来实现。数据资源及附属的权利属性是数字资产的核心内容。基于前面的描述,就可以将数据资产
描述的示例如下:
标准化、规范化的数据资产描述,是编制数据资产目录的基础。数据资产目录是数据资产注册、登记的一种形式,也是数据资产市场的重要基础设施之一。数据安全以及隐私保护等法律法规的要求,决定了数据资产交付(Delivery)的形式。一般的,可以将数据资产交付归类为三种基本形式:1)直接交付(DD:Direct Delivery);卖方向买方开放数据资产的数据集的直接访问权限。买方可以通过APIs或其他技术方式读取、存储数据集中的数据。2)双边安全交付(BSD:Bilateral Secure Delivery);买方不能直接访问数据资产的数据集,只能将其处理数据资产的数据集的算法提交到双方约定的计算环境中(如TEE),执行计算后,得到计算结果。3)多边安全交付(MSD:Multiparty Secure Delivery)。多方按照协议约定,都不能直接访问彼此数据资产的数据集。只能根据需求,由数据需求方提交算法、多方参与数据供给,在安全、可信和隐私计算环境中进行计算,得到计算结果。DD交付形式简便、易操作和成本低,运用现有的基础设施就可以实现。在数据资产市场初期会得到大量的应用。但随着人们对数据资产的重视、财产观念的增强,特别是数据安全、隐私保护等的考量,这样的交付形式随着市场的逐渐完善,预计将会逐渐减少。在BSD、MSD这两种交付形式下,呈现出数据“可用不可见”和“交付即需计算”的特性。由于最大限度的保护了数据资产的安全性、隐私保护以及权属可控,这两种将会是数据资产交付的主流形式。上述几种资产交付方式的示意图如下:
数据资产交付在时空维度上,即可以是持续的、固定连接的形态;也可以是按次数、按时间、按需连接的形态。这就决定了数据资产交易的多样性。但要实现这些更复杂、更动态的交付,需要富有弹性的数据市场基础设施(DMIs)来支撑和保障。由以上简短的描述,就可以看到,不同数据资产在权利构成、安全性要求、时空维度上差异很大;同时,由于数据资产“交付即需计算”的特点,将使得数据资产的交易条款(Transcation Terms)相比人们已经熟知的传统商品和服务的条款,会更复杂、需要一些新的合约履行的机制。由此,数据资产交易的商务合同,将不可避免的需要采用智能合约的技术来执行。商务合同的一些条款中,将会“嵌入”智能合约。这些智能合约将会和商务合同一起被得到执行。其中,智能合约将主要来管控数据资产的数据集能够按合同约定使用。数据资产交易合同履行的示意图如下:
随着越来越多的数据资源资产化,就会形成种类繁多的数据资产。买家可以从市场上的数据资产目录中,搜索到想要的数据集,并通过数据经纪或数据交易所联系卖家,达成交易。数据市场基础设施为买卖双方的交易提供包括资产交收、清算结算等服务。将不同数据资产中的数据集进行融合——数据资源开发,并通过研发与之适配的算法,会生成新的数据资产(衍生资产)。由于数据集规模的指数级增长,这样的开发蕴藏几乎无限的可能。由此,可以推断,数据资产的种类将非常庞大,数据资产市场的结构也将是非常复杂的。数据资产直接交易形成的市场,可以称为一级市场。在这个市场中,买卖双方通过商务合同约定交易,并通过相应的DMIs进行和完成交易。随着交易持续进行,数据资产就可以产生现金流。依据现金流,可以对不同的数据资产进行估值。数据资产所有者就可以用其拥有的数据资产进行抵押、借贷、租赁、证券化、投资等传统金融化活动 [7]。例如,公共部门投入大量的数字基础设施,这些基础设施生成的数据资产可以作为发行债券的担保。除此之外,运用分布式记账以及区块链技术,将数据资产Token化,将使得数据资产更容易进行金融化所需要的诸如登记、质押、凭证和记账等要求。例如,当Z想要用他的数据资产
在某个银行申请抵押贷款时,银行只需要将数据资产对应的Non-Fungible Token(
)进行锁仓即可实现 [8]。
对于需要长时间、大量资金、人力投入才能开发出的高价值数据资产(例如,支撑某区域或城市自动驾驶车辆的整套数据集),其所有者或开发者联盟则可以发行该数据资产支持凭证的Token或Ulity Token的形式来融资。数据资产金融化、Token化形成的市场,可以称为二级市场。数据资产的价值可以用证券或Token来表达。需要指出的是,Token化之后的数据资产,可以开发更复杂、灵活的智能合约,满足市场的深度需求。对于那些需要长期使用某种数据资产的买家而言,他们自然的希望可以锁定价格波动的风险;卖家也希望能够规避各种风险。这些需求,可以通过以数据资产Token为基础资产,构建诸如期货、期权等衍生品市场得到满足和实现。
数据金融化会极大的促进数据资产资本(Data Assets Capital)的形成。在数字经济中,很多初创企业更需要融数据资产资本,而不仅仅是货币资本。数据资产资本的投入不仅能够给企业带来数据资源,更重要的是,它能够将企业通过数据资本纽带“接入”到一个生态中,从而获得比没有获得数据资本企业更高的潜在增长。数据资产资本是数据资产市场发展到高级阶段的必然产物,也是释放数据要素生产力的高级形式。当前拥有巨大互联网“流量”的Big Tech公司通过股权投资或其他商业安排构建起来的数十万亿生态 [9]的本质就是数据要素在生态圈内充分分享和流通。这或许是数据资产资本形成的早期形态,可以预见,数据资产资本将会极大的促进更广泛和深入的数据要素流通和应用。2、数据市场的高阶结构(Hyper Structure)随着数字经济的发展,数据使用无处不在。数据市场的深度、广度将超过当前任何一个市场。其结构、功能都很难用某种已知的市场来描述,故采用高阶结构这个词来表示。
首先,数据资产交易主体将延伸到智能机器。数据需求一侧的智能机器,不仅需要自主决策什么时候需要什么数据,而且也应该会“算账”,经济的使用数据,实现其有限最优的决策或行动目标。数据供给一侧的智能机器,则也同样的会根据天气、“需求”来生产数据、定价,并最终达成交易。这样就会形成M2M(machine to machine)或R2R(Robo to Robo)的数据资产交易市场。其次,出于共同的商业利益或其他目标考虑,一些市场玩家(政府或私人组织)会组织形成一些联盟,共同开发、利用某些数据资源,并约定排他性的准入条款。这就会形成以数据资产为纽带的“数据联盟”(Data Aliance)。在联盟内,数据资源在成员之间流通顺畅、交易成本大大低于联盟外的玩家 [10]。有些联盟处于利益最大化,或阻止其数据资源与外部进行交易,形成类似联邦治理体系的“数据联邦”。外部玩家须与其建立“外交关系”才能获取相关数据资产的使用授权。由于并不存在强制性的约定任何一方,因此为避免恶性的数据争夺、“数据战争”,需要采取数据外交的方式解决。数据外交指的是,在不同数据联盟(联邦)之间,就数据治理、数据安全以及数据使用等各个方面达成的共识或协议,并基于此,双方构建一种“互操作”的机制,使得双方在保证各自“数据主权”的前提下,实现数据价值交换的一整套方案。可以想象,由智能机器、诸如数据联盟(联邦)这样的实体或虚拟组织构成的数字新大陆上,数据就如同几千年前的丝绸一样,需要数据丝路这样的市场。最后,当数字技术发展到一定阶段后,虚拟世界与真实世界两个平行世界之间,也存在着大量的数据交互。无论在虚拟世界还是真实世界,都会形成大量的以数据为基础的数字资产(例如,AR虚拟人/数字人)。两个世界的数据资产流通、交易,同样需要构建完善的数据市场来满足需求。培育和发展数据要素市场,促进数据要素共享、流通和交易,是数据资产市场的重要功能。数据资产市场发展到高级阶段,会极大的促进数据资产资本形成,提高潜在经济增长。由于数据的战略性、重要性和经济性凸显,会在主权国家、公司和机构、虚拟组织等不同层面上形成新的“数据地缘政治”版图,为了避免数据屏蔽、数据孤岛以及数据“战争”,数据外交的功能和作用凸显。数据市场的深度和广度超过以往任何一种市场。如何治理、监管真实世界、数字世界的全球数据市场,将面临很多挑战。中国作为数据大国、也是全球率先建立和鼓励数据市场建设的国家,应该在这方面积极探索、先期研究应该未雨绸缪,抓住制高点。[1]中共中央国务院2020年3月20日发布《关于构建更加完善的要素市场化配置体制机制的意见》,第六章第二十、二十一、二十二条,明确提出加快培育数据要素市场的意见。[2] NIST Big Data Interoperability Framework: Volume 2, Big Data Taxonomies。[3]《数据资产化之路》,德勤、阿里研究院,2020年[4]《数据产权的经济分析》,唐家要,2021年。[5]《数字经济发展呼唤数据权利保护类法律》,姜伟,2021年。[7]《数据要素资本化的实现路径》,杜庆昊,2020年。[8] NFT是一种非同质化Token的简称。详细介绍参见https://en.wikipedia.org/wiki/Non-fungible_token[10]《The Open Data Economy Dilemma》,Data Republic
编辑:于腾凯
校对:林亦霖