数据是驱动数字经济蓬勃发展的核心要素,与土地、劳动力、资本、技术等生产要素一样,已经成为基础性资源、重要生产力和关键生产要素。2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”),首次明确数据基础制度“四梁八柱”,勾画数据要素的制度蓝图。在要素市场中,价格是集中反映要素在社会化生产中价值贡献度和供需关系的核心指标。从某种意义上说,生产要素实现市场化分配的过程,就是要素价格逐步形成的过程。数据市场要成为一种典型的生产要素市场,就同样需要建立顺应发展需求和自身特殊规律的价格形成机制,以有效反映数据要素市场的供需关系和数据的实际价值贡献。本文拟在对国内外相关研究文献系统梳理的基础上,重点围绕十九届四中全会提出“由市场评价贡献、按贡献决定报酬”的数据要素市场化配置改革目标,研究提出能够适配不同数据交易标的物形态,有效适配数据供需各方责权利的要素价格形成路径,并重点从数据资源化、资产化、资本化三个层面探讨提出构建数据价格形成机制的基本框架和配套政策举措。
一、数据要素价格形成的研究评述
从学术史的角度,数据要素定价研究可以往前溯源到信息定价。1993年,Brindley较早对信息产品和服务的定价策略问题进行研究,提出成本、需求和竞争导向三重定价策略,基本上可以视为当前数据基本定价策略的前身。Alunkal(2000)指出:信息定价的决策点往往在特定客户的收益与特定提供商的成本要求相交时达成,因此供给和需求是其定价的核心因素。基于此,Harmon等(2009)进一步提出基于成本和价值(实际上是反映需求满足程度)两种信息定价基本模式,从消费者效用和偏好角度对信息定价策略进行研究,并提出相应差异化定价策略。
2012年后,随着大数据概念不断升温,产业界和学术界均开始关注数据定价问题,相关成果丰富。从理论依据的角度,Liang等(2018)将现有数据定价模型分为基于经济理论(成本模型、消费者感知价值、供应模型、需求模型、差异化价格和动态定价)和基于博弈论(非合作博弈、讨价还价和Stacklberg 博弈)两类。刘枬等(2022)综合考虑数据容量和数据质量两方面的价值,运用斯塔克伯格理论,提出基于效用的数据定价方法。从定价形式的角度,王文平(2016)将数据定价方法区分为平台预定价、固定定价、实时定价、协议定价和拍卖定价。李成熙、文庭孝(2020)归纳出按次计价(VIP会员制)、第三方平台预定价、拍卖定价、协议定价、实时定价等五类数据定价模式。
总体而言,这些定价策略大多还是延续传统产品的定价方式,在应用于数据定价时往往面临诸多难题。针对这一问题,一些学者提出了新的定价思路:一是从共时维度,引入数据分层分类策略。郭春芳(2019)将数据产品划分为0次(原始数据)、1次(初加工数据)、2次(统计分析)、3次(知识挖掘)四个层面,认为不同层次的数据适用不同的定价策略。翟丽丽等(2018)从数据产权属性的角度,提出不同产权主体的数据应当采取不同的定价策略,其中公共数据适用边际成本定价模式,企业数据可沿用传统信息定价策略,个人数据则应当以隐私含量为定价导向。二是历时维度,引入数据产品生命周期策略。如王卫等(2012)探讨了不同定价策略和方法在数据产品的引入、成长、成熟和衰退等不同生命周期阶段下的应用路径。李清逸、罗敬蔚(2022)认为,数据价值链和生命周期是进行数据价值评估的重要依据。三是探索新技术应用于不同场景下的定价模型。如基于机器学习的定价(Tsai等,2017;Niyato等,2016)、基于查询的定价(Lin和Kifer,2014)、基于元组的定价(Shen等,2016)等。
综上,尽管目前国内外学术界对于数据定价问题研究起步较早,且已经形成了一些较有影响力的研究成果。但在理论指导实践时仍存在三个方面“先天不足”:一是对数据自身特殊规律挖掘不足。现有研究多脱胎于对信息产品和资本等传统要素的研究框架,但数据形态和权属构成的复杂多变性,使得传统模型在实践中有较大局限,大量现实中的数据交易均采取非标准化(一事一议)定价策略,数据要素定价缺乏统一规则,难以实现通用化标准化。二是对适应中国国情的规制框架探索不足。现有研究大多照搬欧美等资本市场传统,但其规制传统、产权基础等与我国存在明显差异,对如何构建顺应“数据二十条”提出的“三权分置”框架新型数据产权机制下的定价和分配机制,如何对我国政府和央国企体系沉淀的大量公共数据进行定价等新问题的研究仍有待破题。三是与当前我国要素分配实际结合不足。现有研究大多将数据要素及其分配问题等同于数据产品及其交易,与我国薪资分配、效益分配和股权分配并存的要素分配实际有较大差距,特别是对数据资源化、资产化、资本化不同层面的综合定价机制缺乏有效论述。本文针对上述三个方面的不足,从顶层政策框架构建的角度开展研究,并形成一些初步建议。
二、数据要素定价的总体框架
秦海(2004)认为,价格是交易各方的行为规则、所拥有知识和信息等要素在市场机制下动态结合、相互作用和动态博弈结果的集中体现。与传统商品相比,数据具有高固定成本低边际成本(Balazinska等,2013)、产权不清(杨张博和王新雷,2018)、来源结构多变(Liang等,2018)、买卖双方信息高度不对称导致价值“双向不确定”(刘朝阳,2016)等特征,大大增加了数据价格形成的难度。未来,在数据价格形成机制的构建过程中,要充分考虑数据的上述独特性,从数据资源化、资产化、资本化三个层面探索并构建新型数据定价模型。
(一)资源化层面的数据要素价格形成机制
数据的资源化,可以类比于“石油开采”。埋藏在地下的石油只是一种矿产,本身并不具备价值,必须对其进行开采提炼并形成质量可控的标准化原油才能进入市场流通。同样的,数据大量散落在经济社会运行各个角落,很多时候以碎片化形式存在。只有对其统一采集、整理、加工,并形成质量可控、来源可信、标准互通的数据资源,才具备进入流通应用环节并发挥价值的可能性。马克思主义政治经济学认为,商品具有使用价值和价值双重属性,而商品的价值量是由社会必要劳动时间决定的。无论数据资源抑或信息资源,其作为一种生产要素的价值评估,同样应当由凝结在其生产过程中的无差别劳动投入决定。换句话说,数据资源的价值评估主要以成本评估为主,其主要可以包括三部分内容:
一是传统意义上的数据资源采集开发成本,即“原料”数据采集、标注、集成、汇聚和标准化,并形成可采、可见、互通、可信的高质量数据过程中的软硬件和人力等成本消耗。
二是与数据隐私含量相关联的成本。一般而言,包含原始数据集的数据资源一旦进入交易环节,就可能触碰个人隐私、企业商业秘密等问题,必须对原始数据进行脱敏化、匿名化处理。但在具体操作中,数据脱敏的操作标准很难明确,特别是在多源数据交叉比对后,很可能会对一些原始数据进行补齐,从而造成潜在隐私风险。因此,隐私含量对于数据处理的成本影响很大。对于涉及个人隐私信息的数据资源价值评估;需要慎重结合数据集的隐私保护水平进行评估,对于有较大隐私泄露风险或隐私泄露后会造成较大影响的数据集,数据持有方往往要为数据安全付出较高治理成本,应当给予更高的估价。
三是与数据质量相关联的成本。如同实物商品在进入市场流通时有一套完整、规范、标准的质量评估和监督管理体系一样,数据要想真正实现商品化、要素化,就必须建立一套与实物商品质量管理体系相似的数据资源质量评估和管控机制,这同样是影响数据资源开发利用成本的重要因素。目前国际主流评估框架有数据质量评估框架(Data Quality Assessment Framework, DQAF)、信息管理质量评价框架(Assessment Information Management Quality,AIMQ)、数据质量审计框架(Data Quality Audit, DQA)等。
(二)资产化层面的数据要素价格形成机制
数据的资产化,可以类比于“石油炼化”。原油从地下开采出来以后,经过一个庞大的炼化工艺体系,转化为适用于不同用途的燃料和化工原料,原油的价值才能得到最大限度发挥。数据同样如此,数据中蕴含了经济社会运行从宏观到微观方方面面的规律和机理,潜在价值无比巨大,但数据本身并不能直接产生价值,通常需要与具体业务场景相结合,在市场主体提升效率、节省成本、扩大收入过程中实现其潜在价值,这一过程就是数据的资产化(从数据资源到数据产品和服务)的过程。因此,数据资产化层面的定价就是对基于数据资源形成的深加工数据产品定价,适合采用收益分成模式。
从实践看,目前绝大多数服务于金融和互联网领域的数据资产定价实践中,“分润”模式被普遍采用。较典型的如腾讯云市场即根据数据供应商过去一个月或一年内销售额,按10%-20%收取交易佣金。再如,一些隐私计算技术服务提供商,在帮助商业银行基于隐私计算面向中小企业开展信贷评级数据服务时,其往往在前期提供免费或仅满足基本成本的技术服务,并在信贷合同签订和贷后管理过程中,基于信贷额度和坏账率等确认分润比例。
从数据产品和服务的运行过程上看,其同样存在成本问题,并体现为数据产品和服务开发中所采集购买的各种数据资源、软硬件设备和人力成本等投入。但总体而言,数据产品和服务的价值产生过程是一个高度个性化和动态多变的过程,买卖双方对于数据资产的未来价值收益往往缺乏一致和稳定的预期。在现实流通中,仅基于成本收取费用往往无法满足买卖双方的收益预期。因此,可在数据产品和服务价值评估中引入消费者感知价值、历史成交价、数据供求关系、差异化定价策略等因素。另一方面,目前基于上述因素,由买卖双方“一对一”议价的方式,也不能很好反映双方对于数据资产的收益预期。因此,近年来,深圳、贵阳、上海等地数据交易所开始尝试引入基于第三方引导和市场化议价相集合的方式确定价格。即由数据提供方提出初始报价;交易场所或第三方机构综合考虑数据成本(包括数据质量、隐私含量等)和收益预期(包括历史成交价、模型贡献度等),提供参考价建议或释放价格信号,由各类交易主体通过充分博弈的方式进行议价,并最终形成价格共识。
(三)资本化层面的数据要素价格形成机制
数据的资本化,可以类比于“油企投融资”。现代社会中,石油企业通过资产资本化、资本证券化,快速扩张产业规模,是实现财富放大效应的不二选择,对数据企业而言同样如此。著名学者维克托·舍恩伯格在《数据资本时代》一书中甚至预言,未来金融资本主义将被数据资本主义所取代,他指出:“资本的好日子很可能一去不复返:随着货币市场向海量数据市场转换,人们不再那么需要用资本来发出信号。经济会繁荣发展,但金融资本不再会繁荣——从货币市场向海量数据市场的转变就集中体现在这一点上”(维克托·舍恩伯格,2014)。从资本、土地等要素市场发展历史经验看,实现要素从资源化到资产化是具有决定意义的“第一次飞跃”。这一飞跃解决的是产品化和形成市场流通的问题,而从资产化到资本化则是“第二次飞跃”,这一飞跃对于激励资本参与产业发展、激发创业者的创新动力都具有重要价值。实现数据从资产化到资本化的“第二次飞跃”,核心路径主要包括数据证券化和数据股权化两方面。尽管数据资本化定价目前还不具备实际可操作性,但笔者认为未来数据资本化是大势所趋,其定价模式值得探讨。
1.数据证券化及其估价方法。所谓数据证券化,其前提是数据资产可以纳入企业资产负债表并成为一种资产类型(无形资产或存货),同时选取其中质量较好、公信力强、预期明确的成熟资产,以其未来的收益现金流作为偿付基准发行证券产品。其基本操作大致可参考知识产权等无形资产证券化的过程。在传统资产的市场法评估中,通常交易标的是标准化的资产,或拥有标准化的评估指标。相比之下,数据资产还没有统一的衡量指标。因此,应用市场法评估数据的证券化价值时,需要对可比案例市场价值的修正系数做较为详尽的考虑。应该根据交易对象和交易条件选择类似的数据证券化标的(数据资源或数据产品)作为可比案例。对于类似数据标的,可以从相近数据类型和相近数据用途两个方面考虑。常见的数据类型包括:用户关系数据、基于用户关系产生的社交数据、交易数据、信用数据、用户搜索表征的需求数据等;较常见的数据用途包括:精准化营销、产品销售预测和需求管理、客户关系管理、风险管控等。
2.数据股权化及其估价方法。站在现代企业制度的角度,承认数据作为一种生产要素参与分配的价值,其核心是要将企业采集、持有、控制、处理、加工数据的权益转化为股权。蒋永穆(2020)指出:数据成为一种生产要素的最终目标,就是要能够实现企业数据资本收益权“作资入股”,并按照股权平等的原则和贡献程度参与分配。从长远来看,这是数据价值全面升级的关键一步,也是真正实现数据要素市场化配置的重要标志。在实际操作中,数据股权化的模式与技术要素市场构建中技术入股的模式有很多相似之处。目前,各地已经开始积极探索推动数据入股方面的实践。如2022年11月北京市第十五届人大常委会通过的《北京市数字经济促进条例》明确提出支持开展数据入股等数字经济业态创新。2022年7月,中国资产评估协会发布《数据资产评估指导意见(征求意见稿)》,可作为未来专业机构开展数据资产价值评估的参考依据,并进一步指导数据股权化的估值实践。
三、创新优化数据要素定价机制的政策建议
当前,基于成本法的数据资源定价已经在产业组织和机构中得到成功实践,国内如光大银行、南方电网等知名企业均曾基于成本法对本企业的数据资源价格进行测算。但从应用场景上看,模型化后的数据产品和服务则是当前主流的数据流通交易形态。因此,基于收益法的数据资产定价方法是当前应当重点突破的理论问题。未来,随着数据股权化、证券化等资本化配套制度不断完善,基于市场法的数据资本定价研究也将逐步走进历史舞台。因此,全国统一数据大市场下,落实“价格市场决定、流动自主有序、配置高效公平”的总体要求,建立全面、准确、及时反映数据要素成本、价值和供需关系,以及适配数据要素独特规律和当前我国国情的数据价格形成和收益分配机制,是推动数据要素市场化配置改革的“牛鼻子”工程。下一步,建议:
1.在明确数据一、二级市场体系的基础上,针对性建立数据价格形成机制。参考资本和土地等要素的多级市场体系,未来我国数据要素市场可探索构建一二级相结合的市场体系。其中,一级市场即数据资源市场,数据资源持有者将其数据资源持有权、数据加工使用权、数据产品经营权等权利以无偿或有偿方式授权许可给购买者,是一个需要相对强约束、强监管的市场。二级市场即数据产品和服务市场,数据加工方对数据资源加工处理和算法模型化后,以数据产品和服务形式销售给购买者。下一步的工作重点是从一级市场(对机构所拥有的数据资源潜在价值进行评估)和二级市场(对机构数据资源开发利用形成的产品和服务价值进行评估)两个层面提出数据价值评估和价格形成的实施细则。
2.探索将公共数据作为一种国有资产,研究制定相应政府指导定价细则。一般而言,公共数据是政府机构、事业单位和水电气等提供公共服务的机构在履职尽责过程中收集和产生的数据。近年来,很多学者认为,公共数据应当纳入国有资产范畴(衣俊霖,2022)。2021年6月颁布的《深圳经济特区数据条例》征求意见稿中首次提出将公共数据归为国有资产,但在最终稿中未予体现。笔者认为,未来探索将公共数据纳入国有资产,由国家受全民所托管理和开发利用公共数据,明确国有资产的最终收益由全民共享,同时对公民个人隐私和企业商业秘密等基于相关法律加以有效保护,是建立适应我国国情的公共数据产权制度的核心。在此基础上,可以沿用其他公共资源定价的基本原则,按照行政管理或资源补偿类公共资源和服务的收费标准,研究制定基于成本加成法的公共数据政府指导区间定价的操作细则。
3.研究编制针对一、二级市场的数据要素价格指数,为规范数据要素市场价格运行提供宏观指导。类比股票价格指数,数据要素价格指数可反映整个数据要素市场上各种数据产品市场价格的总体水平及其变动情况,能够用于预测数据要素市场发展趋势,是数据要素市场的“晴雨表”。数据要素价格指数依赖于大规模数据要素市场的交易信息沉淀。目前,各地数据交易场所日趋活跃。据统计,上海数据交易所自揭牌运营以来,已成功对接800余家数据商,累计挂牌数据产品超过800个,数据产品交易额超过1亿元。未来可充分依托上海、北京、深圳、贵阳、福建等地建设覆盖面广、较为活跃的数据交易场所,探索编制数据要素价格指数,逐步打造具有全球影响力的数据要素定价中心,逐步形成基于数据交易行为的数字经济产业发展态势研判和决策分析能力。
4.搭建数据资产评估计价公共服务平台,为数据资源化资产化资本化全链条提供共性服务。据笔者测算:随着数据要素市场化配置改革的不断深入,“十四五”期间我国数据要素流通市场规模将达到5000亿-10000亿规模;而随着数据资产入表等实践不断推进,社会机构数据资产及其衍生市场的总规模将超过30万亿。未来,应当瞄准数据要素化不同阶段的共性需求,探索搭建数据资产评估计价公共服务体系,深入分析数字经济、平台经济、双边市场等运行规律和发展特征,建立完善数据资产登记、评估、计价、入表、存证等全链条配合制度和共性服务体系,为下一步推动公共数据、企业数据和个人数据增值化开发利用和资产化创新应用提供可行政策路径,有效激活十万亿级的数据要素市场。
(作者:王建冬 国家发改委价格监测中心副主任、研究员;来源:《价格理论与实践》2023年第3期)