文 | 清华大学大数据系统软件国家工程中心总工程师 王晨
数据作为数字经济时代的关键生产要素,其产权制度的构建与完善直接关系到国家创新活力和经济发展潜力。党的二十届三中全会《决定》明确提出“加快建立数据产权归属认定、市场交易、权益分配、利益保护制度”,为数据基础制度建设指明了方向。本文旨在针对数据加工、聚合、分析等实践环节,探讨如何通过制度设计激励数据要素创新,推动数据要素市场健康有序发展。
一、深化数据加工聚合分析:从治理到建模的价值提升路径
数据价值的真正释放,离不开对数据的加工、聚合与分析等深入开发利用。这三个环节层层递进,覆盖从原始数据到高价值产出的完整转化链条,既是技术过程也是制度建构与价值创造的过程。在这一过程中,数据从无序的原始数据逐步转化为有序的“资源”和“资产”,成为驱动产业升级与社会进步的关键动力。
首先是数据加工,其核心是对原始数据进行系统性处理以生成加工后数据的过程,涵盖数据治理、数据预处理、数据统计、数据标注等多种处理方式。它不仅是数据形态的转换,更是数据价值重构与知识提炼的关键环节。在这一过程中,原始数据经过规范治理、清洗整合、计算衍生与智能标注,逐步转化为可供分析、建模与决策的数据资产,为业务智能化和模型训练提供高质量、高可信的数据基础。在自动驾驶场景中,从激光雷达、摄像头、毫米波雷达等各类传感器获取的海量、多模态原始数据,须经过时序同步、噪声滤除、异常值处理、目标分割与场景标注等数据加工环节,形成可用于感知模型训练的规范化、高精度数据集。这一系列加工过程直接决定了后续模型的有效性与安全性,是构建可靠自动驾驶能力不可或缺的支撑。数据加工是从“数据原材料”到“数据半成品”的提质与塑形,为建模与应用提供可信、可用、可解释的数据基础,是实现人工智能落地的前置关键环节。
其次是数据聚合,强调在多源、异构、动态环境下的数据汇聚与融合创新。聚合不仅是物理层面的数据归集,更是逻辑层面的知识关联与价值重构。它涉及多源数据的采集、对齐、关联、融合与结构化重组,旨在打破数据壁垒,实现跨系统、跨层级、跨领域的深度整合。在这一过程中,原本分散、孤立的数据点通过关联分析,形成体系化的业务数据对象或知识结构,数据价值密度与洞察深度显著提升,为后续的建模分析与智能决策提供统一的数据视图。以智慧城市建设为例,通过整合交通流量、环境监测、能源消耗与公共安全等多维实时数据,构建城市运行的动态全景图,不仅能实现交通拥堵预测与应急响应优化,更能支持城市规划、资源调度与可持续发展等系统性决策。数据聚合是从“多源数据”到“统一认知”的结构化整合,通过打破壁垒、关联融合,形成支撑复杂决策与系统协同的数据底座,是实现业务智能与跨域联动的核心支撑环节。
最后是数据分析,其核心是从数据中提取知识、构建模型并形成可落地的应用价值增值。数据分析依托于统计学、机器学习、人工智能、数据挖掘等前沿技术,通过对海量数据的深度挖掘与模式识别,发现隐含规律、预测未来趋势、辅助优化决策,最终形成具有实际应用价值的产品、服务或解决方案。这一阶段不仅是技术能力的体现,更是业务理解、场景需求与创新思维的结合。例如,在金融领域,基于用户交易行为、征信记录与宏观经济数据的风控模型,能够实现精准的信用评估与欺诈识别;在医疗健康领域,融合临床数据、基因组学数据与影像数据的辅助诊断系统,可为医生提供更全面的决策支持;在消费领域,基于用户画像与行为分析构建的个性化推荐引擎,显著提升了用户体验与商业转化效率。数据分析的成果往往以“数据产品”的形式呈现,其价值已超越原始数据本身,成为推动产业智能化、服务精细化的关键驱动力。
二、衍生数据的确权机制:以产权为手段激励数据深度价值创造
在数据要素的价值创造链条中,数据加工、数据聚合与数据分析是逐层递进、循环增强的核心环节,推动数据从原始状态向高价值产品的系统化跃迁。如果该过程形成了数据内容、结构、形态的明显变化和价值增值,可以将产生的数据判定为衍生数据。数据处理者享有该衍生数据的持有权、使用权和经营权。衍生数据因凝聚了深度加工所注入的知识、技术与创新,成为数据要素产权配置与权益激励的关键对象。
衍生数据的判定,是确权机制运行的前提。衍生数据需要同时满足不可逆性、非相似性与价值增值性三大原则。不可逆性意味着加工过程不可还原,这一原则着重保护原始数据产权人的利益。例如,通过机器学习模型对历史销售数据进行回归分析生成的销量预测报告,无法逆向推导出原始交易记录。非相似性体现为数据形态或结构的根本改变,这一原则兼顾对原始数据产权人的保护和对数据加工聚合分析的深度。例如将分散的交通流量、天气、事件数据融合建模生成的城市实时风险热力图,其图谱形式与原始数据表截然不同。价值增值性是核心原则,指衍生数据相较于原始数据在应用效能或经济价值上显著提升。这一原则主要考量数据处理过程带来的价值增量导致结果数据的价值显著高于原始数据,具备了主张数据产权的基础。例如对工业设备噪声数据进行特征提取与异常检测形成健康预警指标,显著放大了数据价值。
在此基础上,对原始数据的有限“使用”演化为对衍生数据的完整“权利”。当企业对合法获取的原始数据进行深度加工并形成衍生数据时,便取得了对该衍生数据的持有权、使用权和经营权,这一权利为后续的开发利用提供了法律保障。同时,衍生数据的创造过程本身就是使用权的深化体现,而在获得持有权后,创造者对该数据的使用权将更加自主和充分,可用于产品优化、服务创新或内部决策。更进一步,衍生数据生产者可以行使经营权,例如可将衍生数据封装为可交易的数据产品或服务(如行业分析报告、风控模型、用户画像体系),通过许可、转让等方式进行市场交易,实现价值变现。这一“三权”配置的过程,清晰勾勒出数据作为生产要素的价值创造演进路径,使创新投入能够获得相应的市场回报。
以价值增量为核心的确权机制,旨在构建一个激励创新与规范发展相平衡的数据要素市场生态。一方面,通过衍生数据的客观判别与数据产权登记制度的建立,明确权利生成的边界,增强交易信任与市场流动性。另一方面,以合法的使用权以及衍生成效判定为基础,在赋权的同时也设立了必要的行为边界,防止权利滥用。这种“赋权与限权相结合”的机制设计,保障了真正的创新者能够通过深度加工获得应有权益,形成“投入—创造—收益”的良性循环,维护公平竞争的市场秩序与更广泛的社会价值导向。
三、构建以产权确认为核心的市场供给体系:数据产权可追溯有效降低合规成本
数据产权确认机制为数据产品开发的全过程溯源提供了坚实的制度基础,每一次数据产品的开发都可以明确追溯上一手数据来源,确保合规,每一款衍生数据都具备清晰的权利边界和价值标识。数据产权制度的实施使得产品从原始数据获取、加工处理到最终成品的全链条信息都能够实现可追溯、可验证。这种溯源机制不仅增强了交易透明度,更重要的是为数据产品的质量评估和价值认定提供了客观依据。在跨境数据流通、多主体协同创新等复杂场景下,标准化的产权体系成为建立市场信任和规范交易秩序的关键保障。
产权确权机制正在重塑市场竞争格局和创新生态体系。从供给主体角度看,产权保护体系的完善催生了专业化分工的新格局,数据采集商、加工商、分析商和应用开发商在各自专业领域形成完整的产业链协同。从供给内容角度看,市场产品正从单一的数据资源向包含技术服务、应用解决方案的复合型产品体系演进。从供给方式角度看,传统的产品交易模式正向数据订阅、成果共享、合作开发等多元化模式拓展。这种供给体系的丰富和升级,不仅激发了市场创新活力,也为数据要素在更广泛领域发挥乘数效应奠定了坚实基础。
数据产权制度的建立健全正深刻重构着数据要素市场的供给生态。通过构建对数据创新进行产权确认的制度框架,激励市场供给体系从“资源驱动”向“创新驱动”的范式转变,不仅能够破解数据要素长期面临的产权困境,更从源头上激活了市场主体开发创新数据产品的内生动力。数据产权制度通过明确衍生数据的判定原则,为数据产品开发提供了清晰的权利预期和制度保障,使得各类市场主体能够依托其技术专长和行业洞察,开发出更具深度和应用价值的数据解决方案,特别是中小企业凭借行业专精知识能够突破传统数据资源壁垒,开发出具有市场竞争力的创新产品,丰富市场供给的多样性和创新性。