文 | 浙江大学计算机科学与技术学院院长、教授 任奎
在全球数字化转型浪潮中,数据要素已超越传统生产要素的范畴,成为驱动数字经济发展的核心引擎和塑造全球竞争新格局的关键变量。我国将数据要素确立为第五大生产要素,是驱动新质生产力、推动高质量发展的战略决策。
为加快释放数据要素价值,更好推动数字经济高质量发展,必须做好人才培育和科研生态新范式的战略布局,将宏观战略目标与微观实践路线有机统一。在此背景下,国家数据局等五部委印发《关于加强数据要素学科专业建设和数字人才队伍建设的意见》(以下简称《意见》)。
《意见》超越了单纯的人才培养范畴,将“有组织科研”作为繁荣数据领域学术研究的核心路径,实现了数据要素学科建设、人才培养与创新生态的融合发展。围绕构建“理论-技术-数据-人才”四维协同创新生态的顶层设计,《意见》为学术科研提供了新的运行框架,是深化数据要素市场化配置改革理论创新与制度实践的典范。
一、 理论创新:提出中国特色数据领域科研新范式
党的二十届四中全会明确提出“一体推进教育科技人才发展”,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》强调“健全数据要素基础制度”。在此战略背景下,《意见》紧扣中央精神,以“有组织科研”为支撑,聚焦组织建设、方向研究与数据基础三大核心维度,系统推动数据领域科研范式转型,以期打造自主可控、开放协同的数据领域创新生态。
1. 重塑组织形态:从“原子化创新”到“学术共同体”的制度性跃迁
当前,我国数据领域相关研究力量分散于计算机科学、经济学、法学、统计学等多个传统学科,缺乏统一的学术归属、协同机制和标准化的知识体系,导致研究力量碎片化,难以支撑多学科交叉融合的科研与育人需求,这种“原子化创新”模式与数据领域所需要的系统性、复合型治理需求存在结构性矛盾。《意见》明确提出“加快数据领域学术共同体和数字人才梯队建设,推动成立数据领域科技社团”,旨在解决学科割裂、标准不一等结构性问题。通过构建实体化、体系化的学术共同体,为中国特色数据要素学科专业建设和高质量数字人才培养奠定组织基础。
一是以跨学科协同攻关为抓手。《意见》旨在推动数据领域研究从“单打独斗”向“协同攻关”转变,设立跨学科的数据科学研究机构和学术组织,将分散于各学科的研究资源和人才力量进行系统整合,为分散于不同学院的研究力量提供统一的“物理空间”和“学术归属”。浙江大学计算机科学与技术学院、杭州数据集团、蚂蚁集团研究院等已开始围绕具体问题和数据场景,对科研组织方式进行调整:选题不再完全依托单一学科立项,而是以数据产权、公共数据开发利用等问题为核心,由不同学科研究人员联合设题、协同推进;研究生培养中,也逐步出现以同一数据场景为对象、由多学科导师共同指导的方式。
二是以提升国际话语权为目标。《意见》明确“支持建设高水平数据学术期刊”,旨在扭转数据领域高质量成果“外流”现象,掌握数据产权界定、价值评估等关键议题的国际学术定义权和解释权。
2. 建构知识体系:瞄准“卡脖子”与“无人区”的定向突破
知识体系是支撑数字经济高质量发展和创新实践的理论根基。我国数据领域研究面临两大挑战:一是基础理论上的“卡脖子”难题,尤其在产权、定价、交易等经济学与法学议题上;二是技术前沿上的“无人区”挑战,如在保障隐私安全的同时实现数据高效流通等。《意见》通过构建立足实践的中国数据要素自主知识体系和科学研究体系,推动我国数据研究从分散探索迈向系统建构。
一是以重构生产关系为切口。《意见》强调“聚焦数据产权、定价、交易等关键问题”,这实质上是要求围绕数据作为核心生产要素,建立适配新型生产关系的基础理论。研究需依托我国海量数据应用场景和社会主义市场经济体制下数据治理优势,解决数据作为非竞争性、非排他性资源带来的传统经济学理论挑战。
二是以赋能新质生产力为主旨。《意见》强调“紧跟人工智能、区块链、隐私保护计算等前沿技术发展趋势”,要求深入开展数据基础共性理论和技术研究。这不仅是技术突破,更是为实现数据要素“可用不可见”流通模式提供安全底座,确保数据价值在安全前提下得以规模化释放,为新质生产力发展提供核心动力。
3. 筑牢数据基座:夯实AI for Science时代的可信根基
数据基座是驱动数据密集型科研创新和释放数据要素价值的底层支撑。当前科研中存在“双重孤岛”效应:一是创新主体间(高校、科研院所、企业)的数据壁垒;二是科学数据(实验数据)与产业数据(市场数据)的割裂。《意见》在“夯实科学数据基础”方面提出的一系列重点举措,标志着科学数据已从附属资源上升为战略性新型科研基础设施。
一是以强化数据专业化治理为保障。《意见》明确要“培养跨学科、跨专业的数据工程团队”,意味着科研不再是简单的单人实验,而是需要专业数据工程师参与,对科学数据进行标准化采集、加工和开放共享,提升数据资源质量的协作活动。
二是以推动数据开放共享为路径。《意见》明确要“打破创新主体间‘数据孤岛’和科研人员‘用数’壁垒,推动科学数据与产业数据开放共享、深度融合”。例如,将制造业的真实运行数据与材料科学的实验数据融合,能够激发AI for Science 的巨大潜力。产教融合是推进产业数据与科研数据协同使用的天然试炼场:一方面,将企业真实运行数据引入科研与课堂,用于模型验证和案例分析;另一方面,对科研数据进行统一治理和标准化管理,提升研究过程和结果的可复现性。
二、制度实践:指引未来重点落地举措与深化方向
数据要素相关的理论与方法不仅为人才培养提供知识源泉,也直接决定着数据要素市场化配置改革的深度与质量。《意见》通过构建开放创新的生态系统,旨在打破传统教育、科研与产业之间的壁垒,确保数字人才供给与科研创新能够精准、高效地服务于国家战略和产业需求。
1. 学术创新的关键是建立面向重大问题的研究范式
《意见》提出要“鼓励高校建设数据要素交叉学科平台”、“培育新兴交叉学科方向”,并明确要“加强科研组织建设”、“加快主攻方向研究”。这既回应了当前研究碎片化、基础理论薄弱的问题,也为未来的学术发展指明了方向。围绕数据产权和可信流通等关键问题,亟需形成跨学科协同攻关机制,使研究从个人兴趣驱动转向国家战略需求和产业实际痛点引领。通过强化学科间的结构性联动,使理论研究能够依托稳定的组织体系持续推进,从而推动我国数据要素基础理论不断走向成熟。
浙江大学区块链与数据安全全国重点实验室及相关地方产业技术研究院通过问题清单和任务牵引的方式组织科研,使数据产权、数据安全等核心议题得以在统一研究框架下持续展开,推动相关研究从零散探索转向连续积累,逐步形成可对接制度建设和实践需求的理论成果。
2. 学术创新的前提是建设高质量科学数据库
《意见》在“夯实科学数据基础”中提出,要培养专业的数据工程团队,推进科学数据的采集、治理和开放共享,以国家科学数据中心等国家级科创平台为主体,建设一批具有国际引领力的科学数据库,打通创新主体间长期存在的“数据孤岛”。将金融、医疗、制造等重点行业的真实需求、典型数据资源、关键技术问题系统化地引入学术体系,为科研提供可验证、可复现的研究基础,使前沿研究紧密贴近产业实践,促进科研、教学与产业的深度融合,形成多主体共同参与的创新动力系统。
3.学术繁荣的保障是创造协同创新的制度环境
《意见》围绕科研组织建设提出推动成立科技社团和完善成果发表渠道等举措,旨在构建一个开放、活跃、规范的学术共同体,加速前沿知识的传播与研究范式的更新。数据领域强调实际价值的创造,评价体系配套建设必不可少。引导建立跨学科研究成果、产业解决方案、标准制定等多元学术产出成为制度创新的关键,是引导人才从“重理论”向“重实践”转变的关键杠杆。随着更多企业、科研机构和行业组织参与人才培养全过程,科研任务与人才成长将实现更加紧密的联动,为学术创新提供稳定、持续的智力供给。
4. 学术繁荣的标志是学科建设、产教融合和人才培养形成联动生态
交叉学科平台建设为有组织科研提供结构性支撑;产教融合平台为理论研究提供真实问题、典型场景和关键数据;覆盖全链条的人才发展体系则将科研、教学与产业需求不断对接,使创新能够持续迭代。通过优势高校牵头、龙头企业深度参与、科研机构协同攻关的机制,推动数据领域形成更加成熟的知识体系、更加健全的科研组织结构以及更加高效的成果转化路径。
产教融合创新平台是确保人才培养与产业需求精准对接、科研成果快速转化的关键路径。面向共性技术和关键能力支撑,政府发挥统筹作用,汇聚龙头企业、高校、科研机构,创新治理模式和运行机制。一方面,以国家重大专项为牵引,鼓励政产学研各方共建数据领域关键技术、设施、组件,共享算力设施和数据资源;另一方面,以有组织的科研为导向,共建国家或行业重点实验室,联合产业界探索设立“数据资源池”和“产业命题库”,将企业真实运营数据和实际业务难题转化为教学案例和科研课题,实现科研教学与产业实践的无缝对接。
浙江大学在金融、医疗、物流等数据密集型领域,以真实业务问题为牵引,共建联合课题、联合实验环境或专项联合体,将企业运行数据和实际业务难题转化为科研问题和教学内容,用于支撑交叉学科研究和研究生培养。相关成果在业务系统中进行测试和修正,反向推动理论模型和方法体系的迭代完善。
随着这些举措不断深化,我国数据领域学术体系有望形成从问题牵引到平台支撑,再到生态协同的长效机制,为数据要素市场化配置改革和数字中国建设提供强大的理论与人才支撑。通过《意见》落地实施,我国将有效推动高等教育内涵式发展,促进学科交叉融合,提升高校服务国家战略的能力;加快产业数字化转型,以成熟的理论和可靠的数据基座,为金融、制造、医疗等重点行业的高质量发展进行精准赋能;提升数据治理话语权,构建立足中国实践的自主知识体系,为全球数据治理提供中国智慧和中国方案。