当前,数据作为数字经济中的“新石油”,已成为重要的生产要素。发挥数据要素价值,激发数字经济潜能,需通过开放、共享、交易等实现数据的连接、打通和流动。通过盘活数据资源、丰富数据维度,可充分释放大数据价值,优化资源配置、提高协同管理效率、节约社会成本以及创造更多的社会财富。但由于前期数据管理意识待提高,数据系统分散,造成了当前各大机构、各行业“数据烟囱”林立的局面。目前,数据资源无法聚合集约和互联互通已成为当下数字经济发展的关键障碍和瓶颈。

一、“数据烟囱”的表现形式

(一)政府部门数据“条块分割”

政府机构建立了以部门为中心、以业务为主线的政务信息化发展模式,采用的是纵向数据采集机制,即基层人员采集数据,并上报给各自部门系统,各部门只能向体系内基层采集数据。各部门独立进行信息化建设,数据储存在不同地方,格式也存在差异,部门之间横向相互调取直接使用存在困难,从而导致政府部门掌握的海量数据长期处于“条块分割”和休眠状态。

(二)企业内外部数据“壁垒坚固”

企业发展到一定阶段会建立多条业务线,不同业务线独立收集、存储、定义自身的业务数据,各部分业务数据未被统一存储、管理以及有机整合。此外,从整个产业生态看,各企业在业务发展过程中积累了大量数据,并将其作为企业重要资产进行管理,形成了一个个“数据烟囱”。比如,当前海量数据被阿里、腾讯、百度等为数不多的互联网巨头所垄断,这些数据寡头独立自建内部的、封闭管理的数据库,作为重要数据资产执行严格管理。

(三)高校及研究机构科学数据获取“樊篱围堵”

高校及研究机构科学数据获取“樊篱围堵”。一方面,同一领域内的科研从业者往往独立采集相关部分的科研数据,科研数据分散在各个科研工作者手中或研究组织内部,且各方持有的数据普遍存在重复和质量层次参差不齐的问题。另一方面,部分有助于科研的如人文与社会科学、环境科学以及公共健康等领域的公众数据存储在相关政府部门,这导致诸科研工作者获取数据存在一定困难。

二、“数据烟囱”的三大危害

(一)系统服务效率低下

一方面,政府、企业、组织等机构内部不断投入不同的人力执行收集重复数据、单独维护不同数据存储系统的重复造轮式工作,这将严重浪费机构内部的人力、物力等资源,导致不合理的资源配置。此外,当需要开展跨业务数据合作时,往往需要开展大规模数据拷贝、迁移等工作,这导致大部分人力资源被耗费在数据准备阶段,整个数据系统持续效率低下地运转。另一方面,封闭阻塞的数据仅能服务于单个机构,在跨领域、跨部门的系统性社会工作开展中将会失效。例如,侦查活动过程中往往需要不同省市侦查部门的数据信息,以及房产、水电、物流等一线社会数据,这些数据大都各自封闭,且侦查人员无权限调取,严重阻碍了侦查事件的开展。

(二)用户成本叠加

各机构在数据服务过程中筑建的“数据烟囱”导致数据使用者(用户)不断重复支付服务接收成本。例如,在政务服务场景,同样的个人信息被要求在不同的政府部门反复提交;相关业务无法实现“线下一窗受理”,用户需在不同地方或窗口奔波,反复提交重复数据。在企业产品使用场景,同一企业的关联产品需要注册登录不同的账号;搜索引擎仅能搜索到由搜索公司自己“设计”的部分感兴趣内容等。

(三)大数据价值无法发挥

与传统要素相比,数据要素最明显的特征就是其单一数据个体是不存在价值的,只有聚合、流转起来才能具有价值。因此,小而孤立的数据系统无法实现海量数据的关联和聚合,也就无法通过数据技术全面挖掘大数据潜藏的深度信息,并利用这些信息驱动业务增长、支持机构内部系统性决策等,也无法带来对外的服务效益和价值,以促进行业产业联合发展、激活数字经济。例如,淘宝、京东、拼多多等平台积累的具有公共服务属性的数据如果仅供企业自身使用,便只能用于提升其单个企业的市场营销能力,若将此类数据在保护个人隐私的前提下,以“物理分散、逻辑集中”的方式汇聚至国家大数据平台服务于公共决策,便可进一步升级、发挥互联网数据价值。

三、“数据烟囱”难以消除的原因

(一)基于权力利益考量,不愿开放共享数据

一方面,大多数机构均将数据视作为支撑其内部发展、保持市场竞争力的重要私产,数据开放共享意味着让渡自身权力和利益,会导致数据垄断的优势被迅速瓦解。此外,开放共享数据也意味着将机构内部相关事件过程透明化,由此带来的透明化监督成为部分机构的压力,因而主观上更加不愿开放共享数据。另一方面,随着数据指数性增长,机构收集的数据类型愈加复杂,非结构化数据愈加增多,加之数据清洗、转化能力与所需处理的数据规模不匹配,数据质量越来越难以把控,这大大提高了数据维护成本,机构在数据开放共享中投入动力受到影响。

(二)基于责任风险和收益权衡,不敢开放共享数据

数据可能涉及个人隐私、商业秘密甚至国家安全的相关信息,部分法律条款或者机构管理规章针对特定机构均明确提出不得随意对外提供相关数据。此外,由于当下数据开放共享制度尚不完善,上下游责任边界尚未清晰,即使是没有受到相关制约的机构,也对向外提供数据的行为表示担忧,故而更加审慎地选择了不共享。

(三)基于关键技术制约,不能开放共享数据

一方面,机构按各自标准建设数据系统,导致不同机构的数据采集格式、数据存储方式不统一,严重阻碍了数据流通。另一方面,当前确保数据安全流通的数字技术应用尚未发展成熟,数据流通过程中存在的责任难以确定、个人隐私信息及企业敏感数据泄露等系列安全问题难以杜绝,导致数据资源开放共享受阻。

四、促进数据流通和价值释放的三点建议

(一)夯实数据要素基础管理

一方面,加强数据分类分级管理。可考虑按照数据泄露可能造成的风险大小、数据敏感程度、数据内容的生产方式(原生、衍生)、数据的不同主体(个人、企业、政府)等多维度对不同场景的数据进行分类,针对不同类型的数据划分不同的风险等级,对不同级别的数据制定不同约束程度的共享、开放等流通要求。另一方面,建议加大对数据法律属性的理论探索,开展理论创新,突破当前单一权属理论“一刀切”的处理方式。同时,在数据分级分类的基础上,可考虑对不同类型、不同级别的数据进行差异化的权属处理,因类施策、因级施策,开展针对性的制度设计,以促进数据资源的合理配置,解决数据不愿共享问题。

(二)针对不同场景制定不同的数据流通机制

对于政府机构,适当考虑对部分机构数据共享具有强约束力的法律条款进行修订,并通过制定数据共享清单、明确责任边界,促进政务数据安全共享,解决数据不敢共享问题。对于企业,鼓励企业创建“数据湖”等企业数据平台,建设数据文化,对内优化管理提高业务效率;完善企业间数据交易制度,借鉴欧盟经济区数据货币化、数据市场、行业数据平台等企业间数据共享模式,鼓励企业间通过自愿共享、数据交换和数据交易等方式依法开发利用社会数据。政府与非政府机构之间,健全数据开放共享机制,可通过政府数据开放共享平台,为企业、研究机构等提供发展所需数据;建立“物理分散,逻辑集中”的国家大数据平台,可采用数据调用等手段,接入大型互联网企业所持有的涉及公共管理、国家安全的特定数据,以促进数据在政府与非政府机构间的双向流通。

(三)强化保障数据有序安全流通的技术手段建设

一是建议制定出台国家层面统一的数据共享技术标准,明确大数据归集整合、政府数据开放、政府数据和企业数据共享交换、数据交易等标准规范及实施细则,并要求特定机构参照数据相关标准设计数据接口,解决技术制约下的数据不能共享问题。二是加快发展同态加密、混淆电路、秘密分享、零知识证明等多方安全计算、密码学、区块链等相关技术,支持在数据“可用不可见”基础上创新数据的开发利用。三是鼓励相关机构在探索实现数据安全有序流通路径的过程中,开发、使用追踪数据使用情况及流向的工具,保证数据状态和用途的可知性及可控性。