尽管中国发展大数据已经具备一定的规模基础,在收集和应用数据方面表现不俗,但在数据资源开放共享、安全保护、数据确权、个人信息保护和数据跨境流动等方面,中国与发达国家相比还是落后的。

1. 提升各方对数据开放共享的认识

作为新鲜事物,大数据时代的很多特征在目前还没有被大家熟知。从政府公共管理的角度,数据可以让政府治理与决策更加精细化、科学化,可以帮助政府与民众的沟通建立在科学的数据分析之上,优化公共服务流程,简化公共服务步骤,提升公共服务质量。例如,在城市规划方面,通过对城市地理、气象等自然信息,和经济、社会、文化、人口等人文社会信息的挖掘,可以为城市规划提供强大的决策支持,强化城市管理服务的科学性和前瞻性。在新城的规划方面,通过对地理、人口等信息数据的分析,可以清晰地认知城市未来的人口数量和增长趋势。根据城市的发展策略和经济特点,市政部门可以在不同的地理位置设定功能区域,包括工业园区、物流园区、中央商务区、居住卫星城、医院、公安局(派出所)、大学城、文化场所、运动设施及图书馆等城市配套服务设施。在老城区的规划方面,通过分析经济快速发展和功能定位的差异,以及人口数量和结构性的变化,市政部门同样可以制定城市调整和优化的解决方案。例如,老工业区的拆迁和升级改造计划,老商业区、居住区、城中村的改造和功能再定位,等等。在交通管理方面,通过对道路交通信息的实时挖掘,能有效缓解交通拥堵并快速响应突发状况,为城市交通的良性运转提供科学的决策依据。通过整合道路交通、公共交通、对外交通的大数据,汇聚气象、环境、人口、土地等行业数据,构建交通大数据平台,提供道路交通状况判别及预测,辅助交通决策管理,支撑智慧出行服务,加快交通大数据服务模式创新,实现智慧的交通拥堵提醒和疏散管理、智慧的公交到站监测、智慧的交通事故应急调度、智慧的民众交通信息查询、智慧的个人私家车管理等。

从工业互联网的角度,工业大数据涵盖制造业设计、研发、生产、管理及售后等全业务流程,为制造业转型升级提供全新路径和模式。例如,工业大数据有助于企业掌握用户的个性需求,提升产品研发设计效率。通过挖掘分析,工业大数据能够精准反映用户的个性化产品需求、产品交互及交易状况,有利于实现个性化定制,最大程度满足用户需求。同时,工业大数据还能够优化生产工艺流程,缩短产品研发周期,提升制造业生产效率;有助于推动自动智能生产,完善现代化的生产体系。通过对设备、生产线、车间和工厂进行全面数字化改造,并整合各个环节产生的数据,能够促进企业内部信息共享和系统整合,推动生产流程自动化、智能化、精准化,形成智能车间、智能工厂等现代化的生产体系。而且,工业大数据还有助于提升产业协同能力,打造全新制造业产业链。通过工业大数据的开放共享,众多制造业企业的数据和信息资源能够实现有效整合,从而形成一种更加科学高效的产业链,尤其能够带动和引导大批中小企业走出传统生产模式,实现转型升级。

总之,大数据对各行各业的影响是深远的,政府、企业应该通过各种宣传方式,让我们社会的每个组织、每个机构甚至每个公民都了解大数据的价值,了解数据顺畅流动的价值以及数据开放共享的价值。

目前,已经有些大型互联网企业举办了数据开放日活动。例如,腾讯云联合麦思博(msup)举办的“洞见数据价值之道——腾讯大数据开放日”活动,围绕最新的大数据前沿问题、案例研究以及最佳实践,为数据专家和一线技术团队开发者提供了很好的交流平台;阿里巴巴举办了阿里数据开放日活动,从数据的应用产出,如互联网金融数据、智能硬件应用、数据交叉、物流供应链等角度解析当下数据现状,探讨生态圈内的合作机会;清华大学也已经举办了四届“大数据开放日”。不过,这些开放日主要还是聚焦从业人员和学生,涉及面较窄。在此,我们呼吁和建议政府能举办类似国家网络安全宣传周的活动,以喜闻乐见的方式让每个人都有机会认识更多大数据和数据开放共享的价值。

2. 科学设计数据开放共享机制

(1)数据开放共享的边界

大数据时代产生的数据是海量的,表现出不同的特征和属性,也会产生不同的分类方式。例如,从数据生命周期角度,数据可分为原始数据和二次开发利用数据;从主体角度,数据可分为政府数据、企业数据和个人数据;从信息内容参与方角度,数据可分为单方数据和交互性数据,等等。这里主要按开放共享的主体来划分,将数据分为政府数据、企业数据和个人数据。

政府数据是指政府所拥有和管理的数据,以及政府因开展工作而产生或因管理服务需求而采集的外部大数据,为政府自有和面向政府的大数据。狭义上的政府数据主要包括公安、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、环境、金融、统计及气象等数据。

企业数据是指所有与企业经营相关的信息和资料,包括企业概况、产品信息、经营数据及研究成果等,也包括企业的商业机密。

个人数据是指以电子或其他方式记录的能够单独或与其他信息结合识别自然人个人身份的各种信息,包括但不限于自然人的姓名、出生日期、身份证件号码、个人生物识别信息、住址及电话号码等。

(2)数据开放共享的相关方

参与数据开放共享的相关方,主要包括数据提供方、数据使用方、平台管理方、服务提供方及指导监管方。

数据提供方主要是指生产或收集数据,并提供数据进行开放共享的各类主体,包括政府部门和企业。数据提供方提供数据时应遵循国家相关法律政策的规定,确保所提供的数据准确有效、及时更新,且安全可靠。

数据使用方主要是指对数据有需求,通过数据开放共享获取和应用共享数据的政府部门及企业。数据使用方应遵守国家相关政策的要求,在授权范围内获取和使用共享数据,并采取相应的安全措施,确保共享数据不丢失、不被恶意篡改、不泄漏、不被未授权读取及扩大使用范围。

平台管理方主要是指负责建设、管理和运营数据开放共享平台,在数据开放、交换和交易中为数据供需双方提供平台服务的政府部门和企业。平台管理方应建立和完善共享平台的数据安全管理制度,以及数据安全保护、安全服务和安全监测等技术措施,确保共享平台运行安全和数据安全,为数据提供方和使用方提供安全支撑服务,为数据安全监管者提供支持。

服务提供方是指为数据提供方、使用方和平台管理方提供数据存储、数据分析处理、数据安全保障、数据保护能力测评等技术和安全服务,对平台管理方的工作提供支撑的企业及专业机构。服务提供方应当与服务对象签署服务协议,为所提供的服务建立相应的管理制度和专业团队,加强从业者的开放共享能力和数据安全培训,履行数据安全承诺,确保服务过程中的数据安全。

指导监管方是指依照国家法律法规和政策文件的授权,对政府及企业之间数据开放共享进行指导、监督管理的政府部门,包括发改委、网信、公安、安全、保密等部门。指导监管方应当履行职责,依照国家法律法规、政策标准建立数据开放共享管理制度,对整个数据开放共享过程进行合法合规的监督,在各方发生矛盾冲突时进行协调和仲裁。

(3)数据开放共享的原则

政府与企业之间的数据开放共享应遵循以下原则。

1)可持续性:既要满足当前需要,又要着眼长远发展;共享机制的建立不是临时性的,可能使用一次或多次。

2)协调性:当开放共享主体涉及多方时,要充分考虑多个利益方的利益诉求和群体态度,寻求利益的平衡点。

3)互利性:要以效率优先、兼顾公平的原则,降低控制成本的同时提高效率,争取以最少的成本投入获得最大的收益,不断激发各利益主体进行开放、参与共享的积极性;要承认各方对有关产品和服务的数据生成所做出的努力。

4)透明性:应清楚地界定数据使用者的情况,希望获取数据的类型和详细程度,以及使用数据的目的等。

5)良性竞争:在交换敏感数据时应促进良性竞争,保障数据提供方及其相关利益不被泄露。

以上是一般性原则,企业在将数据开放共享给政府时还应同时遵循以下原则。

1)数据使用的相称性:使用企业数据应以公开透明的公共利益为目的,确保做到具体详细、相关联和数据保护;对于预期的共享收益,应保证企业成本的合理性。

2)目的限制:应在合同或协议条款中明确限制企业数据使用的目的,限定为一个或多个;规定数据使用的期限,同时要保证企业数据不被用于无关的行政或司法程序。

3)不造成伤害:保护企业的商业机密及相应利益。

4)数据再利用:企业与政府的合作应力求互惠互利,尤其在付给酬金时也要考虑公共利益。当其他政府机构也有类似的数据需求时,企业应该无差别对待。

(4)数据开放共享的具体方式

1)政府:数据开放

政府数据开放共享,主要是指数据提供方通过开放平台为数据使用方提供开源资源的在线检索、下载及调用等服务。政府数据开放共享的框架设计如图1所示。

图1 政府数据开放共享框架

数据提供方要对数据资源进行分类甄别,尤其是要依据相关法律法规对数据进行脱敏处理,然后才能开放共享;平台管理方负责对数据提供方提供的开放数据进行清洗、审核、编辑、归类、存储和提供等工作,并对所有的数据开放活动进行记录和追踪;服务提供方为数据开放共享提供技术支撑、安全测评等相关服务;指导监管方负责制定监管规则和协调机制,在责任主体产生冲突时进行协调和仲裁,对违法违规行为组织调查并处置。

政府数据开放共享需要一套相应的组织机构框架设计,如图2所示。

图2 政府数据开放共享的组织机构

中央网络安全和信息化委员会办公室下设专门的数据开放共享办公室,主要负责制定工作规划、法律法规、标准规范,推进与政府数据开放相关的工作任务的制定与落实。数据开放共享办公室应重点强化突出全盘统筹的职能,把政府数据开放作为一项重要的战略来抓,打造成政府部门必须履行的程序义务,发挥责任单位职能优势,打造政府管理的新引擎;重点突出强化综合协调的职能,突破政府体制机制的界限,科学合理地划分政府部门的职能职责,着力推动统一的数据开放平台的搭建;重点突出强化监督考核职能,对政府数据的相关工作进行综合整理,对各单位的工作开展和落实情况进行考评,并将考评结果作为评定政府绩效参考,形成有效激励。

地方各网信办也要相应设立数据开放共享职能处室,负责落实中央的政策文件精神,以及结合当地实际制定相关政策,推进当地数据开放共享工作,同时还要接受中央网信办的考核督促。

各相关职能部门如发改委、公安部、保密局等都具有指导监督的职责。

2)政府与企业:数据交换和交易

政府与企业数据开放共享主要有两种方式。一种方式是数据交换,主要指政府与企业在政策、法律法规允许的范围内,通过签署协议、数据交换合作、数据赠与或数据奖励等方式开展的非营利性数据开放共享。政府与企业数据交换的框架设计如图3所示。

图3 政府与企业的数据交换框架图

数据提供方授权使用方获得数据资源,一般通过数据交换协议来明确数据使用范围、权限、使用方式、知识产权及安全保护要求。数据提供方要确定数据准确有效、及时更新和安全可靠,并依据相关法律法规对数据进行脱敏处理后展开交换。当企业共享数据给政府时,也会有数据赠与或数据奖励的方式。数据赠与是企业履行社会责任的一种表现,一些具有奉献精神的企业会无偿将某些数据提供给所有可能对这些数据感兴趣的部门或机构。以欧洲的万事达公司为例,该公司认为造福人类是其使命,经常帮助其他机构获取数据采集与分析的技术工具,而且还定期分享数据及专家观点,提升其他企业人员的开放共享知识与技能。数据奖励是企业与政府共同设立奖项,鼓励数据分析与挖掘领域的人员与企业解决现实中事关公共利益的难题。

数据使用方在授权范围内获取和使用资源,并采取措施确保交换数据不丢失、不泄漏、不被未授权读取或扩大使用范围。服务提供方为数据提供方和使用方提供技术及服务支撑工作,如数据整理、数据脱敏、数据接口定制等。必要时,数据提供方可请具备相关安全测评资质的服务提供方对数据使用方的数据安全保护能力进行测评。指导监管方依照国家法律法规和政策文件的授权,对政府与企业之间的数据交换工作进行指导和安全监管,在责任主体间产生冲突时进行协调和仲裁。

另一种方式是数据交易。数据交易是指数据提供方通过交易平台为数据使用方提供有偿数据开放共享服务,数据使用方付费后获得数据或服务调用权限,也可以付费获得平台的相关数据服务。政府与企业的数据交易框架如图4所示。

图4 政府与企业的数据交易框架图

数据提供方要具备数据的知识产权,并保证数据准确有效、及时更新和安全可靠。按照相关制度和交易原则及市场行情对数据定价,交易数据必须脱敏处理或合法合规,不会对个人隐私和国家安全造成危害。数据使用方在授权范围内获取和使用资源,并采取措施确保交易数据不丢失、不泄漏、不被未授权读取或扩大使用范围。平台管理方负责对数据提供方提供的开放数据进行清洗、审核、编辑、归类、存储和提供等工作,对交易双方的资质进行审核,制定数据交易规则、安全管理制度,并对所有的数据开放活动进行记录和追踪。服务提供方为数据交易提供技术和服务支撑,可以有偿提供数据分析、数据整合等服务。指导监管方依照国家法律法规和政策文件的授权,对政府与企业之间的数据交换工作进行指导和安全监管,在责任主体间产生冲突时进行协调和仲裁。

3. 构建安全框架,确保数据安全地开放共享

数据安全开放共享的总体目标是在数据开放共享过程中保障数据的完整性、保密性和可用性,防止数据丢失、被篡改、假冒、泄露和窃取。这需要加强政策、法律、管理制度、标准规范和技术体系的统筹协调。数据开放共享安全框架如图5所示。框架分为四个层次,从上到下依次为法律法规、安全管理制度、标准体系以及安全技术。

图5 数据开放共享安全框架

加强数据开放共享安全保障,要完善数据安全法律法规及管理制度建设,健全数据安全标准规范,推动数据安全技术开发和应用,做好数据安全的整体规划和顶层设计。

(1)法律法规和管理制度

目前,国家层面还没有建立数据开放共享的上位法,需要从法律角度进行规范和明确,以法律法规的形式对可开放的数据类别、数据开放的技术标准和数据口径等做出明确规定,对数据产权、数据定价等数据交易的核心问题做出明确规定;从整体数据保护需求和要求出发,对数据安全保护做出规定。

除了健全国家法律法规以外,还需要在行业、部门、地方及平台层面建设配套完善的数据安全管理制度,以落实相关法律的要求。管理制度的设计要上承法律要求,下接标准支撑,在实践方面能够有效规范数据开放共享行为,确保数据开放共享组织管理机构职责明确、数据开放共享活动流程清晰、数据开放共享过程安全可控和监管有效。管理制度具体可包括以下五个方面。

第一,数据提供注册制度。数据提供方按照规定向平台管理方注册并审核通过所提供的数据后,方可发布数据。数据提供方所提供数据应明确摘要、使用范围、条件及要求、提供者信息、联系方式、更新周期和发布日期等。数据提供方在注册过程中需要承诺对注册数据的所有权或控制权,确保提供的数据真实、完整、安全、有效、可用,来源明确,界限清晰。一旦出现数据泄密事故,可为追根溯源提供有力的证据支撑。

第二,数据授权许可制度。平台管理方在获得数据提供方许可的条件下,通过规定方式将数据的使用权授予数据使用方。对于重要数据,需要第三方评估数据使用方的数据保护能力,达标后才能授权。如果涉及隐私数据,管理者负责数据脱敏后方可授权。

第三,数据登记使用制度。数据使用方按照规定向平台管理方/数据提供方登记并被审核身份及权限后,在合法合规的条件下才可获得数据的使用权。数据使用方登记的内容应明确所使用数据的类别、用途、使用范围、使用方式、使用者信息及联系方式等。数据使用方应当遵循国家的相关政策要求,在授权范围内获取和使用数据,并采取措施以确保共享数据不丢失、不泄漏、不被未授权读取或扩大使用范围。

第四,数据安全保密管理制度。明确数据交换需遵从的原则,如个人信息保护原则、最小授权原则、获取数据需要具备相应等级数据安全保护能力原则等。明确数据交换过程中的数据安全管理要求,包括数据传输、存储、处理、销毁等环节,加强数据安全保护。要建立数据安全应急处置预案,当出现信息安全事件时能够及时发现和处置,以降低事件造成的影响。

一般来说,数据交换的行为有其特殊的需求和应用场景,因此应根据交换双方的需求、权利义务关系和数据内容制定相应的数据安全保密协议,对参与数据开放共享的相关方形成法律约束,规定相关权利义务和违规责任。

第五,数据交易安全管理制度。要建立基于第三方的数据评价估值机制,对数据提供方的数据准确性、完整性、安全性,以及知识产权情况、数据脱敏情况进行审核和评价,进而确定其是否可以上市交易并给出指导价格。对交易双方的资格进行审核,数据提供方是否具备数据产权或处置权,是否具备提供数据以及后续更新数据的条件和能力。对于数据使用方重点审核其是否具备相应的数据安全保护能力。服务提供方应保证数据交易过程的公开、公正和透明,并通过采取有效的技术措施,确保数据交易过程可监、可控和可追溯。服务提供方可以建立交易双方的信用评价机制、数据使用效果的评价机制和市场退出机制,推动形成数据交易的良性循环,维护市场秩序,同时开展数据应用示范,提升数据开发利用规模和应用水平。要解决好数据安全和隐私保护问题,交易的数据中不可避免含有个人隐私数据或政府及企业敏感数据,数据提供方如何合法合规地进行数据脱敏,监管方应给予指导和规范。

(2)数据安全标准体系

为了更好地开展数据开放共享,需要以数据安全为核心,围绕数据安全主要制定以下四个方面的标准,以提供全方位的安全标准支撑。

1)基础类标准

数据开放共享基础类安全标准为整个数据开放共享安全标准体系提供包括角色、模型、框架等基础概念,明确数据开放共享过程中各类安全角色及相关的安全活动或功能定义,为其他类别标准的制定奠定基础。

2)平台和技术类标准

针对数据开放共享所依托的平台及其安全防护技术、运行维护技术,制定平台和技术类标准,对数据开放共享安全的技术和机制(包括安全监测、安全存储、数据溯源及密钥服务等)、平台建设安全(包括基础设施、网络系统、数据采集、数据处理及数据存储等)、安全运维(包括风险管理、应急服务及安全测评等)提出要求。

3)数据安全类标准

制定数据安全类标准主要包括个人信息、重要数据等安全管理与技术标准,覆盖数据生命周期的数据安全,包括分类分级、去标识化、数据跨境、风险评估等内容,用于健全个人信息安全标准体系,指导重要数据的管理和保护。

4)服务安全类标准

针对数据开放、交换、交易等应用场景,提出共享服务安全类标准,包括数据开放共享服务安全要求、实施指南及评估方法等;规范数据交换共享过程的安全性和规范性,保护个人信息安全不受侵犯、企业利益不受损害等;保证数据交易服务产业的健康规范发展,促进政府、企业、社会资源的融合运用,支撑行业应用和服务创新,提升经济社会运行效率,等等。

(3)数据安全技术

政府与企业之间数据开放共享在安全技术保障上重点要突出数据安全的特殊需求,从技术防护做好数据安全保障。目前需突破的关键技术包括安全监测、数据脱敏、访问控制、追根溯源等,以达到对数据安全可监测、可管控、可追溯的目的。

1)安全监测

政府与企业之间数据开放共享涉及大量的数据,数据集中化程度高,过于集中的数据使其容易成为网络攻击的目标,也会成为APT攻击的重灾区。针对数据开放共享场景下海量异构数据的融合、存储和运维管理,需要采取有效的针对性技术手段强化网络安全监测,通过对流量、日志、配置文件等进行监测,对数据开放共享平台及系统进行网络安全的深度监测和分析,对网络安全事件进行预警与协同防御处置,提升对安全风险的监测预警和感知能力,提升数据开放共享平台和系统的整体安全态势感知、风险研判、安全预警及安全决策等能力。

2)数据脱敏

数据开放共享过程中存在大量的敏感数据,如个人信息数据、交易数据等。对于这些敏感数据,需要依据相关的法律法规、数据分类分级的安全需求以及数据开放共享的安全管理要求,定义数据脱敏的安全方法和评估标准,针对数据开放、交换、交易等应用场景对数据进行脱敏。

3)访问控制

有效的身份认证与访问控制是确保数据不被非授权访问的关键。针对应用场景、业务需求等划分用户,通过统一的身份认证和单点登录,为系统用户访问数据资源提供集中、唯一的访问入口,禁止用户非法访问和使用数据资源,通过统一的账号、授权管理,对用户能够在被管资源中行使的权限进行分配,实现用户对资源的访问控制,对用户访问资源的行为进行记录,以便事后追根溯源。

4)追根溯源

安全事件追根溯源要求对用户的操作行为进行审计,对违规操作能够进行溯源。对流量信息、日志信息以及告警信息等进行关联分析,有效地追溯网络攻击行为,关联行为主体的IP地址等信息,追溯到行为主体所在的单位、具体的操作人。强化共享数据流转审计,对数据的流转过程进行管控,对共享数据在采集、存储、传输、共享、使用等环节的流转过程加强监控,使数据“留存在哪里”“流转到哪里”全程可见,通过对数据开放共享全过程进行不可抵赖和修改的记录,提升对安全责任的确责和追责能力。