如果把数据比喻成钻石矿,那么政府便是最大的矿主。或许有人以为阿里巴巴、腾讯、谷歌、Facebook等互联网巨头企业是大数据的开荒者和掌控者,事实并非如此,大规模数据收集与处理的先驱其实出现在政府领域。早在19世纪80年代,美国政府借助统计学家赫尔曼·霍尔瑞斯发明的电动机来读取卡片上的洞数,仅用一年时间就完成了原需耗时8年的人口普查活动,就此开启了政府进行大规模数据收集与利用的新纪元。20世纪30年代,美国总统富兰克林·罗斯福为促进社会保障法的实施,推动了美国政府史上最雄心勃勃的数据收集项目之一,对美国2600万名企业雇员和300万名雇主的职员档案及人员记录进行采集。时至今日,政府已成为数据资源的最大持有者。由于政府可以强制、免费收集数据,未来政府累积的数据将更加庞大。

毫无疑问,政府掌控的数据蕴藏了巨大的经济和社会价值。但当下大多政府数据尚处于沉睡状态,价值并未得到充分的挖掘和利用。如何使这些沉睡数据被充分利用,成为国家治理及政府行政面临的新课题。随着大数据时代及数字经济时代的到来,技术持续突破,观念不断革新,人们逐渐意识到政府数据只有被充分开放、共享,让政府之外的主体也成为数据享用者,其价值才能得到充分彰显。

世界各国政府充分认识到开放政府数据的战略意义,一改过去的封闭态势,纷纷开展政府数据开放行动。例如,美国、英国、澳大利亚、加拿大、挪威、荷兰、印度等诸多国家政府都创建了“一站式”数据开放平台——Data.gov,以发布他们收集的数据;同时不断出台要求政府各部门进一步加强数据开放的政策措施,除了收集数据,还包括如何将数据转化为切实可用的信息产品以及知识。当然,政府数据的开放并非无边界、无限制。政府数据开放并不意味着将所有政府掌握的数据都向社会公众进行开放,数据开放必须以保障国家和公共安全、社会稳定为前提。

对于那些涉及国家和公共安全、社会秩序、公共利益、商业秘密、个人隐私等敏感性及机密性数据的开放,必须施以合理、有效、可靠的规范和管制。因此,如何制定隐私和保密政策,进而寻求政府数据开放的边界,成为世界各国开展数据开放行动中面临的重要挑战。

1. 联合国“全球脉动”项目

联合国秘书长执行办公室于2009年正式启动了“全球脉动”(Global Pulse)倡议项目,目的在于通过推动数据高效采集与数据分析方法创新突破,探索大数据技术服务于社会经济发展的解决方案及有效路径,进而推动大数据技术作为公共产品的研究、发展和利用,最终使大数据对全球可持续发展和人道主义行动发挥实质作用。其中,促进建立公私部门数据开放,形成数据开放共享伙伴关系,成为该倡议项目的重要原则和实施途径。该项目依托脉动实验室(Pulse Labs)研发强大的数据分析工具及方法,进而将其应用推广至更大范围。

2012年5月29日,“全球脉动”项目发布《大数据开发:机遇与挑战》报告,阐述各国特别是发展中国家在运用大数据促进社会发展方面所面临的历史机遇和挑战,并为正确运用大数据提出了策略建议。该报告认为,世界正在经历一场数据革命。相对于上一代通过有限渠道生成的小体积的模拟数据,当今大量的数据通常通过不同的渠道,从不同的来源生成和流动,包括数字化生成、被动生成(人们日常生活的产品或与数字化服务交互生成)、自动化收集(系统能够提取和存储其正在生成的相关数据)、在地理上或暂时性可跟踪化(如移动手机定位数据)及持续分析。数据传播速度、频率和数据来源的增加,促使数据开发形成了“数据洪流”。

该报告还分析了大数据革命带来的挑战,这些问题在今天仍然是大数据发展所面临的基本困境。首先是隐私问题,隐私可能在许多情况下被泄露。例如,人们通过简单勾选一个选项,同意采集和使用网络产生的数据,但并没有完全意识到这些数据如何被使用或滥用。其次是数据开放共享存在诸多障碍,基于保护自身竞争力等原因,私人企业和其他机构并不愿意共享这些数据以及自身业务的数据。从公共或私人部门获取非公开数据,需要特定的法律确保通过可靠的机制访问数据集。此外,还有数据内部可比性和系统互操作性的技术挑战。因此,“全球脉动”项目提出“数据慈善事业”的概念,即企业主动以匿名方式向改革者提供数据集(去掉所有个人信息),以便从数据里挖掘出深刻的观点、模式和趋势性的数据。

2. 美国大数据战略

美国作为大数据诞生的策源地与技术创新的前沿阵地,一直在全球居于领先地位。对于政府数据开放,美国同样是全球最坚定的倡导者和实践者之一。美国认为,数据是具有价值的国家资本,理应向公众及社会开放,进而充分实现其价值,而不是将数据深藏于政府内部。2012年3月,白宫发布“大数据研究和发展计划”,正式成立专门的“大数据高级指导小组”,提出以国家安全保障为核心,以科技与工程创新为抓手,全面提升美国从大规模复杂数据中提取信息和观点的能力。同年11月,美国公布多项研发政策,都与各级政府、私营部门、科研院所的大数据研究项目有关。2013年11月,美国实施“数据-知识-行动”计划,为通过大数据改造国家治理模式、支持技术研发创新、培育经济增长点指明了具体的实施路径。2014年5月,美国总统办公室提交《大数据:把握机遇,维护价值》政策报告,重点强调政府部门应当与私人部门展开数据开放共享、紧密合作,利用大数据共同降低发展风险。2018年12月21日,美国众议院投票决定启用《公共、公开、电子与必要性政府数据法案》(又称《开放政府数据法案》),标志着美国政府在数据开放上又迈出了历史性的一步。它奠定了政府数据开放的两个基本原则:一是在不损害隐私和安全的前提下,政府信息应以机器可读的格式默认向社会公众开放;二是联邦机构在制定公共政策时应当循证使用。

除了加强顶层设计,美国政府还有很多重要举措。在政府投资核心技术开发方面,2011年,国家科技委员会专门成立“大数据高级督导组”(Big Data Senior Steering Group,BDSSG),负责确定联邦政府当前需要开展的大数据研发任务;2012年3月29日,美国奥巴马政府的白宫科技政策办公室发布“大数据研究与开发计划”,首批共有六个部门宣布投资2亿美元,用于本领域内先进工具与核心技术的研发和应用,共同提高收集、存储、保留、管理和分析海量数据所需核心技术的先进性。

在公共数据开放方面,作为美国“开放政府”承诺的关键部分,2009年奥巴马政府依据《透明和开放的政府》推出统一数据开放门户网站——Data.gov,要求各联邦机构将需依法公开的数据和文件按照统一标准分类整合,上传至该网站,供用户集中检索,实现了政府信息的集中、开放和共享。为了方便公众使用和分析,Data.gov网站还加入了数据的分级评定、高级搜索、用户交流和互动等功能。例如,运用Data.gov提供的白宫访客搜索工具,不仅能够搜索到访客信息,而且可以将白宫访客与其他微博、社交网站等进行关联,进一步增加了访客的透明度。

为了更方便民众使用,方便应用领域的开发者利用这些数据开发应用以满足公共需求或创业,Data.gov汇集了1264个应用程序和软件工具、103个手机应用插件。另外,Data.gov还发布了政府API索引,使这些资源可以更易被找到和便于使用。通过开放API接口,Data.gov让政府的信息和服务交付更加便捷,也让公众和企业家在构建更好政府、提升服务的过程中成为合作伙伴。美国政府也希望并鼓励公众(开发者、创业者和企业家)能够积极加入进来,成为这个进程的一部分。美国还和印度一道对Data.gov实行了开源,把代码托管到GitHub上以供各国的开发者使用或根据需要修改。通过构建OGPL平台,提供开源的政府平台代码,并允许任何城市、组织或政府机构创建开放站点,美国政府可以进一步推动数据开放行动进程。美国政府还成立了“数字服务创新中心”,开发了Sites.USA.Gov网站来帮助各机构建设即插即用型网站。同时,政府出台移动应用程序开发项目,帮助各机构对移动应用程序进行规划、测试、开发和发布,确保更加安全和高效。

3. 英国数据权运动

英国既是大数据的拥抱者,也是政府数据开放的领导者和先行者。2010年,英国时任首相卡梅伦便明确提出绘制英国开放政府和透明政府的蓝图。当年,英国政府公布了开放政府许可证、政府出版的作品的永久免费版权许可证,以及data.gov.uk公共部门数据集存储库,拉开了政府数据开放的历史帷幕。2011年9月,英国正式启动了开放政府国家行动计划,以优化公共资源管理方案及完善公共服务为切入点,开展政府数据开放活动。2012年6月,英国政府建立了一套对公共部门开放数据程度的评价体系,对各公共部门完成开放数据任务情况进行审计,以促进英国公共服务数据的开放性。2013—2015年,英国启动第二个开放政府国家行动计划,将政府开放行动内容铺开至反腐败、信息基础设施建设,以及提高社会救助力度等领域,并制定了21条开放承诺为问责和约束提供依据。

现在,英国已成为世界上政府数据开放最成功的国家之一。2018年万维网基金会发布的《开放数据晴雨表》显示,英国在政府数据开放方面的指数与加拿大排名并列第一,如表1所示。一份国际行业报告显示,英国政府通过大数据技术每年已节省约330亿英镑。目前,英国已开放了有关交通运输、天气和健康等方面的核心公共数据库。

表1 2018年全球开放数据晴雨表

英国政府的数据开放之所以成功,在于其构建了完善的政府数据开放政策体系。目前,英国发布的政府开放数据相关政策主要包括《迈向第一线:更聪明的政府》《联合政府:我们的政府计划》《英国政府许可框架》《开放政府伙伴关系英国国家行动计划2011—2013》《2011秋季声明》《促进增长的创新与研究战略》《公共部门透明委员会:公共数据原则》《开放数据白皮书:释放潜能》《开放标准原则》《开放政府伙伴关系英国国家行动计划2013—2015》《抓住数据机遇:英国数据能力战略》《G8开放数据宪章英国行动计划2013》《身份管理与隐私原则》《英国开放数据路线图2015》《地方政府透明行为准则2015》及《英国开放政府国家行动计划2016—2018》。

这套政策体系并没有停留在纸上,而是发挥着具体的实践指导作用。首先,这套政策类型多样、系统性强、机制灵活,具体包括标准政策、许可政策、规划政策等多种类型,而政策制定主体既包括内阁办公室这种中央政府机构,也包括国家档案馆、财政部,以及商业、创新与技能部等多个机构,构成了多维、多方协同治理的格局,以保障政策落到实处。其次,这套政策注重连贯性,而不是采用运动式、急于求成的治理模式。因此,英国政府会基于之前的政策实施效果进行修改完善,每年循序渐进地制定延续政策,始终注意保持政策的可持续性。而且,这些政策并不是孤立存在的,全国性政策与地方政策遥相呼应、协同推进。再次,英国政府深刻认识到政府数据开放是关系国家整体治理的系统性工程。因此,数据开放政策覆盖面极为广泛,涉及法律制度、组织架构、数据理论、数据标准、隐私保护、人才培养及市场监管等多个方面。

同时,英国也加大了资金投入。英国在开启政府数据开放建设之初就投资了8000万英镑,用于鼓励个人或企业研究开放数据,谁研究出了成果,谁就可以申请基金奖励。很多英国民众都参与到了政府数据开放的建设中来。2012年,英国投资10万英镑建立世界上首个“开放数据研究所”(ODI),以帮助产业界充分利用这些数据的开放所带来的机遇。2013年1月,英国政府向航天、医药等八类高新技术领域注资6亿英镑,其中大数据技术获得了1.89亿英镑,是获得资金最多的领域。

英国非常重视对数据文化的宣传,走文化建设与技术发展相统一的道路。目前,英国政府已经成功举办了多场关于开放数据领域的展览,吸引全民参与开放数据建设。英国开放数据的良好局面,与政府对数据文化的宣传有着很大的关系。这说明只有让数据文化深入人心,公众真正了解政府数据开放,看到政府数据开放带来的好处,才会发自内心地支持和参与,促使开放过程更加顺利。

4. 新加坡大数据治国理念

新加坡是实现政府数据开放的先驱国家之一。早在2008年,新加坡政府便提出了一项全国性计划——新加坡地理空间信息库(Singapore Geospatial Collaborative Environment,SG-SPACE)。新加坡多个政府部门与研究机构合作开发智慧地图平台Onemap,计划将土地、人口、商业和公共安全数据统一整合到政府构建的数据中心,大幅减少公共部门采集、处理、管理地理空间信息的重复工作,系统推进空间数据的全面共享和流通,为社会公众及企业开放地理空间数据,以帮助其决策。基于SG-SPACE项目,政府部门为公众提供了学校、商业、交通及住房等众多可查询信息,让使用者随时搜索各种各样的地理空间信息。新加坡土地管理局(Singapore Land Authority)为基于位置的服务(LBS)的企业提供了数据开放平台与API接口。新加坡陆路交通管理局通过开放交通数据,鼓励社会利用公共数据开发应用软件。目前,企业已经开发了100多项应用,涉及停车信息、公共厕所、野猫管理等公共服务。新加坡人力部发布一个全新互动网站,开放新加坡劳动力市场相关的官方数据,企业雇员及雇主均可参考该网站上的工资、雇用条件、员工规模及员工流动率等数据指标,为招聘应聘进行决策辅助。2011年6月,新加坡政府便已正式启动政府共享信息平台data.gov.sg,开放了来自60多个公共机构的8600个数据集,其中50%的数据是可机读的。

为了促进政府数据全面开放,新加坡采取了多方面的举措。

一是建立完善的数据开放法律制度保障体系。2012年,新加坡公布了《个人资料保护法令》(Personal Data Protection Act 2012,PDPA),旨在防范对国内数据以及源于境外的个人资料的滥用行为,并成立了个人资料保护委员会,对不遵守《个人资料保护法令》的企业进行调查。新加坡还建立了严格、明晰、具体、可操作的数据开放标准及规则。

二是完善组织机构建设。新加坡资讯通信发展管理局(IDA)是推进政府部门大数据应用的主要机构。为了更好地实现大数据的广泛应用,IDA的组织架构采用扁平化模式,将超出半数的官员派出至新加坡其他政府部门和机构充当联络人,大力推动政府部门之间的协作和沟通,使该行政部门看起来更像是IT企业。

三是积极引入大数据人才。新加坡为促进大数据等信息技术人才的引入,实施政府首席信息官制度,设立专门的高级官职以全面负责信息技术和系统,加强政府部门的数据资源管理。同时,新加坡开始聘用全球IT业及咨询业专家作为政府信息技术顾问。例如,2014年新加坡聘请了埃森哲公司的首席数据分析师作为政府首席架构师,为大数据处理分析系统的技术路线提供总体规划和架构设计,推动政府数据智能化应用。

四是创新研发应用模式。为了激发大数据研发创新活力,新加坡政府很早便开始利用开源平台模式构建大数据分析系统的创新平台。例如,将大规模建设网络平台——RAHS平台对社会开放,高校、科研机构和其他社会组织均可依托RAHS平台进行二次开发,实现平台价值最大化。此外,为了鼓励公众使用政府数据,新加坡政府对数据进行可视化处理,开发了100多个App应用,体现了其高效创新的政府服务理念。