摘要

随着大数据技术的不断发展,以及其军事应用优势的日益显现,以大数据为关键基础,智能决策、智能行动赋能全新作战样式、指挥模式和战争形态的时代即将到来。基于此,研究了美军出台的一系列军事大数据发展战略,分析了美军大力推动大数据建设的主要需求,梳理了美军加速推动大数据建设的主要途径和实施方法,阐述了美军军事大数据的安全体系及关键技术,总结了美军大数据的发展趋势,最后提出了大数据发展的建议。

随着以网络化、数字化、智能化为主要特征的新信息技术的更迭,数据正全面融入现代军事领域,成为军事战场制胜的重要资源、军事科研的驱动力量和军队管理的核心要素。美军认为数据能够提升军事作战指挥和行动的效率,通过快速、高效地采集并利用军事大数据,以达到缩短决策周期、形成信息优势、增强联合作战的效果。

目前美军处于全球信息技术发展的领先地位,为了继续扩大其军事领域技术优势,发布了《国防部数据战略》等一系列规划和文件,引导军方和政府加大投资力度,启动一系列军事大数据项目,调动全社会优势资源开展大数据前沿技术研发与应用,意图获取以数据为中心的全方位军事优势,抢占未来数字化、智能化战争的先机。

一 美军大数据发展战略

美国政府和军方敏锐地洞察到大数据技术的重要性,在 2012 年 3 月发布了《大数据研究与发展计划倡议》,这是全球首个国家层面的大数据战略[1],将大数据从商业行为上升到国家意志层面。该计划投资 2 亿美元,以推动数据发现、数据存储、数据抽取、数据共享和数据分析等大数据领域内相关技术的创新和关键工具的开发。旨在加快大数据在科学和工程领域的创新步伐,推动和完善与大数据相关的采集、组织和分析工具及技术,提升从大量而复杂的大数据集合中萃取关键信息的能力,并应用于美国相关部门和军事基地的信息系统中,以强化美国国家安全,意图凭借其先进的信息技术,获取世界信息霸权,持续扩大与其他国家之间的信息化差距。

为加速《大数据研究与发展计划倡议》的实施进程,2016 年 5 月 23 日,美国政府发布了旨在构建大数据驱动战略体系的《联邦大数据研发战略计划》。通过该计划形成以大数据技术为基础的数据采集、知识提取、共享交换、分析处理以及知识发现和辅助决策的能力,从而激发联邦机构和整个国家的新潜能,以实现加速大数据领域的科学发现和创新进程的目的。美国大数据战略的首要目标是提高竞争力,基于此目标,《联邦大数据研发战略计划》在该顶层战略中规划设计了以下几点:

(1)大数据技术和应用的创新战略;(2)提升计算能力;(3)提高数据可信度;(4)保护隐私;(5)加强基础设施建设;(6)人才培养;(7)跨机构协作等支撑性内容。美军通过《联邦大数据研发战略计划》已将大数据技术应用到赛博领域,以及指挥控制、情报侦察、后勤支撑等领域。美国国防部及其下属美国国防部高级研究计划 局(Defense Advanced Research Projects Agency,DARPA)开展的典型大数据项目有 8 个,即多尺度异常检测(Anomaly Detection at Multiple Scales,ADAMS)、洞察力项目(Insight)、心灵之眼项目(Mind’s Eye)、影像检索和分析项目(Video and Image Retrieval and Analysis Tool)、机器读取项目(Machine Reading)、X-DATA 项目、美军智能分析之非传统信号处理项目(UPSIDE)、数据到决策项目(Data to Decisions)。基于大数据技术在作战中的应用,美军军事战略正在从“以网络为中心”向“以数据为中心”转变,也预示着大数据已逐步成为智能化装备的重要技术基础,成为打赢未来智能化战争和提升国防管理决策质量效率的重要引擎 。

2019 年 7 月,美国国防部发布了《国防部数字现代化战略》。战略介绍的网络安全措施包括企业边界保护、企业端点安全、移动终端(Endpoint)安全、中继(Midpoint)安全、数据安全、大数据平台(Big Data Platform,BDP)、身份、凭证与访问管理(Identity and Access Management,ICAM)和加密现代化等 8 类,BDP 是其中很重要的一个组成部分。

二  美军大数据建设

美军为了牢牢抓住数据发展的战略机遇,出台了一系列军事数据战略规划,启动了多个大数据建设项目,谋求以“数据中心战”为目标的快速转型,意图获得数据发展领先优势 。

2.1 标准进展

为 支 撑 大 数 据 建 设 发 展, 美 国 国 家 标 准 与技 术 研 究 院(National Institute of Standards and Technology,NIST)于 2012 年启动了大数据相关标准研究,并于 2013 年成立了 NIST 大数据公共工作组(Big Data Public Working Group,NBG-PWG),对所有相关方开放,旨在通过结合行业、高校和政府等各方力量加速对大数据技术甚至大数据产业的接纳和应用。NIST 发布的大数据标准如表 1 所示。

表 1 大数据标准

2.2 重点项目

2.2.1 联合信息环境

2011 年,美军提出和实施了联合信息环境(Joint Information Environment,JIE),标志着信息化建设重心从“以网络为中心”转变为“以数据为中心”。JIE 的建设目标为统一数据,通过建立核心数据中心,将重要信息汇总作为共用资源提供给美军各军和各级机构。

JIE 在计算部分主要依托云平台,在保障用户得到具有鲁棒性和容错性的计算能力的同时,支撑联合区域安全栈和数据中心。数据部分主要依托核心数据中心(Core Data Center,CDC),在数据策略管控下,按需向用户提供数据与服务。

如图 1 所示,JIE 中不同的作战层级对应不同的数据中心,数据中心分为以下 4 个层级:(1)CDC:主要运行于各大战区总部和美国本土,能够依托统一安全架构提供标准化的承载和存储服务。(2)设施处理节点(Facility Processing Node,IPN):主要设置于独立性的局部区域和国防部设施。(3) 特 种 用 途 处 理 节 点(Purpose Processing Node,SPPN):主要用于保障特种用途的相关功能;(4)战术处理节点(Tactical processing node,TPN):主要是指能够进行优化调整,适应战术环境或者部署任务环境的节点。

CDC 的合并措施:(1)集中管理服务器;(2)分为 3 类整合;(3)采用云计算技术;(4)采用虚拟化技术;(5)构建企业数据中心;(6)暂停新投资,依托现有基础增强服务。

通过合并 CDC,首先可以提高和优化数据中心的使用效益,提高系统效率;其次通过合并 CDC,能使得系统攻击面减少,安全性增强,并能够推行统一的安全架构;最后能够降低成本,统一信息技术(Information Technology,IT)投资,实现一致性的 IT 体系结构。

图 1 JIE 逻辑设计

建立 CDC 是整合 JIE 数据中心的一项重要工作,并且 CDC 是一个简化的、标准化的和集中化的信息基础设施联合信息环境,能够随时通过任何授权网络为任何应用程序或服务提供高度可用、快速且安全的服务。各部门将特定的 IT 服务集中化部署到 CDC,并通过云平台交付服务能力,更有效地利用资源。图 2 为数据中心整合优化后的最终状态。

图 2 美军数据中心最终状态

综上所述,美军对原来分散在各个部门的众多数据中心进行了整合,其目的是高效利用资源、标准化信息数据、提高数据和应用服务的可用性,这也是《国防部数字现代化战略》中构建虚拟的单一信息环境工作的组成部分。从长远来看,整合数据中心是美军实施大数据和人工智能计划的需要。

2.2.2 态势感知分析大数据平台项目

2016 年 5 月,国防信息系统局(Defense information Systems Agency,DISA)发布了《大数据平台和赛博态势感知分析能力》报告,提供一整套基于云和大数据平台的解决方案,用于收集国防部信息网上的所有数据,并且提供分析与可视化处理工具以理解数据。其中,BDP 是 DISA 开发的分布式大数据平台,用于支持 PB 级数据的抽取、关联分析和可视化功能。通过部署在 BDP 上的一组分析工具、摄取码和数据结构,提供整个国防部信息网的赛博态势统一感知分析能力。美国防部目前所能实现的最全面、最广泛的国防部信息网的活动视图就是由赛博态势感知分析能力提供,用以增强美国防部网络的整体安全态势的同时支持决策。赛博态势感知分析能力能够提供以下主要功能:

(1)国防部信息网的运营与态势感知功能。该功能能够为系统运营人员提供近实时的态势感知能力以及传输数据流的可感可视,从而快速掌握具体业务情况、数据情况、配置状态、事故状态以及安全状态等态势信息。(2)赛博空间的防御功能。企业计算机网络分析人员根据“指标作战”,采用自动化工作流的方式提取潜在指标并审查,形成网络威胁报告。还能够根据指标,提供相应的警报并自动执行应急响应措施。(3)异常检测功能。异常检测主要是针对可能对国防部敏感数据的完整性、机密性和可用性造成威胁的已验证用户进行检测,并且能根据历史趋势检测到潜在威胁后,向有关部门发出警告。(4)特定数据抽取与分析功能。该项能力能够提高赛博态势感知分析系统快速开发、部署和使用分析工具的效率。该能力主要为运营人员提供找出并分析军事任务相关数据的能力。

2.2.3 海军大数据生态系统项目

2013 年至今,美国海军启动了“海军战术云参考实施”项目。美军希望通过该项目建造大数据云生态系统平台,使得海军的舰载作战系统、传感器和飞行器等产生的大量数据得到充分而有效的利用。为实现该项目,美国海军将采用突破性的大数据分析工具等配套系统,建立面向海军的大数据生态系统。

该系统由数据分析组件和可视化界面提供相关作战环境和情况的所有数据实时视图,主要具有以下 3 大功能:

(1)通用数据基础表征。面向多源异构的海军作战大数据,建立相应的海军作战数据基础体系架构,以用于不同机构间多源异构大数据的表征和共享。(2)分布式数据存储与索引。通过建立索引,在分布式数据库中快速查询存储作战数据。(3)数据作战分析。数据作战分析是该系统的核心。目前,美军主要通过研发先进的大数据采集、分析、处理等工具,实现了多种分布式文件系统和作战系统,支撑反潜作战和一体化防空反导作战,增强威胁评估预警、作战识别、一体化作战和任务计划以及执行等能力,提升海军的作战效能。

综上所述,在大数据时代,数据将会成为影响和决定军事行动的重要力量源泉 。因此,数据搜集、分析和处理能力,以及基于数据作出的决策将会是未来战场上的制胜关键。大数据应用,尤其在联合作战中,可以极大地提高信息掌控优势,从而提升军事情报侦察预警能力和指挥控制能力,有效提高体系对抗水平。

2.3 发展趋势

美军大数据技术的发展趋势主要有两个方面。一方面,是关注数据分析和可视化等关键技术。在大数据领域,美军希望能够凭借关键技术,提升对海量异构数据的分析和处理能力。可以看到,美军在大数据领域的关注重点从获取基础信息转变为分析有价值的数据。美军在信息化发展领域不断强调数据分析技术的核心地位,攻关大数据分析基础理论和技术方法,研发高时效的大数据计算模型、优化技术与系统等。此外,美军大力发展数据可视化技术,将战场可视化作为未来战争信息优势获取的核心技术,敌我位置、战场态势、部署情况及战损、战果等数据信息都能够通过可视化技术及时反馈给指挥员。另一方面,美军扩展了大数据的作战应用范围,通过大数据技术在各领域的广泛应用,美军将在数据采集、存储、管理、分析和共享交换等技术和产品方面实现质的飞跃,进而提升美军战场态势感知、情报分析、智能决策以及安全防护能力,大大缩短决策循环(Decision Loop,OODA)周期和从传感器到射手的反应时间,最终实现“以网络中心”向“以数据为中心”的作战转变。

总之,美军作为世界军事信息化建设的领先代表,正在加速向数据中心化作战转型。

三 美军大数据安全

美军紧盯大数据发展战略机遇,加紧军事数据安全建设,进而谋求以数据为中心的全方位军事优势。

3.1 大数据安全体系结构

美军 JIE 的安全核心是单一安全架构(Single Security Architecture,SSA)及联合区域安全栈(Joint Region Security Stack,JRSS)。SSA 覆 盖 范 围 如图 3 所 示, 包 括 JRSS、 多 协 议 标 签 交 换(MultiProtocol Label Switching,MPLS)、 战 术 处 理 节 点(Tactical Processiong Node,TPN)及军事要地处理节点(Installation Processing Node,IPN)。

从图 3 可以看到,核心数据中心在图的中心,其围绕着传输网络与联合安全栈、各种网关相连。图的左侧是运行中心及态势感知分析云。核心数据中心由企业服务、统一能力、管理系统和非军事区等 5 个要素组成,是联合信息环境的核心。CDC 的顶层架构如图 4 所示。

图 3 JIE 的安全体系架构

图 4 核心数据中心顶层架构

不论是 SSA 还是 JRSS,最终还是围绕核心数据中心提供安全保密能力。从 SSA 采用的技术和架构来看,美军针对军事信息系统网络虚拟化、数据中心化、能力服务化、终端移动化趋势,重点加强了对以数据为中心的安全防护技术的研究,其中数据分类、数据保护和零信任安全技术是重点。通过 JIE 的实施,一方面解决了美军全球化的区域安全接入效率问题,另一方面推动了安全保密向云和大数据等集约化环境的落地。

数据保护是大数据安全的基石。美国作为网络安全产业发展强国,先后颁布了众多的数据安全保护标准规范。其涉及的要素都是围绕数据提供者、数据消费者、数据监管者、数据服务提供者等开展数据安全保护工作,力求将数据保护范围、参与方的权利和义务以及行为准则等要点界定清晰。表 2为美国大数据安全相关标准规范。

表 2 大数据安全标准

3.2 大数据安全关键技术

3.2.1 数据安全标识技术

数据安全标识技术能够保障数据在应用过程的可控性以及存储过程的机密性。为解决数据采集和交换安全,美军使用了数据安全标识技术。

美国国防部早在 2003 年就研制完成了军用消息处理系统,以提供数据流转过程中的安全控制能力,该系统还提供传输和交换指定信息、涉密信息及非涉密信息的功能。军用消息处理系统中安全标识的实现思路为:作为主体的用户有一个知悉权,该知悉权表示该用户可以访问哪个等级的文档。作为客体的文档有一个安全标识,以表示其安全级别,从而实现不同安全级别文档的访问控制。此外,安全标识还包括“类别”属性,“类别”包含主题控制、所属国家等。

后来,该技术增加了新的安全性要求:将一个声明即敏感标识,附加在电子文件中。它是一小段电子编码数据,可用来限制信息访问,确保信息采取合适的传输方式。为实现该安全标识,建立了一个可扩展标记语言(Extens ible Markup Language,XML)安全标识系统的原型——可扩展样式表语言(Extensible Style sheet language,XSL),主要执行两方面任务:一方面根据规范为文件分配安全标识;另一方面通过网关仲裁权限的方式,执行对已标识文件的访问控制。

3.2.2 基于分类分级的数据保护技术

美军数据加密、数据完整性保护和数据分类需求明显,常采用商业现货集成方式实现。

2016 年底,IBM 和美国陆军签订了五年的云服务合同,价值 6 200 万美元。IBM 会为陆军构建基础架构并提供基础架构即服务(Infrastructure as a Servive,IaaS)平台,主要任务是提高其信息基础配置的效率。IBM Security Guardium 是一个完整的数据安全平台,提供了一套完整的能力,比如敏感数据的发现和分类、分级,加密保护,安全性评价,数据和文件活动检测,并通过伪装、阻断、报警和隔离保护敏感数据。Guardium 不仅保护数据库,它还被扩展到保护数据仓库、企业内容管理(Enterprise Content Management,ECM)、文件系统和大数据环境(Hadoop or NoSQL)等。除了安全平台,IBM 架构还提供了云上应用构建的实践。

IBM 的大数据安全架构包括数据保护、数据完整性和数据分类,并且明确指出云计算数据保护解决方案需要考虑数据加密。数据分类是帮助保护关键信息安全的有效方法,在保护敏感信息之前,必须确定和鉴别它的存在 。自动化发现和分类过程,是防止泄漏敏感信息数据保护策略的关键组件。Guardium 不论是在云上还是在数据中心,都可以提供集成的数据分类能力和无缝的方法,来发现、鉴别和保护关键数据。

3.2.3 跨网跨域共享交换技术

美军通过跨网跨域安全共享交换技术,能够提供不同的军事安全域之间自动或者手动传输和访问军事信息的能力。跨网跨域共享交换技术与防火墙技术不同,其功能更加强大,美军的跨域共享交换技术可用于不同密级的网络之间;而防火墙仅支持一个密级网络之间交换数据。跨域共享交换技术分为 3 类:一是传输类,能够在不同军事安全域中运行网络或信息系统,并将之联系在一起,实现不同安全域间的信息传输;二是访问类,能够凭借单个工作站提供多个不同安全域信息的可视化能力和可操作能力,而各个军事安全域之间无须进行任何数据的交互和传输;三是多级类,能够对不同安全级别和不同安全域的信息进行处理、分析或存储,并且基于用户的许可和授权能够允许该信息被其他用户访问或重新标记。美军的跨域交换技术采用了多独立级别安全(Multiple Independent Levels of Security,MILS)和多级安全(Multi-LevelSecurity,MLS) 这 两 种 安 全 理 论 架 构。MILS 架构能够提供进程隔离和内核隔离两种类型的隔离手段。MLS 架构则使用强制访问控制(Mandatory Access Control,MAC)模式和可信标签,在验证修改权限和读取权限时,根据标签和用户的凭据及权限进行区分。

3.2.4 基于区块链的高敏数据保护技术

在探索如何将区块链技术应用于军事领域上, 美 军 走 在 前 面, 美 国 航 空 航 天 局(National Aeronautics and Space Administration,NASA)、DARPA、NIST、 美 国 国 防 信 息 系 统 局(Defense Information Systems Agency,DISA)等军方科研机构开展了多项关于区块链技术的研究和应用尝试。基于区块链技术,可以永久记录动态的数据库,并实时记录保护系统中各个组件的配置变更状态,并在安全的数据库中持续实时地监控和跟踪,从而保护了数据的安全性。不论在何时,非法修改了何种配置,几乎都能够被基于区块链的安全防护系统实时检测并报警,以有效抵御非法入侵分子。同时,凭借分布在多个设备之间的网络日志系统,可以最小化系统受到攻击的安全风险。在核武器、卫星、指控系统等关键设施中使用这种实时跟踪并报警的功能,对保护指挥信息、控制信息和命令信息等的完整性至关重要。

2021 年,DISA 的新兴技术(Emerging Techno logies,EM)部门向工业界寻求一种解决方案,主要解决如何基于区块链技术保护高敏感数据的问题,并且希望该方案能够确保关键数据在其整个生命周期内保持完整性和不可篡改性,并在数据以任何方式被篡改时提供报警机制。他们寻找到了一种以去中心化和分布式方式维护关键数据的最佳实践办法。同时也找到了一种场景示例,该场景主要是采用区块链技术进行探测并报警。该场景设定为,非授权用户执行恶意活动引起网络入侵,各种记录的活动会被系统后台跟踪,此时,通过区块链,能够持续安全地保存这些日志,使日志不受影响。此外,能够采用分布式账本技术(Distributed Ledger Technology,DLT),以分布式的方式和去中心化的方式共享或复制相应的数据。若网络入侵者试图凭借任意方式掩盖自己的踪迹,如增加、删除或修改存储信息,系统将探测到相关行为并自动生成警报。

四 大数据发展建议

为推进新时代大数据建设工作,有以下 3 点建议:一是开展数据基础问题研究,打造大数据理论体系。开展数据基础理论和应用理论研究,发挥数据驱动作用,加强数据融合共享,打破数据孤岛。在数据感知与融合数据分析研判、数据全生命周期安全、数据可视化等关键技术上下功夫。重点开展大数据需求体系、大数据战略体系、大数据体系、大数据技术体系、大数据标准规范体系及管理规章制度研究,形成具有本土特色的大数据理论体系。

二是重视大数据安全建设,保障数据能用、敢用、好用。制定大数据安全管理标准规范,创新大数据安全技术,加强物理安全防护等,通过建立精细化数据管理权限策略,部署端到端身份认证设备,定期评估数据安全状态,核准数据使用记录、研究数据意外发布与披露防控技术、形成授权管控和数据应用全面审计等系列措施,在最大限度利用数据的基础上,提升大数据安全防护的规范性、可操作性和有效性。形成物防、人防和技防等相结合的组合拳,加强数据应用全要素和全领域的安全防护工作。

三是加强大数据人才培养,打造精通数据分析知识和国防业务的复合型人才队伍。为相关部门技术人员提供数据分析、处理与应用的专业技能培训,并建立数据专家与业务专家的高效互动生态环境。与民用领域大数据技术研究优势院校和研究机构合作,培养数据分析、机器学习、数据安全等“数业俱精”的复合型数据人才,提升大数据团队能力水平。

五 结 语

本文阐述了美军发展战略和美国大数据相关标准进展,梳理了大数据重点项目,总结了美军大数据安全体系及大数据安全关键技术,最后给出了大数据发展建议。