6G移动通信网络将通信的领域边界从物理世界进一步拓展至数字世界,通过在物理世界和数字世界之间提供即时、高效和智能的超连接来重塑世界,这一趋势将开启移动通信的新篇章。6G网络超大规模的全局性连接将给网络的运营和管理带来巨大挑战,亟待革命性的理论和技术创新。

中国工程院张平院士研究团队在中国工程院院刊《Engineering》2022年第1期发表《迈向6G智简网络——基于语义通信的网络新范式》一文,提出了6G“智简”网络。文章首先提出了全新的语义表征框架模型,即语义基,进而构建了面向“智简”6G的“一面-三层”智能高效语义通信网络架构。该网络架构通过语义智能平面以及基于语义基表征的语义信息流,将语义赋能的物理承载层、网络协议层和应用意图层相互连接,使网络具备更低的带宽需求、更低的冗余度、更准确的通信意图识别等能力。IE-SC网络架构赋能人工智能和通信网络技术的一体化,实现6G网络中多种通信对象间的智能信息交互。此外,文章还简要介绍了语义通信的新进展,指出了语义通信的潜在应用方向、开放性问题与挑战。

一、引言

人类社会正在经历第四次工业革命,其推动力主要源于万物数字化、信息通信技术(ICT)以及人工智能(AI)技术等的融合创新。其中,信息通信技术在人类社会迈向数字智能新阶段的演进中发挥着至关重要的作用。第五代(the fifth generation, 5G)移动通信网络通过有机融合泛在的通信、计算和控制(ubiquitous communication, computing, and control, UC3)能力,为人、机、物的互联开辟了全新范式。第六代(the sixth generation, 6G)移动通信网络将通信的领域边界从物理世界进一步拓展至数字世界,通过在物理世界和数字世界之间提供即时、高效和智能的超连接来重塑世界,这一趋势将开启移动通信的新篇章。

最近,关于6G的研究已逐步展开,主要聚焦在新型网络架构和关键技术。我们之前提出了Ubiquitous-X 6G网络框架,并指出6G网络中的超大规模连接数目和跨越物理世界和数字世界的超连接需求会给网络运营和管理带来巨大的挑战。Ubiquitous-X 6G网络框架在传统的人-机-物通信网络架构基础上,引入了一种全新的通信对象“灵”(genie)来连接物理世界和数字世界。作为物理世界通信对象的强大智能助理,“灵”可以准确地识别物理通信对象的通信意图,并基于知识经验和交互场景协助完成复杂的信息处理过程。此外,通过整合提取有价值的信息,“灵”可以实现通信对象间高效且直接面向意图的交互。表1列出了各类通信对象的特点。

表1 人-机-物-灵架构——融合物理和数字世界

API: application programming interface.

Ubiquitous-X 6G网络的发展仍然面临一些挑战,例如,连接数量爆炸性增长、传统分层网络协议灵活性降低、具有差异化服务需求的新兴应用不断涌现等。举例而言,考虑多个通信智能体通过交互和协作完成特定任务的场景,智能体之间需要展开实时的感知数据交换、信息融合和协作决策,涉及复杂的交互。其中,海量连接间的大规模数据交换可能导致网络复杂度的迅速提升,信令成本和协议开销方面急速增长。为了应对上述挑战,我们期望通信智能体可以充分利用智能来识别与任务相关的关键信息并展开针对性处理,从而使智能体之间的交互变得简约而高效。如图1所示,4类通信对象间基于语义通信实现智能互连,通过传输关键的语义元素提高了传统基于0~1比特流的交互效率;在这个过程中,通信对象具有相关背景知识和场景觉知能力,可以根据通信意图提取语义元素,以此提高传输效率。

图1. 面向智能连接的人、机、物、灵语义互连

关于语义通信的研究,已有相当数量的文献报道过。自1948年克劳德·艾尔伍德·香农的开创性工作发表,70多年以来,通信信道的香农极限一直在通信系统设计中发挥着指导作用。近年来,具备语义觉知能力的智能通信新技术不断涌现。例如,基于自然语言处理(natural language processing, NLP)和计算机视觉的最新进展,有学者提出了语义增强的物理层编码策略和端到端的语义传输方案,提升了多种类型信源信息的传输质量。在媒体访问控制/链路/网络等协议层中,通过引入语义过滤机制可以减少面向特定任务的分层协议冗余。在应用层中,基于语义的用户意图识别可以实现网络配置的自动化和网络管理的精简化。从现有文献报道中可见,基于人工智能、具备语义觉知能力的通信技术在网络的各个协议层中均取得了一定的进展,但智能语义通信尚缺乏系统的框架性设计。因此,亟需构建一个内嵌语义智能(semantic intelligence, SI)并贯穿至各协议层的新型语义通信架构。

基于上述讨论,为了迈向“智慧演化和原生简约”的“智简”网络(wisdom-evolutionary and primitive-concise Network, WePCN),我们引入了一个智能高效的语义通信(IE-SC)网络架构以提高网络的智能水平,使网络变得更加高效和简约。传统的网络设计理念主要是通过资源堆叠来提升网络能力,如更多的频谱资源及计算资源、更密集的接入点和更大规模的天线等。这种堆叠式网络性能提升的代价是网络复杂度的极速提高。与传统设计理念不同,我们期望通过源于网络原生智慧累积的简约通信来提升网络能力。具体而言,IE-SC架构的核心是SI平面,它实现了语义环境表征、背景知识管理、语义推理和决策等。此外,我们设计了三个语义赋能的全新抽象协议层——语义赋能的物理承载(semantic-empowered physical-bearing, S-PB)层、语义赋能的网络协议(semantic-empowered network protocol, S-NP)层和语义赋能的应用意图(semantic-empowered application-intent, S-AI)层,它们能够重塑现有的网络协议层。SI平面通过语义信息流(semantic information flow , S-IF)协调这三个语义协议层,其中S-IF承载着应用意图和语义信息在全网流转。在收到S-IF后,S-NP层可以编排与意图相关的语义,产生灵活而简约的协议。S-PB层采用合适的语义-语法联合编码策略来承接S-NP层,提高物理资源利用率及意图达成效率。通过IE-SC架构,Ubiquitous-X 6G网络所面临的高复杂度问题有望得到解决。不仅如此,IE-SC架构还有望全面提升网络能力以实现WePCN愿景——构建有序、高效、智能的Ubiquitous-X网络以支持未来应用和服务。

本文的组织结构如下:第2节讨论语义信息和通信的相关工作;第3节介绍IE-SC框架和S-PB层的技术内容以及初步的仿真结果,同时构思了S-NP层和S-AI层的概念和设计;第4节进一步介绍IE-SC的三个潜在应用场景;第5节指出一系列未来研究挑战及思路;第6节给出本文的结论。

二、语义信息和语义通信的研究进展

语义信息的概念自提出以来一直在不断发展和完善。语义通信的早期工作主要基于香农概率信息论发展而来,以信息熵为基础,辅以逻辑推论与模糊转换。近年来,随着人工智能技术与应用的繁荣发展,语义通信呈现出新的发展契机。在本节中,我们将简要回顾语义信息概念的发展历程和语义通信技术的研究进展。

(一)语义信息

语义信息论的发展大致分为两个主要阶段。经典语义信息论起源于前香农时代,主要与信息度量以及针对自然语言的分析相关;现代语义信息论主要兴起于最近十年,在语义信息的本质方面进行了更深入的思考与探索。

1. 经典语义信息论

语义学的概念最初是由Morris提出的,他在符号论(theory of signs)中提出了符号的语法-语义-语用三元概念。Weaver提出了通信的三个层级,即语法、语义与语用通信,并对三层通信各自的特征进行了阐释。Carnap与Bar-Hillel从命题逻辑的角度对语义信息论进行了概述,并基于概率的方法尝试对语义信息量进行度量。Barwise与Perry将语义信息论扩展到情景逻辑领域,Floridi解决了矛盾信息的语义无法被正确度量的问题,D'Alfonso基于真理相似性(truth-likeness)概念量化语义信息,扩展了语义信息概念的应用范围。

2. 现代语义信息论

在近十年中,语义信息论的概念发展超越了Carnap所提出的框架。Zhong提出一种语义信息理论,指出语义-语法-语用信息的三位一体性,并证明了语义信息具备唯一表征信息三位一体的能力。Kolchinsky和Wolpert将语义信息定义为描述系统与其所处环境之间关系的语法信息,从物理角度看,语义信息对系统的持续存在有因果作用。Kountouris与Pappas对通信系统不同层次的语义信息给出了一个多粒度的定义,并使用Rényi熵对语义信息进行度量。Juang等指出语义觉知能力的缺乏导致了当前通信系统的诸多局限,并进一步指出人工智能可以促进语义信息技术的发展。基于上述工作可知,现代语义信息理论对语义信息概念展开了更全面的描述,展示了在人工智能技术的赋能下,语义通信系统发展的巨大潜力。

(二)语义通信

语义通信的核心是确保成功传递信息的意义。由于语义信息的概念宽泛,具体的语义通信技术往往涉及通信网络中多个协议层的联合设计。下文中将会简要介绍相关工作的进展。

1. 基于语义的物理层传输

在香农提出的经典通信模型中,信源编码与信道编码的目的是使接收方能够准确恢复语法信息,即确保信源符号的传输准确性。相比之下,语义通信旨在准确地传输与重建语义信息,其关注点是符号之上的信息内涵,因此语义通信系统的编码模块具备新的结构特征。现有工作在一些代表性场景中证实:引入语义编码和译码可以提高物理层的传输效率。由于语义通信理论仍缺乏全面、统一的数学表述,现有的语义编码和译码模块主要是基于无模型(model-free)的机器学习方法来实现。这些基于机器学习的解决方案可以大致分为两类:模块化设计与一体化设计。模块化设计将语义编码和译码作为独立模块引入现有通信系统,语义编码和译码模块实现了语法和语义信息之间的相互转换,提升了文本、语音、图像传输的效率。例如,文献[4]将基于上下文的译码器整合到传统通信系统中,以减少文本的译码开销。文献[20]使用长短期记忆(long short-term memory, LSTM)网络提取文本含义以实现语义编/译码,从而提高了文本传输的性能。一体化设计采用基于语义增强的信源-信道联合编码思路,语义编/译码模块与信源-信道编码模块联合设计,实现端到端传输优化。在文献[21]中作者提出了一个端到端语义通信架构,将语义推理与物理层通信结合,从而实现语义层面的纠错。在文献中作者提出了一种基于自编码器架构的信源-信道联合编码方法,利用卷积神经网络取代传统的信源-信道编码模块,取得了良好的性能。文献[5-6]提出了轻量型语义通信系统,该系统将信源-信道联合编码与剪枝策略相结合,实现了物联网(IoT)网络中高效的图像/文本传输与分类。有研究者提出了用于文本/语音传输的端到端语义通信方法,在典型信道条件下表现出显著的性能改善。

2. 具备应用觉知能力的通信协议

现有底层通信协议为支持上层不同类型的应用而设计,所承载的功能相对宽泛,而与单一具体应用不直接相关。近年来出现了一些具备应用觉知能力的新协议设计,能减少物理层资源消耗,提高了通信目标达成的效率。这些新协议大多采用了跨层协议设计思路。例如,文献[24]和[25]分别提出了高效的路由协议来解决无人机自组网与车辆自组网中高移动性和动态拓扑变化的挑战;作者通过跨层协议设计,将底层协议中的关键信息直接整合到路由协议设计中,以减少端到端的时延。文献[7]提出了具备应用觉知的跨层协议框架并设计了语义过滤机制,以支持灵活的协议功能融合,减少冗余度。具备应用觉知能力的协议设计体系还可应用于多智能体间通信(multi-agent communication),这为未来智能移动通信网络的新型协议设计提供了启示。例如,Sukhbaatar等提出了一种基于机器学习的多智能体通信方案,该方案采用神经网络自主决策的交互策略。这种“拟人”(human-like)通信协议可视为智能体的自主通信协议雏形,可以有效减少物理层资源开销。

3. 基于语义的意图驱动网络

目前的网络管理和控制策略尚不能自主辨识用户的业务意图并迅速生成网络以满足用户细粒度的体验要求。语义相关技术是实现意图驱动智能网络的关键,网络利用语义智能可以辨识用户意图,确保意图在网络中贯彻实施。具体而言,得益于人工智能和自然语言处理领域的发展,精准的意图识别和理解已成为可能。例如,文献[8,27]提出了一系列上下文口语理解的方法,可以通过捕捉语境语义来同时识别意图和有用信息槽。文献[28]提出了基于意图的云服务管理框架,可以理解用户自然语言所包含的意图并将其翻译成网络的资源管理指令语言。文献[29]综述了意图驱动网络的新架构和相关赋能技术,指出通过特定领域的语言和与之适配的人机接口可以捕获用户的应用意图。上述研究表明,设计并实施语义赋能的意图驱动网络具有巨大的潜力,发展先进的语义信息处理技术将有助实现一般场景下准确的意图识别、分解和表征。更进一步,意图驱动的设计应在网络协议层中全面贯彻,将所有意图相关元素有机结合,形成完整而敏捷的意图驱动网络。

三、IE-SC架构

当前在语义信息理论和通信技术方面的进展相对分散,在不同网络层中的语义应用研究相对独立,缺乏系统化的设计。在本节中,我们将进一步深化Ubiquitous-X 6G的技术内涵,提出其向WePCN演进的IE-SC网络架构。对此,首先构思出语义基(Seb)概念并提出语义智能增强的Ubiquitous-X 6G新架构。之后,在新架构中引入了先进的语义通信和信息处理技术、基础设施和模块,增强网络能力并重新定义网络协议层。最后,为Ubiquitous-X 6G中各种通信对象引入了智能通信的新机制。

(一)语义基

香农经典信息理论提出了“Bit”的概念,它不仅仅是一个信息度量单位,更代表着一个关于信息熵的表征和度量框架。根据这一观点,我们提出了“Seb”的概念,作为语义信息的一个表征框架。Seb提供了一种模块化和高度抽象化的方法来表示语义信息,从而使语义通信更加有效。在图2中,通过类比建造建筑物的过程,可更直观地阐明Seb和Bit之间的区别。可以视信源发送的消息为建筑的外形,而通信系统利用其预先定义的信息表征框架来实现信息传递。可将传统的通信系统比拟为在接收机处以逐砖垒砌的方式建造建筑物或恢复信息;将Bit视为砖,给出了原始信息的细粒度精确表示。相比之下,语义通信系统使用Seb,这类似于使用预制板/集成窗或门来重构建筑或信息。在Seb表征框架或材料构成仓库支持下,信息重构或建筑过程是高度集成的。因此,当收发端具备材料仓库和建筑结构/分解类似的共同知识时,信息传递的效率有望得到大大提升。

图2. 传统通信系统和语义通信系统的表征方式对比

Seb为描述复杂的语义信息提供了新的视角,能更好地刻画信息的应用意图和不同模态。从抽象的角度来看,Seb可以作为一个信息表征框架,它能够提取多模态信息的语义特征,并经由多层次的变换最终映射到语义基中的语义元素。具体来说,Seb可以包含与用户意图相关的背景知识、意图-知识的映射机制、语义元素的提取和表达;Seb的输入可以是通信的意图,其输出可以是承载意图相关的语义元素的比特序列。在Seb中与意图相关的背景知识可以是具体的知识图谱或其他有结构组织的知识表示。以知识图谱为例,每个顶点代表一个语义元素,每条边代表两个语义元素之间的关联关系。语义元素的提取意味着在知识图谱中找寻与意图达成过程相对应的所有可能路径。最后,语义元素可以由恰当的比特序列来表示,该序列可以唯一地辨识面向意图的语义信息。

此外,与Bit具备信息表征和度量的能力相似,Seb也可进一步发展为语义信息度量的框架。Seb有望将基于Bit的信息度量框架囊括其中,额外提供针对语义信息的多视角度量。例如,当从信息的物理模态或语法角度看时,Seb可以度量携带信息所需的比特数;当从信息的应用意图或语义角度看时,可以从Seb中获得对应的语义元素。因此,Seb可望成为一个包容信息多模态和多角度特征的表征及度量框架。当然,Seb的基本原理和机制还需要进一步研究,这在未来的工作中是有重要意义的。

(二)IE-SC架构

1. 架构设计

本小节将详细阐述所提出的IE-SC架构。如图3所示,IE-SC架构具有“一面-三层”的结构。其中,SI负责语义表征、知识管理、语义决策和推理等功能,统领协调以下三个语义赋能的抽象协议层:

· S-AI层,辨识和分解用户的意图;

· S-NP层,实现语义赋能的智能网络交互协议;

· S-PB层,实现语义赋能的物理层信息传输。

图3. 智能语义通信赋能的Ubiquitous-X 6G框架,其中包括SI平面,S-AI层、S-NP层和S-PB层,以及S-IF

S-IF是环境信息和网络内部信息的高层抽象表示,其中环境信息包括物理环境、频谱环境、电磁环境等方面的信息,网络内部信息包括网络层信息、决策信息和其他相关的智能信息。SI平面和三个语义赋能的抽象协议层通过一系列S-IF相互作用。表2给出了IE-SC架构和传统语法通信架构的简要比较。值得指出的是,现有网络的瓶颈主要源于通信链路和数据的爆炸式增长,IE-SC为解决这一挑战提供了新的途径。为了提升网络的信息传输效率、管控效率和意图达成效率,IE-SC架构需要修改、增强或替换现有网络中的相关网元或模块。未来,随着语义通信专用芯片及硬件模组的技术发展,通信收发端将具备语义意识及语义通信能力,可望在保障通信意图达成的同时有效减少传输数据比特开销,显著提高通信效率。 

表2 语义通信架构和语法通信架构对比 

2. SI平面

SI平面贯穿了IE-SC网络架构中的所有层,具有以下主要功能:

(1)语义环境表征。通过过滤和语义提取处理内部和外部环境信息;环境信息在SI平面进行汇聚,经过语义分类后,形成环境表征。随后,语义信息被嵌入到S-IF中,并经SI平面和不同层的接口在网络中流动。

(2)背景知识管理。网元和协议层中的背景知识,如上下文知识和环境信息等,会影响S-AI、S-NP和S-PB层的性能;因此,SI平面需负责协调背景知识交换。具体而言,SI平面可以在语义提取后对知识进行分类、整合和存储,再通过S-IF分享知识。

(3)语义决策和推理。SI平面能够评估网络性能并综合用户的不同意图。具体而言,S-AI层通过S-IF将分解后的用户意图反馈给SI平面。然后,SI平面综合这些意图和网络功能以评估网络可达的性能,据此展开网络各层运转的决策。最后,这些决策信息被传送到控制平面,以实现意图驱动的语义信息传输和网络管理。

3. S-PB层

语义通信的目的与传统数据通信不同,语义通信旨在传递信息的含义,为了实现这一目标,S-PB层需要用物理信号承载来自上层的语义信息。S-PB层主要包含下列模块:

(1)语义编/译码。根据模块化设计方法,信息的编码和译码过程是在语义层面实现的,与系统中的其他模块(如信道编码)无关。

(2)语义觉知的信源-信道联合编/译码。根据联合设计方法,信源编/译码和信道编/译码可以联合设计以支持语义编/译码。

(3)信道信息的语义提取/利用。提取和整合信道状态/语义信息,如衰落、干扰和信噪比(SNR)等,促进语义信息的传输。

语义通信链路架构如图4所示。值得注意的是,信源和信宿的背景知识可能普遍不同;因此,信宿可能会以不同的方式理解信源提取的语义信息,这是语义通信面临的潜在挑战。接下来,将讨论S-PB层中语义通信的三个案例,其中假设信源-信宿背景知识完全同步。我们还将结合案例讨论语义编/译码和语义觉知的信源-信道联合编/译码的具体解决方案。我们主要考虑数据驱动的方法,模型驱动的语义编/译码和语义觉知的信源-信道联合编/译码留待今后研究。

图4. S-PB层中的语义通信

案例1:基于上下文的文本语义编/译码方法

参考图4,采用模块化思想设计了基于上下文的语义编/译码方法,通过词性标记、计算语义相似性和对上下文建模,构建收发端的背景知识辅助传输。该方法不仅考虑了每个单词的概率分布,还将不同词性的词(如名词、动词等)分配给同一码字,以此减少传输比特数。译码则根据上下文信息来区分具有相同编码码字但语义相差较大的单词。以谷歌的Brown语料库为例,编码过程可以描述为4个步骤。

在基于上下文的译码方法中,序列s可表示为(s1,s2,...,sn ),,其中是序列s的长度。以马尔可夫链对序列s做概率建模,以状态转换概率描述上下文间关系。译码过程就是在s的候选集中找到出现概率最大的序列。采用N-gram模型和动态规划算法来求解,其中S是包含s候选项的集合,是上下文窗口的大小。利用连续词袋模型(CBOW)来提取与相关的上下文语境,其中涉及提取上下文特征的特征窗口大小,用f进行表示。将CBOW与LSTM相结合来提取上下文特征,进一步提高了译码性能。

图5(a)显示,对比标准Huffman编码,基于词性的语义编码可以达到更短的动态平均码长。这表明所提出的编码方法可减少传输比特数。在图5(b)中,当特征窗口的大小f为4时,用于评价发送信息和恢复信息间语义相似度的4个评价分值都随上下文窗口大小N的增大而提升。此外,当N不小于f时,基于上下文的译码方法可得到较高的语义相似度分值。

图5. (a)动态平均码字长度;(b)语义相似度得分,特征窗口大小f为4。METEOR:针对具有明确排序翻译的评估指标;word2vec:word to vector,词向量

案例2:工业场景下图像信源的语义编码

在本案例中,我们提出了针对特定工业场景的语义图像编码方案。如图6所示,输入图像x先被语义信源编码器gE (xθE )压缩为语义向量w。这里θE 为信源编码器gE (·)的参数集。然后,语义向量w 被量化为ŵ

 后进行编码调制,产生用于传输的数字调制符号。信道译码器和语义信源译码器用参数为θG 的函数gG (ŵ 

θG ) 表示。在接收端,经过解调、信道译码后,恢复的语义特征被语义编码器用于重建图像。信源编码器/译码器的参数优化目标为

其中,H (· )表示香农熵,d ( · )是失真函数,Q(· )是均匀量化函数,E x( · )表示求的期望。我们使用一个超参数λ > 0 对失真和信息熵进行权衡。常用的失真度量有时并不能准确地描述人类的语义/感知失真。因此,除了使用均方误差(MSE)来度量语法失真外,我们还使用一个预训练的鉴别器来学习语义失真,其失真损失被定义为, 其中α 和β 是平衡两种不同失真的影响因子,gD ( ; θD ) 是一个鉴别器,其参数为θD。这个鉴别器与编码器gE (xθE )一起形成了一个生成对抗网络(GAN)结构。

图6. 面向工业图像的语义编/译码神经网络。:输入图像;语义向量;量化后的;重建后的图像;LDPC:low density parity check code,低密度奇偶校验码;LeakyReLu:leaky rectified linear unit,带泄露线性整流函数;Conv:convolution,卷积;Decov:deconvolution,反卷积

模型的训练集由大量从传感器采集的图像构成。该模型在分辨率为256 × 256的图像上进行训练,用分辨率为1920 × 1080的图像进行细调(分辨率表示图像具有h像素高度和w像素宽度)。模型参数的更新采用Adam优化器,学习率为0.0002,共500 000次迭代。表3给出了详细的仿真配置。

表3 工业场景下图像语义编码的仿真配置 

fps: frame per second; dB: decibel; AWGNC: additive white Guassian noise channel; LDPC: low density parity check code; Mbps: megabit per second; LPIPS: learned perceptual image patch similarity.

为公平比较,在仿真中将H.264编码设为逐帧编码模式。由于峰值信噪比(PSNR)或结构相似性(SSIM)等像素化指标有时与人类的视觉感知相差甚远,因此采用LPIPS(Learned Perceptual Image Patch Similarity,学习感知图像块相似度)指标[35]对图像的失真进行评估,其中LPIPS损失越低代表图像质量越高。图7展示了一组工业场景下的仿真结果,体现了所提语义图像传输方法在特定工业场景中的优势。对于通用场景及更一般的图像信源的编码传输,我们将进一步展开研究。

图7. (a)原始图像(i)、语义编码方法(ii)和H.264编码(iii)的视觉比较。(b)带有差错传播的原始图像(i)、语义编码方法(ii)和H.264编码(iii)的视觉比较 

案例3:基于深度学习的端到端语义编码/解码

与模块化设计不同,一体化设计思路中信源编码和信道编码可以由神经网络联合设计、表征。在这种情况下,语义收发端可视为一个端到端通信系统。如图4中的虚线框所示,其中典型的通信模块被融为一体,用于表示和传输语义信息。最近有学者提出了深度学习赋能的语义通信系统(DeepSC)及其变体L-DeepSC、DeepSC-S,分别用于文本和语音传输。语义发送端直接将信源信息映射为传输符号,该发送端由语义编码器和信道编码器组成,均由神经网络实现。在接收端,含噪信息由语义接收端恢复。具体地,可利用Transformer提取语义信息,信道编码功能则由一个全连接层实现。

以文本为例,神经网络的输入是一个句子;将训练整个神经网络的总损失函数定义为交叉熵(CE)与估计互信息(MI)的加权和,如此设计有助于恢复所传语句的语义并使通信速率尽可能大。此外,在训练阶段利用去噪神经网络来展开信道状态信息估计。由于发送端直接将原始语句映射到发送符号上,神经网络学习得到的星座图将有别于传统的规则稀疏星座图,可能给硬件实现带来额外的负担。针对该问题,受网络量化方法启发,可以对训练好的模型进行量化,进而压缩学习得到的星座点。压缩后的星座点只需要少量比特进行量化且不会降低通信性能。由此,神经网络的规模可被降低,轻量化的语义通信系统能更好地适应物联网场景需求。

图8比较了所提出的DeepSC和以下基准方法的性能,包括:①传统通信链路,其中信源编码、信道编码、调制分别采用Huffman编码、(5,7) Reed-Solomon(RS)编码及64正交振幅调制(QAM);②传统通信链路,其中信源编码、信道编码、调制分别采用5-bit定长编码、(7,9)RS编码及64正交振幅调制;③深度学习赋能的信源-信道联合编码。采用双语评估替补(BLEU)得分来衡量句子的相似性,该指标是机器翻译中常用的指标。如图8所示,所提出的DeepSC方法的性能优于基准方法,特别是在低信噪比的情况下性能提升显著。

图8. 在传输符号总数相同时,基准方法和所提出的DeepSC方法在加性白高斯噪声(AWGN)信道下的双语评估替补(BLEU)得分与信噪比之间的关系,其中N-gram (N=1,2,3,4)的结果分别对应1字节片段(a)、2字节片段(b)、3字节片段(c)、

4字节片段(d)。RS:Reed-Solomon,里德-所罗门码;dB:decibel,分贝

4. S-NP层

S-NP层的主要功能是利用智能网络协议有效地服务上层的应用意图。应用意图与通信的目的密切相关。例如,终端和监控器之间进行实时交互的目的是检测异常情况,所以交互的目的是 “告知”异常情况或 “查询”异常参数;再比如,工业网络中的两个设备之间的通信目的是协作完成一项特定的任务,所以交互的目的是 “交换”数据或“确认”相关事实。因此,S-NP层的设计主要集中在语义交互机制和策略上。

具体而言,S-NP层包括以下几个关键模块。

· 语义信息计算:该模块从S-IF中提取意图信息,并从相关模块处获取知识。

·语义协议解析:该模块分析当前协议的可用功能。

· 语义协议形成:该模块优化原始协议或形成一个新的协议以满足应用意图。

·语义信息转换:该模块根据生成的协议对语义信息进行封装或转化。

由于网络的智能性会面向6G不断发展并增强,6G网络中各网元/终端之间的交互协议将产生语义智能。以路由方案为例,SI平面决定了具有高级语义智能的路由策略,可更直接地实现用户业务意图。此外,具有语义智能的路由策略将具有动态性和自主性,不像传统路由方案那样完全由网络管理员预先设定。

多智能体通信的最新进展为未来网络的自主协议提供了新的启发。文献[26]中提出了一个基于深度学习的多智能体通信方案,其中包括基于学习的交互策略。所涉及的智能交互可以视为建立在现有协议层之上的语义应用层协议。针对这个方向,文献[40]提出了目标驱动的参考表达式生成方法,研究了达成应用意图的智能高效交互方案。基于交互式对话线索,智能体利用机器学习模型来生成参考表达式,大大提升了目标达成的效率。文献[40]中的方案为设计“灵”之间以意图为基础的语义交互提供了重要启发。图9概述了上述语义交互方法的思路,包含三个主要步骤。

·复杂的交互和学习:在本步骤中,两个“灵”通过多轮对话学习辨识对方的意图,为更有效地沟通积累经验。

·新知识更新:在本步骤中,“灵”会更新关于通信意图的认知并积累交互策略的相关知识。

·简化的语义交互:在本步骤中,“灵”可以在知识积累后细化并优化交互策略,实现高效的语义交互。

图9. 在多智能体交互对话过程中,“灵”逐步积累背景知识,按需组织协议以支持特定交互意图达成。

设计下层网络协议以支持高效的语义交互极具挑战。针对该目标,我们设计了一条在IE-SC架构中构建S-NP层的线路图。一般而言,可以根据交互意图来修改现有的分层协议以使其具备语义觉知能力;然后,逐步将这些协议整合成一个新的自主协议。具体而言,在特定意图的指导下,Ubiquitous-X 6G框架中的“灵”,可以使用语义信息计算和协议解析模块来感知和过滤与意图相关的协议功能,减少与意图无关的协议冗余。然后,“灵”可以基于意图相关的协议功能,针对特定意图以适当的优先级重新编排协议功能。语义协议生成模块可以产生具有明确语义意识的增强协议。具有强大智能的“灵”可以学习并积累各种增强协议的策略,利用学习到的策略、经验,新的意图可以被快速辨识并与S-NP层中合适的语义觉知协议相匹配。最后,得益于人工智能技术,通过不断累积的知识,可望形成能够支持一般性意图的综合、自主协议。

5. S-AI层

从广义上讲,每个通信用户或对象都有一个与特定网络服务有关的意图。用户的意图通常被分解并转化为网络的具体部署、配置或控制策略等,语义在用户意图的表达和网络对该意图的理解两方面均扮演着重要角色。在提出的架构中,S-AI层可以挖掘、理解和分解意图,并通过S-IF将子意图集合转移到SI平面以驱动智能网络管理。如图10所示,S-AI层有三个主要功能。

· 意图挖掘:在收到来自用户/应用的原始意图表达后,S-AI层提取、分析、聚合和综合这些意图,以便进一步处理。

· 意图分解:提取的意图被分解为一组子意图,用以指导每层功能的执行。

· 语义表示:S-AI层对子意图集进行语义表示,促进SI平面的决策。

图10. 通用意图解析过程。首先,S-AI层通过语义分析、汇聚和综合来挖掘意图;然后,将挖掘出来的意图分解成多个子意图;最后,这些子意图通过语义嵌入与承载进行表达 

基于来自S-AI层的意图信息,SI平面生成相应的语义指令,并将其映射到S-NP层和S-PB层的功能中;据此,可将语义智能嵌入网络。

由于意图的多样性和复杂性,真正实现意图驱动的网络仍然面临诸多挑战,特别是在理解意图和跨层实施意图方面。首先,意图的理解与复杂的语义处理有关。以自然语言为例,用户可能在一段话中明确表述多个意图,或者将意图不明晰地嵌入话语。为了应对这些挑战,通常利用统计工具和机器学习工具来推断意图。此外,需要在跨层、跨域的协议中贯彻意图方能充分体现语义通信的潜力。为了实现该目标,我们扩展了早期工作,构思了S-IF概念;在智能语义通信的整个框架中,S-IF可以跨层流动,促进意图的跨层贯彻实施。例如,S-IF可以告知S-PB层采用可扩展语义编码,以满足达成具有不同信息粒度的特定应用意图,信息粒度可以细至具有丰富细节的高清视频,或者粗至只需少量特征的自主机器人协作。此外,S-IF可以促进异构网络节点之间的高效互联互通。

四、语义通信网络的潜在应用场景

在本节中,将概述IE-SC赋能Ubiquitous-X 6G网络的三个代表性应用场景。如图11所示,包括空-天-地-海一体化网络(air-space-ground-ocean integrated network, ASGO-IN)、工业物联网(Industrial Internet of Things, I-IoT)和智能无人机器网络(intelligent unmanned machine network, IUMN)。这些应用场景都是Ubiquitous-X 6G迈向WePCN愿景的重要构成部分。

图11. (a)语义赋能的ASGO-IN;(b)语义驱动的I-IoT;(c)基于语义的IUMN

(一)空-天-地-海一体化网络

如图11(a)所示,ASGO-IN将地面网络与卫星、海洋和空中网络融为一体。ASGO-IN是实现6G全球覆盖和按需服务的公认候选方案。实现ASGO-IN的关键技术挑战是大时空跨度异构网络之间如何进行灵活有效的互连互通。目前,一般利用网关来连接不同网络,通常需要烦琐的协议转换。我们提出的IE-SC架构为支撑ASGO-IN提供了一种灵活而简约的解决方案:ASGO-IN中异构节点的S-AI层可以辨识异构网络融合的意图,通过利用预先存储的公共知识,SI平面协调S-NP层对与意图相关的语义元素进行编排,从而可以形成面向网络融合的简约协议,用于异构节点之间的高效互连互通。因此,在没有额外网关的情况下,通过语义编排和协议重塑,不同节点可以基于S-PB层中统一空口直接互通而实现网络融合。

(二)工业物联网

如图11(b)所示,I-IoT引入了先进的信息和通信技术,将人、机、物等各种元素连接起来,以协作和互操作的方式为工业制造服务。然而,现有的数据通信网络不能有效地将制造意图整合到人、机、物的交互中,导致协作效率低,信令开销大。通过本文提出的IE-SC架构,S-AI层可以识别制造意图,并生成面向协作和互操作的语义通信策略。此外,通过在S-PB层使用高效的语义-信源-信道联合编码,可以实现意图相关语义信息的高度压缩和可靠传输。因此,基于IE-SC架构,I-IoT的整体效率将得到显著提升,实现面向意图的组网和协作,高效支撑智能制造。

(三) 智能无人机器网络

如图11(c)所示,IUMN包括自主车辆、机器人和无人机群等不同类型节点,需要实现从数据为中心的传统通信到以机器为中心的控制和协作的网络功能拓展。IUMN中,每个智能无人机器(IUM)均配备先进的传感和通信模块,可以感知环境并与其他机器交互,以完成特定任务。本文提出的IE-SC架构可以支持IUM之间自主和任务驱动的高效组网:S-AI层可以全面分析传感数据,提取与任务相关的语义信息,然后将其汇入SI平面,生成基于语义的、以完成任务为目的的行动准则和网络策略;根据这些准则和策略,S-NP层可以动态地控制链路配置、网络拓扑结构和路由机制等,实现鲁棒而灵活的任务驱动IUMN。

五、挑战和未来方向

(1)基于Seb的语义信息表征。通信智能体对信息背后的确切内涵会有自己不同的理解。甚至,不同的智能体对相同的信息内涵可能有不同的语法表现形式,就如自然语言中存在同义词或多语言现象。因此,需要深入研究Seb框架的理论及技术内涵,实现针对多模态信息统一而通用的语义信息提取和表征。需要注意的是,目前的语义信息提取/表征依赖于人工智能和神经网络技术,其中涉及大量的计算。因此,Seb有望整合语义通信和语义计算,并成为未来通用语义信息处理框架中的基础性构件。

(2)语义通信的基本性能界限。在物理层中,语义通信的设计目标是利用相关背景知识在不同类型的信道上优化语义信息传输。因此,语义通信的基本性能界限是由物理环境和信息情境共同约束决定。此外,通信智能体间相互理解的程度可能决定了语义通信的交互及传递策略,甚至决定了通信的数据量。因此,首先需要建立一个合理的意图达成效率的度量,进而才能回答“什么是达成意图的最有效的语义通信策略”。一般而言,语义通信的普适度量框架抽象而且复杂,因为语义通信策略可能涉及语义相关的高层信息处理和物理层中的语义觉知联合信源-通道编码等庞杂内容。鉴于此,可以首先建立一些理论方法和编码技术来逐步具化度量框架的内涵,先期得到有关语义通信的部分可达性能界限,进而成体系构建出语义通信的基本性能界限。

(3)基于语义的通用意图驱动网络。目前,意图驱动网络主要针对以人为中心的网络配置和管理。其中,自然语言作为人类意图的载体,自然语言处理模块作为中间件将人类的意图转化为预定义的网络配置策略。然而,在不以人为唯一中心的人-机-物-灵的新网络时代,自然语言未必是表达意图的最佳工具。此外,意图驱动网络的概念内涵将可能超越传统的信息通信技术数据网络,适用于各种新兴的功能性网络,包括军事和生产制造网络等。为此,应该建立一个基于语义的通用意图驱动网络,其中基于Seb的编码和交互可能取代自然语言,有望实现高效的跨对象语义通信,而意图驱动的组网能力将成为数据和功能性网络的内生能力。

六、结论

本文针对语义通信网络展开了系统性设计,以支持Ubiquitous-X 6G网络中各种通信对象之间的智能交互。首先构思了Seb概念用以表征语义信息;在此基础上,进一步提出了IE-SC网络架构,它包含SI平面、S-PB层、S-NP层、S-AI层和用于语义信息交互的S-IF。此外,还给出了初步仿真结果,验证了语义通信可使信息传输效率得到很大提升,并讨论了语义通信极具潜力的应用场景和未来研究方向。希望本文能激发研究者共同致力于语义通信的研究工作,赋能WePCN愿景的最终实现。