舰船科学技术  2025, Vol. 47 Issue (5): 8-15    DOI: 10.3404/j.issn.1672-7649.2025.05.002   PDF    
无人艇自主决策技术特点及发展研究
蔡庆1,2, 孙世平1,2     
1. 江苏自动化研究所,江苏 连云港 222006;
2. 中船(北京)智能装备科技有限公司,北京 102600
摘要: 无人艇作为未来海战场的主要作战力量,适宜在恶劣海况下执行长时高风险任务,其自主决策能力是无人艇执行作战任务的核心能力,能够显著提升无人艇的智能程度,是获取作战优势的关键要素。在对无人艇自主决策特点研究的基础上,提出无人艇自主决策架构。通过分析决策框架中认知技术、筹划技术、临机决策技术、数字孪生技术等方面的发展现状,提出海战场抽象建模困难、对抗性强、无人作战规则不完善、人工智能可用度不高等挑战问题,指出高适应性的自主决策技术、基于数字孪生的平行决策技术等研究方向。
关键词: 无人艇     认知     筹划     决策    
Research on the characteristics and development of autonomous decision-making technology for unmanned surface vehicles
CAI Qing1,2, SUN Shiping1,2     
1. Jiangsu Automation Research Institute, Lianyungang 222006, China;
2. CSSC Beijing Intelligent Equipment Technology Co. Ltd., Beijing 102600, China
Abstract: As the main combat force in the future sea battlefield, unmanned surface vehicles are suitable for carrying out long-term high-risk tasks in harsh sea conditions. Their autonomous decision-making ability is the core ability of unmanned surface vehicles to carry out combat tasks, which can significantly improve their intelligence and is a key element in obtaining combat advantages. On the basis of studying the characteristics of autonomous decision-making for unmanned surface vehicles, a framework for autonomous decision-making for unmanned surface vehicles is proposed. By analyzing the current development status of cognitive technology, planning technology, ad-hoc decision-making technology, and digital twin technology in decision-making frameworks, challenges such as difficulty in abstract modeling, strong adversarial nature, imperfect unmanned combat rules, and low availability of artificial intelligence in naval battlefields were proposed. Research directions such as highly adaptable autonomous decision-making technology and parallel decision-making technology based on digital twins were pointed out.
Key words: unmanned surface vehicles     cognition     planning     decision-making    
0 引 言

随着人工智能、大数据、区块链等技术的飞速发展,战争形态从信息化向智能化加速迈进,无人艇等无人系统作为前沿存在作战力量,在战争中的应用将越来越多。自主系统提供了额外的作战能力来增强传统作战力量,允许在保持战术和战略优势的同时,选择承担更大的作战风险;无人系统将提高杀伤力、作战能力、生存能力、作战速度、威慑能力以及战备能力。

在海上作战中,无人艇具备低成本、高机动、能耐久、隐蔽性强等特点,能够搭载各种传感器武器设备,适宜在恶劣海况下执行长时高风险任务,可广泛应用于警戒巡逻、对海攻击、反潜作战、反水雷作战、防空作战、海上搜救等各种作战样式中。无人艇自主系统是无人艇作战的核心,其智能化、自主化水平决定了无人艇作战能力所能达到的高度。按照作战的观察、判断、决策、行动(Observe-Orient-Decide-Act,OODA)过程,决策作为其中关键一环,发挥着中枢核心作用,带动其他环节的发展演化。

从无人艇自主系统的内在需求来看,决策是其核心能力。面向瞬息万变的战场情况,需要决策调度作战资源,加速OODA嵌套环路的迭代,获取作战优势。无人艇自主系统在决策的合理性、有效性和快速性,以及对变化情况的调整能力、稳定性等方面面临巨大挑战。

本文针对无人艇决策的概念和特点、实现架构、技术研究现状进行了分析论述,提出了无人艇决策面临的挑战问题以及未来发展的建议。

1 无人艇决策的概念和特点

所谓决策是指针对特定的某一任务, 基于已有的信息和经验, 在分析评估主客观可能性的基础上, 提出各种可行解决方案和计划, 以方法论为引导、以科学方法为手段进行比较、分析、推演和评价, 优选获得最终实施方案和计划的过程。在决策中重点关注的是任务的实现情况,所有的决策过程都是围绕任务开展的。无人艇决策就是以无人艇(群)所需执行的任务为驱动,无人艇(群)在接收到任务后,自主理解任务的内涵和范围,规划动作序列,形成行动方案;在执行任务过程中,实时分析任务的实现情况,根据需要临机调整行动方案。无人艇决策在一般情况下是由控制站人员与艇端自主系统交互开展,在控制站人员授权或通信不畅情况下则由艇端自主系统自主完成。无人艇决策的主要特点在于:

1)无人自主性

无人自主是无人艇决策最显著的特性,即在功能上能够在无人干预的情况下完成对各项任务的决策,并以决策结果指导无人艇平台、武器传感器等作战资源的自动化实施。所谓的无人是指在艇上没有人员,控制端会配有一定操作人员;与有人舰艇不同的是控制端人员一般不具体完成详细步骤的决策方案,而是将任务梳理后主要交由艇载自主系统进行决策,控制端人员对决策结果进行确认或修改完善,在实施过程中控制端人员也是在必要时才进行干预,一般都由艇载自主系统根据实施情况进行临机调整。在通信不畅情况或下,控制端人员可以授权艇载自主系统完成所有的决策过程并自动实施。这种无人自主决策方式,将人类指挥和自主系统相结合,优势互补,既能充分体现人员的指挥艺术,又发挥机器的速度和规模优势。对于无人艇决策的无人自主性要求,决定了要将人工智能应用到决策中,改变原有决策过程中对人员的高度依赖,通过艇载自主系统提升决策的快速性和有效性,统筹作战资源,实现在复杂海战场环境和高强度体系对抗下的高效作战筹划和指挥协调。

2)多平台协同性

从无人艇作战应用来看,单一无人艇不能满足多样作战任务、广域作战空间、复杂对抗情况的要求,必须以无人艇群方式或与有人舰艇(飞机)、无人机、无人潜航器、无人车的体系协同方式执行多样化的作战任务[1]。在无人艇艇群层面,是由多个自主执行任务的无人艇组成,通过无线通信连接在一起,形成群体协同决策下的一个整体,实现更强的任务执行能力、更广的作战区域、更高的作战效率、更好的适应性和灵活性。在体系协同层面,在与有人平台协同时,无人艇一般担任侦察节点或打击节点,在有人平台的任务分配下自主决策具体的实施步骤;在与其他无人平台协同时,各平台在空间上分散布置, 在功能上通过预设、选举等方法确定指挥节点,通过信息交互、知识共享支撑协同决策,显著增强整体的作战能力。对于无人艇决策的多平台协同性要求,决定了要将决策从单一平台扩展多个平台协同实施,在通信条件约束下,完成任务分解、认知统一、冲突消解等步骤,达到全局、体系最优[2]

3)海洋适应性

海洋是无人艇执行任务的活动空间,对艇平台、传感器、载荷效能都有影响[3]。无人艇决策依赖海洋环境信息,执行过程受到其制约。海洋环境由于受到物理、气象、地理等各种因素的综合影响,具有易变性、动态性和不可预测性,主要体现在:一是海水流动、潮水涨落、海面起伏;二是海水温度、密度、盐度分布不均匀;三是海洋上空风、云、雨、雾及能见度等天气现象的急剧变化。无人艇决策要能够适应海洋环境的变化,需要将对海洋环境的实时感知、认知、预测作为决策依据,建立海洋环境对平台、传感器、武器的影响模型;但由于海洋环境属于非稳态、强耦合的系统,难以建立非常精确的影响模型,可以考虑采用在精度上满足要求的近似解进行代替,作为参变量纳入到决策体系中, 确保决策的高效性、稳定性。

4)动态对抗性

无人艇任务执行过程是一个不断演化的动态过程,决策的每一个实施步骤都将影响着作战进程,参与各方相互作用并通过其他参与者的反应体现出来,展现了强烈的对抗特征。在无人艇任务执行过程中,决策是一个迭代的过程,需要根据敌我双方的变化情况,实时调整决策问题描述和决策求解策略,通过增量式的处理方式实现认知的动态更新和求实精炼,并反馈到决策求解中。无人艇决策的动态对抗性,决定了要将任务目标评估、预测对手行动、规划我方资源使用整合为一体,在实时场景中不断迭代,形成一个开放的、动态的、演化的决策体系,从传统决策静态、多步骤模式转变为动态的、渐进式决策问题求解模式。

5)通信受限性

无人艇通信通常包括控制端与艇端通信、艇群内部通信、艇与其他平台通信,视距内通信手段主要为微波、超短波,视距外通信手段主要为短波、卫星、北斗。人机融合决策是基于控制端与艇端通信的实施的,艇群决策是基于艇群内部通信实施的,体系协同决策是基于艇与其他平台通信实施的,可以说安全可靠的高速数据传输通信是无人艇(群)决策的重要条件。但无人艇通信能力是变化的、受限的,一是快速移动的无人艇导致海上通信链路不稳定,甚至频繁中断;二是海面的波动以及随时间变化的海面湿度等其他环境因素会对海上通信的性能产生较大影响,通信的带宽、延时会急剧恶化;三是在对抗情况下或恶劣海况下,会出现高强度的电磁干扰,影响通信质量,导致通信频繁中断甚至网络瘫痪。对无人艇决策的通信受限特性,就不可能完全像高带宽、低延时网络中的协同决策方法一样,需要根据通信质量合理采用所需传输的决策交互信息,切换运用决策方法,保障决策过程的稳定、可用。

2 无人艇决策技术架构

针对无人艇决策的特点,构建“两端四层”的无人艇决策技术架构(见图1)。“两端”是指无人艇艇端和控制端,通过通信资源互联在一起,共享信息、认知一致,人机融合地完成整个决策过程。“四层”为资源层、认知层、筹划层、临机层,资源层为上层处理提供计算、通信等的资源支撑;认知层在信息处理的基础上完成知识补全更新、认知演化求精,形成对周边态势的掌握和预测;筹划层按照所受领任务的要求,完成任务筹划;临机层在作战实施过程中,评估作战效果,根据情况进行临机调整;其中数字孪生既可以为筹划、也可以为临机决策提供推演分析手段。

图 1 无人艇决策技术架构 Fig. 1 Decision-making technology architecture for unmanned surface vehicles

1)资源层

主要包括云计算资源、智能推理资源和通信资源。随着云计算技术的广泛应用,无人艇决策也将部署到云上,虚拟化的计算中心为决策计算提供便捷的信息服务,保障决策所需的存储空间和分布式式并行计算能力。云计算资源主要包括计算存储服务器以及相应的云计算管理软件,为决策过程提供灵活的资源服务,根据决策计算所需的资源和应用偏好,组合优化计算和存储资源分配,保障了决策的开放性、资源的动态性要求和问题求解的协作性。云计算资源主要部署控制端,用于进行平行推演和训练演进。智能推理资源主要是配置了GPU、NPU等AI加速高性能处理器,以及人工智能的基础软件,提供了强大的计算处理能力,保障深度学习、强化学习等现代人工智能算法在艇端决策中应用。针对通信受限性的要求,通信资源为无人艇决策提供可靠的通信组网,能够根据兵力组织的需求、电磁环境的变化、打击链路的构建要求灵活选择合适的链路通道,实现控制端与艇端、艇群内部以及与其他作战平台的稳定通信,保障数据传输的安全性和网络的韧性。

2)认知层

主要包括编群分析、历史及背景关联、战法战术识别、意图识别、态势推演等内容。针对无人艇决策的无人自主性要求,实现“从数据到认知”的跨越,提升无人艇自主系统的智能化程度。随着知识图谱、认知技术、大模型技术的发展,不断夯实无人艇理解、掌握、预测、评估战场情况的技术基础,“数据-信息-知识-智慧”的处理链条在技术上逐渐充实成型,构建无人艇作战知识体系,形成艇群之间有人无人之间统一认知为决策提供了强大驱动力。无人艇认知以对战场上各种平台以及艇上(群内)各种装备作为知识图谱的实体,将数据提炼为在知识图谱中的作战任务事件、战法、战术、规则、约束等信息,利用历史数据和作战相关的背景知识,采用统计、推理、演绎等方法获取无人艇作战知识元素,基于模式挖掘和正则匹配方法更新战法规则的表示模型,总结无人艇行动、艇群协同、有人无人协同的作战模式、规则和规律,完善无人艇作战知识体系中的实体关系,基于人类认知机理抽象形成高阶知识,实现无人艇自主研判、预测战场态势[4]

3)筹划层

主要包括任务理解、兵力组织、作战计划生成、冲突消解以及数字孪生。针对多平台协同性、无人自主性、海洋适应性的要求,在作战筹划方面从单艇、艇群、体系3个层面进行考虑,综合知识式、规则式、反应式的决策方法,结合人与机器的智能,做出有效的战场决策。在对作战任务分析的基础上,精准描述作战任务空间的状态及行动策略范围,综合利用运筹方法、深度强化学习、群体智能、知识推理等不同方法,计算所需的艇群数量、分群结构、能力要求、通信组织、指挥关系、火力配置、协同路径等内容,规划可行的作战计划与指令序列,对多种传感器使用、武器运用、多平台协同中出现的冲突情况进行消解,通过数字孪生技术平行推演筹划结果,优选合理的作战计划。

4)临机层

主要包括效果评估、临机规划以及数字孪生。针对动态对抗性的要求,在筹划完成后进入实施过程中,实时评估作战效果,通过数字孪生技术平行推演分析,自动匹配最适当的计划调整。其所用的方法与筹划层类似,但更强调实时性和对原有方案的继承性。

3 无人艇决策技术现状分析

随着无人系统的广泛应用,决策理论与方法成为无人领域备受关注的研究内容,技术上有较大的发展,以下按照无人艇决策技术架构的划分,就认知、筹划、临机、数字孪生等方面对各个技术的现状进行分析。

3.1 认知技术

认知技术是在融合处理得到目标的位置、运动状态、类型、种类等信息基础上,抽象出无人艇作战战术、战法、事件等基础性知识,根据这些知识进一步处理战场上敌我数据,基于战场目标位置、运动特征发现各目标之间关系,分析其协同状态和对抗情况,利用多方兵力作战能力、行动样式以及环境要素,预测战局整体的发展方向、优势变化等对抗能力走向。

3.1.1 编群分析技术

编群分析是将空间、行动上高度相似的多个目标构建一个群组,在决策中按照一个整体进行分析,既能提升决策的效率,又便于在全局角度进行评估。王玉竹等[5]建立目标群空间方向关系矩阵模型,基于目标的相对大小和形状,采用模糊数学方法计算各目标相对群组的隶属度向量,支撑群组划分。通过群组划分,一方面用于分析群组的整体行动趋势,提取群组目标任务趋向特征,提供基于任务剖面的编队队形特征分析匹配,识别海上(或空中)编队的队形[6],支撑判断编队的行动意图;另一方面挖掘单目标与群目标的关联关系,判断单目标对群组的作用,实现“单体-群组-多群组”多个层级的聚合解聚分析,从多维度视角分析战场态势。

3.1.2 历史及背景关联

历史及背景关联是无人艇将以前积累的数据信息、任务背景信息与实时探测的群组目标或单目标进行关联,挖掘其中的关系,为态势分析提供必要的判定依据,支撑对数据进一步筛选,更新数据中蕴含的无人艇知识,进而提升态势的合理性。对于历史及背景信息与实时探测信息之间各种信息变量的非线性关系,采用互信息[7]方法,计算最大信息系数来衡量信息之间的相关关系。针对历史及背景关联中高维数据,采用基于距离的相关系数[8-9]来计算其非线性相关性,从特征函数视角来度量2个不同维度信息向量的相关性,但信息高维特征会带来巨大的计算量,需要进一步探索分解为特征子空间的方法,大幅度提高计算效率。对于历史、背景信息与实时探测信息之间的时间特性,采用时序数据的延迟相关性分析方法[10]来判断信息的时间序列关联和数据相关性。典型历史及背景关联方法的优缺点、适用范围等比较如表1所示。

表 1 历史及背景关联方法比较 Tab.1 Comparison of historical and background correlation methods
3.1.3 战术战法识别

战术战法识别是在形式化表示战法条令、战术规则等概念性知识的基础上,把海洋环境、敌我对抗、军事活动等行动要素表示为向量变量,根据实时编群信息、运动信息、状态信息,在历史及背景关联信息支撑下,比较各种已知战术战法的预期行为,模糊匹配战术战法概念性知识。识别出编群或单目标的特定行为,基于不完全的作战知识进行匹配,推断正在进行的战术战法。采用将观察结果与所有可能产生这种情况的已知策略进行匹配,查找可能战术战法,在这些可能战术战法下模拟推演对方未来行动,根据新的观察结果更新可能战术战法的使用概率,确定战术战法范围。采用决策树机器学习方法,基于最近邻算法和非嵌套广义示例算法从不完全信息中预测构建战术战法相关序列。

3.1.4 意图识别

意图识别是判断、预测或解释任务区域内的群组目标或单目标行动目的、行动设想和计划,是决策的重要基础,目标意图具有抽象性、对抗性、稳定性、欺骗性等特点。基于专家系统的意图识别[11]建立包含战场态势信息的置信规则库,结合推理机和专家经验知识,对输入的目标态势要素进行知识推理和规则匹配,将相匹配的事实作为意图输出。基于贝叶斯网络推理框架的意图识别[12]利用目标先验统计信息和专家知识构建推理网络,将规则发现和贝叶斯推理相结合,建立序列贝叶斯网络模型,应用于战术意图识别中。基于神经网络的意图识别技术[13]将经过清洗、去冗、融合等预处理的战场态势信息抽象为意图特征向量,建立任务/目标双层意图预测模型,通过神经网络解算作战任务、作战方向、目标行为。典型意图识别方法的优缺点、适用范围等比较如表2所示。

表 2 意图识别方法比较 Tab.2 Comparison of intent recognition methods
3.1.5 态势推演

态势推演是根据当前已获得的信息,在历史和背景知识支撑下,基于对战术战法和意图的判断,推断态势的变化趋势,对未来态势的演化情况给出合理的预测。态势推演既可以针对单一事件进行推演,也可以对于全局情况进行推演。由于外部信息来源复杂、海洋环境干扰大、艇载设备感知范围有限、对方对抗能力强,态势推演存在不确定性、不完备性、模糊性和动态性。采用博弈论方法和动态贝叶斯网络方法[14]进行态势推演,分析态势变化要素对应的行为特征,建立行为网络与态势关键点关系描述,基于态势关键点时序性和相似性设计态势演化链路,得到体系对抗作战重心变化和未来局势走向。

3.2 筹划技术

无人艇作战筹划主要是自动生成方案计划(含兵力、火力的自动分配)、多域(时、空、频、资源)冲突检测与优化,实现多种作战计划的优选优化和面向博弈对抗的分阶段计划滚动迭代,使作战筹划活动能灵活适应任务环境变化,灵活应对战场不确定性。

3.2.1 任务理解

无人艇的任务可以是由指挥员通过人机交互分配给无人艇的,也可以是其他平台自主分配的,任务描述是以自然语言表述或格式化方式表述。无人艇自主系统需要通过对环境和战场态势以及对作战任务的分析,将作战任务关键要素提取,解析出与上级意图一致的作战指令,为无人艇自主系统后续的任务规划和高效准确地完成指挥员分配的任务奠定基础。无人艇任务理解主要是指能够实时、智能地根据任务的关键词及相应内容,智能地结合已有作战任务示例,分解执行步骤,进行行动决策和航路规划,通过基本任务组合完成较为复杂的任务。无人艇任务理解需要考虑艇的控制操作方式、任务遂行能力,以及体系运行支撑等方面因素,通过分析无人艇状态、战场态势和作战背景给出合理的逻辑任务理解。

任务描述自然语言分析方法,对自然语言的语义表示有基于语义知识库进行转换[15]、将神经网络用于语言模型建模等方法[16]进行语义建模。任务分解方法,一是利用分层任务分解将高级任务分解成一系列可由自主系统执行的低级子任务,分解过程通常基于无人艇作战领域预定义的知识,但这些基于任务分解的方法面临的主要问题是知识库资源不足、通用性较差。二是利用监督学习的实体抽取技术。基于卷积神经网络和循环神经网络等典型神经网络在实体抽取任务上取得了较好效果。近些年,相关研究开始使用注意力机制来提高模型效果。三是利用无监督学习来实现任务分解。采用将自然语言指令映射成一系列可执行动作的强化学习方法[17],在模型学习过程中,通过不断观察不同动作执行时激励函数的变化,选择合适的动作,完成用户自然语言指令到动作序列的映射,从而实现对任务分解。

3.2.2 艇群组织

为了保障任务的资源需求,基于无人艇的作战能力和组网能力设计无人艇群的组织结构,建立动态、自适应、可重构的无人艇群组织,提升整体的作战效能和系统弹性。在环境和任务发生变化时,要能够快速调整无人艇艇群的组织结构,以较低的消耗,满足变化的需求。采用匈牙利算法把无人艇作为可用资源与任务需求资源进行匹配[18],将多个无人艇编组为一个或多个艇群,每个艇群执行一个子任务,实现任务耗费最小、作战效益最大。采用基于合同网、拍卖法等市场机制的艇群组织方法[19],主要是各艇之间互相协调,根据各艇的自身能力和约束条件获取合适的子任务,能够在集群规模较大、拓扑结构较为复杂的情况下建立合理组织结构。采用蚁群算法、遗传算法等智能优化算法[20]对艇群组织进行优化,具有并行性好、对目标函数特性要求低等优势,但存在着效率问题。

3.2.3 作战计划生成

作战计划生成是决策的关键环节,一般由无人艇自主完成,然后交给控制人员进行确认、修改。采用基于案例的规划方法寻找类似的无人艇或有人舰艇作战案例,为当前状态提供可行的解决方案,在决策树、模糊集等方法支撑下推理无人艇作战计划。将博弈思想应用到无人艇决策中[21],从攻防对抗双方出发,分析目标价值收益和自身损失代价,通过纳什均衡搜索算法求解攻防双方的各种策略组合,得到有效的作战计划。采用由决策粗糙集发展而来的3支决策理论[22],在无人艇不具备完备信息情况下,设计基于梯形模糊数的损失函数,利用粒计算方法推导作战计划。采用深度强化学习方法规划无人艇的作战计划[23],设计合理的阶段性奖励函数,将无人艇作为智能体,训练智能体完成作战任务规划。典型作战计划生成方法的优缺点、适用范围等比较如表3所示。

表 3 作战计划生成方法比较 Tab.3 Comparison of operation plan generation methods
3.3 临机决策技术 3.3.1 效果评估

随着信息化技术的高速发展和先进装备的大量列装,海战智能化程度及战场复杂程度和智能化程度愈来愈高,无人艇协同作战智能决策与评估问题已成为争夺战场主动权亟需解决的问题,也是无人艇自主作战决策的关键问题之一。为了适应协同作战环境中出现的态势变化快、敌情复杂、敌我信息量大及模型复杂等问题,需建立详细的评价指标体系和评价模型,利用智能评估方法对无人艇作战攻防决策结果进行评估,判断是否需要临机重规划,完成整个闭环的作战过程,可降低作战资源的浪费,从根本上提高多无人艇协同作战的效能。

3.3.2 临机规划

无人艇的动态对抗性对现有的规划方法构成巨大的挑战,临机规划应该是在原有模型上的增量处理,而不是完全重新规划,针对这种增量问题,通过训练学习、预测执行结果,基于符合人类认知的层次化概念来理解分析存在的偏差,基于知识距离度量采用粒计算方法计算偏差距离与漂移方向,综合运用进化计算与神经网络等方法构建参数自适应模型,实现对规划模型的演化更新,满足对动态对抗情况的快速决策。

3.4 数字孪生技术

在无人艇数字孪生环境下[24],结合无人艇的场景、作战要素,在对抗下的评估指标体系和模型指导下,建立无人艇数字化镜像作为虚拟模型,集成与融合无人艇几何、物理、行为和规则模型,描述无人艇的物理属性、几何参数、运动特性、外界驱动和内部感知决策控制过程,在虚拟空间中进行量化分析和推演评估。在数字孪生技术的驱动下,无人艇通过传感器实时感知作战过程中产生的各种状态数据,数字无人艇通过虚实映射分析解析各种状态,结合决策算法人机融合地对作战计划进行实时的生成、调度、决策和评估,具有更好的变化适应能力和异常解决能力。

4 挑战问题与发展分析 4.1 无人艇决策挑战问题

海战场抽象建模困难。海战过程非常复杂,水面、水下、空中、陆上、电磁等多个域各种要素的相互影响、互相制约;建模时需要将海战场上的各个因素如兵力的布置、各种相互关系、能势大小、趋势方向、战法战术策略、武器使用等根据影响情况进行抽象,面向任务综合成多种作战模型,要达到与现实对应非常困难;当前大多是使用经验模型,仅在一定范围内适用。

行为决策对抗性强,作战中双方的决策都是同时进行,非轮次博弈是其典型特征,决策结果相互影响。

在无人状态下,战争迷雾的影响进一步放大。实际海战中,信息缺失、真假相参,关键信息的变化会导致决策结果的大幅度改变,指挥员的指挥艺术难以通过计算机进行模拟。

无人作战的规则并不完善,对手也不会遵循以前战术战法,往往会出其不意,各种突发情况会随时出现,决策响应实时性要求高、适应性强。

人工智能方法可用度不高,训练环境不真实、样本少;现实海战样本过少,距离人工智能的要求训练样本往往差几个数量级,而采用自主学习进化模式,在小样本或无样本环境下采用自我博弈,其建模和实际海战往往有所差异,其结果的有效性往往会受到影响。

4.2 发展分析

无人艇自主作战决策技术主要重点发展高适应性的自主决策技术、基于数字孪生的平行决策技术、融合群体智能与单体智能、扩展性的人机融合决策框架几个方面:

1)高适应性的自主决策技术,将实时感知的环境信息综合到决策中,重点把对环境的变化预测精细化地反应到决策中,提高决策中对海洋环境因素的考虑,增强对环境的适应能力。对于任务实施过程中的环境变化,一方面具有较好的冗余度,不会因为微小变化导致决策的改变;另一方面具有较好的平稳变化性,不会动则引起艇群行动的大幅度变化,或出现决策结果震荡的情况。

2)基于数字孪生的平行决策技术,在对艇平台、海洋环境、载荷的建立可同步的数字孪生系统,实时监测无人艇环境数据和运行状态,建立无人艇实体和虚拟模型的互动机制,保持两者平行运行,基于知识推理和博弈推演,从实际作战中获取及时真实的战场数据,由虚拟模型仿真推演作战过程,智能生成与优化行动方案,使得作战决策考虑的因素更全,反应更快,方案更优。

3) 融合群体智能与单体智能,把多平台决策与单平台决策结合在一起,保障决策的一致性和有效性。将无人艇群的行动决策,以及无人机的协同行动决策,通过分布式决策的方式把各艇、机的智能决策结合在一起,提升决策效率。

4)扩展性的人机融合决策框架,无人艇自主将任务分解为元技能的组合,通过元技能的组合提升对各种任务的适应性;同时结合人员的适时介入,保障结果可用。通过强化学习、基于规则的规划等方法将任务分解为多个基础任务,确定基础任务的执行时间和参数,由无人艇自动化地执行基础任务所包含的元技能。

5 结 语

在未来的海战场上,无人艇可广泛应用于警戒巡逻、对海攻击、反潜作战、反水雷作战、防空作战、海上搜救等各种作战样式中,具有低成本、高机动、能耐久、隐蔽性强等特点。面向无人艇自主作战需求,总结了无人自主性、多平台协同性、海洋适应性、动态对抗性、通信受限性等无人艇决策特点,构建了“两端四层”的无人艇决策技术架构。按照无人艇决策技术架构的划分,就无人艇在认知、筹划、临机、数字孪生等方面的决策技术现状进行了分析,提出了决策中需要面临的海战场抽象建模困难、对抗性强、无人作战规则不完善、信息不完备、人工智能可用度不高等各种挑战问题,给出了高适应性的自主决策技术、基于数字孪生的平行决策技术、融合群体智能与单体智能、扩展性的人机融合决策框架等发展建议。

参考文献
[1]
冯炜, 崔东华, 夏天冰, 等. 国外无人船集群运用特点分析及其应对启示[J]. 中国舰船研究, 2023, 18(1): 1-12.
FENG W, CUI D H, XIA T B, et al. Analysis of characteristics of foreign unmanned surface vehicle swarm combat application and proposed countermeasures[J]. Chinese Journal of Ship Research, 2023, 18(1): 1-12.
[2]
谢少荣, 刘坚坚, 张丹. 复杂海况无人艇集群控制技术研究现状与发展[J]. 水下无人系统学报, 2020, 28(6): 584-596.
XIE S R, LIU J J, ZHANG D. Current development of control technology for unmanned surface vessel clusters under complex sea conditions[J]. Journal of Unmanned Undersea Systems, 2020, 28(6): 584-596.
[3]
申家双, 王耿峰, 陈长林. 海洋环境装备体系建设现状及发展策略[J]. 海洋测绘, 2017, 37(4): 33-38.
SHEN J S, WANG G F, CHEN C L. The constructional status and strategies on the equipmental systems of marine environment[J]. Hydrographic Surveying and Charting, 2017, 37(4): 33-38.
[4]
袁翔, 左毅, 王菁, 等. 数据驱动的态势认知技术及发展思考[J]. 中国电子科学研究院学报, 2022, 17(2): 134-140.
YUAN X, ZUO Y, WANG J, et al. Data-driven situation cognition technology and development idea[J]. Journal of CAEIT, 2022, 17(2): 134-140. DOI:10.3969/j.issn.1673-5692.2022.02.006
[5]
王玉竹, 闫浩文. 一种改进的群组目标空间方向关系计算模型[J]. 测绘科学, 2022, 47(4): 169-174.
WANG Y Z, YAY H W. An improved computational model on spatial direction between object groups[J]. Science of Surveying and Mapping, 2022, 47(4): 169-174.
[6]
冷画屏, 关庆云, 吴晓锋. 基于领域知识的海上编队线型队形识别[J]. 舰船科学技术, 2013, 35(2): 103-106.
LENG H P, GUAN Q Y, WU X F. Recognition of naval fleet line type formation based on domain knowledge[J]. Ship Science and Technology, 2013, 35(2): 103-106.
[7]
梁吉业, 冯晨娇, 宋鹏. 大数据相关分析综述[J]. 计算机学报, 2016, 39(1): 1-18.
LIANG J Y, FENG C J, SONG P. A survey on correlation analysis of big data[J]. Chinese Journal of Computers, 2016, 39(1): 1-18.
[8]
SZÉKELY G J, RIZZO M L, BAKIROV N K. Measuring and testing dependence by correlation of distances[J]. The Annals of Statistics, 2007, 35(6). 2769−2794.
[9]
MARTÍNEZ-GÓMEZ E, RICHARDS M T, RICHARDS D St P. Distance correlation methods for discovering associations in large astrophysical databases[J]. The Astrophysical Journal, 2014, 781(1): 39. DOI:10.1088/0004-637X/781/1/39
[10]
EDELMANN D, FOKIANOS K, PITSILLOU M. An updated literature review of distance correlation and its applications to time series[J]. International Statistical Review, 2019, 87(2): 237-262. DOI:10.1111/insr.12294
[11]
伍之前, 李登峰. 基于推理和多属性决策的空中目标攻击意图判断模型[J]. 电光与控制, 2010, 17(5): 10-13.
WU Z Q, LI D F. A model for aerial target attacking intention judgment based on reasoning and multi-attribute decision making[J]. Electronics Optics & Control, 2010, 17(5): 10-13.
[12]
乔殿峰, 梁彦, 马超雄, 等. 多域作战下的群目标意图识别与预测[J]. 系统工程与电子技术, 2022, 44(11): 3403-3412.
QIAO D F, LIANG Y, MA C X, et al. Recognition and prediction of group target intention in multi-domain operation[J]. Systems Engineering and Electronics, 2022, 44(11): 3403-3412.
[13]
李战武, 李双庆, 彭明毓, 等. 基于注意力机制改进的LSTM空战目标意图识别方法[J]. 电光与控制, 2023, 30(3): 1-7.
LI Z W, LI S Q, PENG M Y, et al. Air combat intention recognition method of target based on LSTM improved by attention mechanism[J]. Electronics Optics & Control, 2023, 30(3): 1-7. DOI:10.3969/j.issn.1671-637X.2023.03.001
[14]
RAHMES M, WILDER K, FOX K, et al. A game theory model for situation awareness and management[C]//2013 IEEE 10th Consumer Communications and Networking Conference (CCNC). Las Vegas, NV: IEEE, 2013: 909−913[2023-12-05].
[15]
GUO L, YAN F, LI T, et al. An automatic method for constructing machining process knowledge base from knowledge graph[J]. Robotics and Computer-Integrated Manufacturing, 2022, 73: 102222. DOI:10.1016/j.rcim.2021.102222
[16]
DU C, WANG J, SUN H, et al. Syntax-type-aware graph convolutional networks for natural language understanding[J/OL]. Applied Soft Computing, 2021, 102: 107080.
[17]
HATANAKA W, YAMASHINA R, MATSUBARA T. Reinforcement learning of action and query policies with LTL instructions under uncertain event detector[J]. IEEE Robotics and Automation Letters, 2023, 8(11): 7010-7017. DOI:10.1109/LRA.2023.3313969
[18]
曾宏, 张伟斌, 张云飞, 等. 小型无人艇编队的多任务协同控制方法[J]. 舰船科学技术, 2022, 44(9): 69-74.
ZENG H, ZHANG W B, ZHAO J C, et al. Research on multi-task cooperative control method for small unmanned boat formation[J]. Ship Science and Technology, 2022, 44(9): 69-74. DOI:10.3404/j.issn.1672-7649.2022.09.014
[19]
翟政, 何明, 徐鹏, 等. 基于市场机制的无人集群任务分配研究综述[J]. 计算机应用研究, 2023, 40(7): 1921-1928.
ZHAI Z, HE M, XU P, et al. Research review of task allocation for unmanned swarm based on market mechanism[J]. Application Research of Computers, 2023, 40(7): 1921-1928.
[20]
杨旭, 王锐, 张涛. 面向无人机集群路径规划的智能优化算法综述[J]. 控制理论与应用, 2020, 37(11): 2291-2302.
YANG X, WANG R, ZHANG T. Review of unmanned aerial vehicle swarm path planning based on intelligent optimization[J]. Control Theory & Applications, 2020, 37(11): 2291-2302.
[21]
房肖, 温广辉, 付俊杰, 等. 基于博弈的水面无人艇集群对抗问题研究[J]. 控制工程, 2022, 29(3): 492-497.
FANG X, WEN G H, FU J J, et al. Study on group confrontation of unmanned surface vessels based on game theory[J]. Control Engineering of China, 2022, 29(3): 492-497.
[22]
刘杰, 薛占熬. 不完备信息系统的梯形模糊数三支决策模型[J]. 山西大学学报(自然科学版), 2017, 40(4): 683-689.
LIU J, XUE Z. Trapezoidal fuzzy number three-way decision model for incomplete information systems[J]. Journal of Shanxi University (Nat. Sci. Ed. ), 2017, 40(4): 683-689.
[23]
苏震, 张钊, 陈聪, 等. 基于深度强化学习的无人艇集群博弈对抗[J]. 兵器装备工程学报, 2022, 43(9): 9-14.
SU Z, ZHANG Z, CHEN C, et al. Deep reinforcement learning based swarm game confrontation of unmanned surface vehicles[J]. Journal of Ordnance Equipment Engineering, 2022, 43(9): 9-14.
[24]
王鹏, 杨妹, 祝建成, 等. 面向数字孪生的动态数据驱动建模与仿真方法[J]. 系统工程与电子技术, 2020, 42(12): 2779-2786.
WANG P, YANG M, ZHU J C, et al. Dynamic data driven modeling and simulation method for digital twin[J]. Systems Engineering and Electronics, 2020, 42(12): 2779-2786. DOI:10.3969/j.issn.1001-506X.2020.12.14
无人艇自主决策技术特点及发展研究
蔡庆, 孙世平