舰船信息中心属于舰船上的综合信息显示处理平台,其关键作用是实时呈现舰船的航行轨迹、动态及位置等信息,并对舰船航行相关事务实施处理[1]。舰船信息中心具有丰富的不同频率信息数据量,其获取信息的首要方式即为惯导(INS)及GPS数据等,为此,舰船信息中心对实时性的需求较高,需通过实时内存数据库技术实现其核心功能。
可扩展标记语言(extensible markup language,XML)技术是支持全新Web应用的关键技术之一,其特点为简单易读取、数据格式开放性高及扩展性强等,在数据库构建、远程数据迁移及数据交换等领域内被大量运用[2]。
为此,本文设计一种基于XML技术的舰船信息中心实时内存数据库构建方法,通过结合XML技术构建包含舰船航行实时轨迹信息、位置信息及动态方位信息等的实时内存数据库,为实现舰船信息中心的综合信息实时显示与处理等提供有效帮助。
1 舰船信息中心实时内存数据库构建方法 1.1 舰船信息中心实时内存数据库模型架构舰船信息中心的整体实时数据库主要由外存与驻内2个单元组成,其中驻内单元属于整体实时数据库的核心,也称之为实时内存数据库,外存单元即外存数据库,同时其也被称作历史数据库或者磁盘数据库[3]。实时内存数据库可通过定时处理事务,外存数据库的主要任务是分析历史数据及生成报表等。
舰船信息中心实时内存数据库的整体模型架构如图1所示。
以XML技术作为过渡中间件,完成源数据库到XML文档再到实时内存数据库的实时数据抽取、转换及存入任务,基于XML技术的舰船信息中心实时内存数据库整体构建过程框架如图2所示。
以舰船信息中心所获取的舰船实时信息作为源数据存入源数据库内,通过XML格式创建源数据库表与所需构建实时内存数据库表之间的映射模型;以相应规则为依据,抽取源数据库内数据并转换成XML格式,将转换后的数据写入XML文档内;为降低数据冗余与误差,可依据实际所需清洗更新XML文档内数据[4];依据所需构建的实时内存数据库表的对应格式,解析转换清洗更新后XML文档内数据,对解析转换后XML文档数据进一步实施一致性校验后,向待构建实时内存数据库内存入,实现舰船信息中心实时内存数据库的构建。
1.2.2 基于XML格式的映射模型建立舰船信息中心实时内存数据库构建的关键即为源数据库和所需构建实时内存数据库间映射模型的创建,通过XML格式将二者间的映射关系呈现出来,此即为基于XML格式的映射模型,如图3所示。
以实时内存数据库构建需求为依据,由源数据库与实时内存数据库内分别读取数据信息,生成源数据库表及实时内存数据库表,将2个表间的映射形式确定之后,创建二者之间的映射关系,获得基于XML格式的映射模型文件。
1.2.3 XML文档数据清洗更新处理由于XML文档内数据参差不齐,极易出现脏数据,因此,需先对XML文档内数据实施清洗更新处理,去除掉重复、冗余等脏数据,提升整体数据质量。XML文档数据清洗更新过程为:
1)将XML文档数据与预先设定的XML数据相似阈值输入。
2)以XML文档结构为依据,依次将有序的具备标记的XML数据树建立。
3)运用架构对XML文档的正确性予以检验,检验过程包括:
①次序约束的检验—运用Sequenceo,Choice,All三种次序指示器,按照XSL架构对XML文档的次序约束实施检验。其中,3种指示器所检验的内容依次为XML文档内数据元素需依据特定次序呈现、仅可由所呈现的数据元素内挑选一种、全部数据子元素的每种呈现次序仅可单次呈现;
②数据元素次数的准确性检验—依据XML文档架构规定各数据元素的呈现次数,检验各数据元素出现次数是否准确;
③数据元素层次结构的检验;
④提取并建立XML文档架构的层次关系,对源XML文档层次结构的准确性实施检验。
4)清洗更新XML文档数据:将所建立的XML有序数据树调入,以知识库为依据训练数据树并实施分类,运算出各类别数据树的数据距离上、下限值;以预先设定的XML数据相似阈值为依据,通过相关检测算法将XML文档内相似度高的重复数据检测出来;删除掉此类重复数据,完成XML文档数据的清洗更新处理。
5)输出清洗更新后的XML文档。
1.2.4 清洗后XML文档数据解析转换处理因所需构建的实时内存数据库内的字段类别与表结构等均可能同源数据库具备一定的差异,故需对此类数据实施解析转换处理。在此选用VTD-XML解析模型实现对XML文档内数据的解析转换任务。
通过Database代表XML文档内的根元素,目的是将实时内存数据库类别确准;通过Table代表根元素的子元素,其作用是用于确准所导入数据的目标表。各个Table元素均属于一条完整记录,其各个子元素为实时内存数据库表内各字段名,此元素的内容即为对应字段值。为了得到此字段值,可通过VTD-XML解析模型对此元素实施解析转换,在得到其结束标志时实现对XML文档的解析转换处理。
1.2.5 解析转换后XML文档数据一致性校验针对解析转换后XML文档数据的一致性校验主要分为单表数据与副本数据的一致性校验,即对初始XML文档数据集和其等效数据集的一致性实施校验。随着XML文档数据的传输与转换时间延长会生成等效数据集,故对一致性校验实施评价的关键指标包括XML文档数据的传输和转换用时指标。设XML文档数据一致性校验函数为:
$ \eta =2CD/(C+D) 。$ | (1) |
式中:D和C分别表示召回率与准确率,其中,召回率
$ D = \frac{c}{{c + e}}。$ | (2) |
式中:
$ C = \frac{c}{{c + d}} $ | (3) |
式中:
$ \eta ' = \frac{{\displaystyle\sum\limits_{j = 1}^T{{{\eta _j}}/ {{t_j}}}}}{m} \times 100\text{%} $ | (4) |
式中:
完成对解析转换后XML文档数据的一致性校验之后,由该文档内将校验后数据全部提取出来,向所需构建的实时内存数据库内存入,实现舰船信息中心实时内存数据库的构建。
2 实验结果分析为检验本文方法的实际应用性能,以某舰船信息中心为例,通过本文方法为其构建实时内存数据库,检验本文方法构建过程中的数据清洗更新、解析转换以及最终构建数据库内容信息呈现等效果,分析本文方法的实际应用效果。
首先检验本文方法在构建实验舰船信息中心实时内存数据库过程中,清洗更新XML文档数据的实际效果。通过本文方法建立实验舰船信息中心源数据库与待构建实时内存数据库之间的XML映射模型,运用该映射模型转换由源数据库内抽取的数据并写入XML文档内,由XML文档中随机抽取80000条数据,划分成10组,经由本文方法对10组XML文档数据依次实施清新更新处理,依据处理结果分析本文方法的清洗更新效果。本文方法的XML文档数据清洗更新结果详见表1。
可知,本文方法能够实现对不同数量XML文档数据的清洗更新处理,10组不同数量XML文档数据的清洗更新结果中,本文方法所删除掉的重复数据量占实际重复数据量的比例区间为96.12%~98.14%,可见本文方法对XML文档数据的清洗更新效果较好。
由清洗更新处理后的XML文档内选取出231~18765 kb的8组由小到大的XML格式数据(a~h),通过本文方法依次实施解析转换处理,检验实际解析转换过程中所占用的内存与用时情况。为保证实验结果的可靠性,将此实验重复3次,依据3次实验结果分析本文方法的解析转换效果。本文方法解析转换8组大小不同XML格式数据的用时与占用内存检验结果如图4所示。
分析可知,本文方法在针对不同大小XML格式数据的3次解析转换实验中,所占用内存与用时情况均较为理想,且3次实验结果相近,说明本文方法能够以较小的内存实现对不同大小XML文档数据的快速解析转换,且解析转换处理性能稳定,解析转换结果可靠。
运用本文方法对解析转换后XML文档数据实施一致性校验,提取出完成校验后全部数据存入实时内存数据库内,获得实验舰船信息中心实时内存数据库。通过呈现该数据库内部分内容信息,检验本文方法的整体构建效果。本文方法所构建的实验舰船信息中心实时内存数据库中实验舰船航行实时动态轨迹信息呈现如图5所示。
本文方法所构建的实时内存数据库中实验舰船航行实时定位信息呈现如表2所示。
结合图5、表2能够看出,利用本文方法所构建的实验舰船信息中心实时内存数据库信息内容丰富且实时性强,能够满足实验舰船信息中心的实际存储与信息显示等需求,为精准高效地分析及规划舰船的航行线路提供科学依据。
3 结 语本文针对基于XML技术的舰船信息中心实时内存数据库构建方法展开研究,通过结合XML技术为舰船信息中心构建包含舰船航行的实时轨迹、位置及动态方位等信息的实时内存数据库。经实验检验可知,本文方法在构建舰船信息中心实时内存数据库的过程中,针对XML文档数据的清洗更新与解析转换处理效果均十分显著,能够保障舰船信息中心的综合信息显示与处理等核心功能的有效实现。
[1] |
王栽毅, 杨照. 船联网智能数据传输与通信算法研究[J]. 中国海洋大学学报(自然科学版), 2021, 51(7): 108-114. DOI:10.16441/j.cnki.hdxb.20190101 |
[2] |
朱阅岸, 简怀兵, 龙永超, 等. 构建新型高性能与高可用的键值数据库系统[J]. 软件学报, 2021, 32(10): 3203-3218. DOI:10.13328/j.cnki.jos.006023 |
[3] |
何卓桁, 刘志勇, 李璐, 等. 异构文本数据转换中XML解析方法对比研究[J]. 计算机工程, 2020, 46(7): 286-293+299. DOI:10.19678/j.issn.1000-3428.0054925 |
[4] |
王艳. 多媒体数据库引擎多任务并行控制方法仿真[J]. 计算机仿真, 2021, 38(4): 147-150+394. DOI:10.3969/j.issn.1006-9348.2021.04.029 |