2. 61363部队,陕西 西安 710054;
3. 南京师范大学 虚拟地理环境教育部重点实验室,江苏 南京 210046
2. 61363 Troops, Xi'an 710054, China;
3. Key Laboratory of Virtual Geographic Environment, Nanjing Normal University, Nanjing 210054, China
地理空间数据的数字化使其以数字地图的形式存储于各种载体中,为各种地图产品的存取提供了极大的便利,随着数字网络通信技术和WebGIS的迅猛发展,地理空间数据的发布、传输和服务实现了“网络化”,使得其异地传播、流通亦日益便捷。与此同时,由于地理空间数据易于复制与传播的优点,在网络和个人通信高度发达的今天,地理空间数据的非法使用、版权纷争等现象日益严重。因此,如何有效管理网络环境下地理空间数据的使用权限、保护其版权甚至跟踪其使用情况等这一系列问题都急需研究和解决。而作为一种崭新的信息安全技术,数字水印技术为解决上述问题提供了一种切实可行的解决途径。
数字水印技术是近年来兴起的一个信息安全前沿研究领域,与数据加密技术有着密切联系。数据加密技术通过控制数据文件的存取使得非法用户无法正常使用,但加密技术无法追踪密文数据的流向,且加密技术一旦被破解,将无法阻止明文数据的非法传播和使用。相对而言,数字水印技术主要用于确定版权拥有者、所有权认证、跟踪侵权行为等。与数据加密技术相比,数字水印技术则无法主动控制数据文件访问权限,无法主动控制数据的传播和使用,只是一种被动管理数据版权、跟踪数据使用情况的机制,这也限制了数字水印技术的发展与应用。
目前基于地理空间数据的数字水印技术已有较多研究[3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20],这些研究取得了一些成果,但主要是针对数字水印技术在地理空间数据的版权保护、使用跟踪、内容认证等方面而言。这些研究所提出的解决方案都是基于传统数字水印思想,是一种被动性质的数据版权管理、使用跟踪机制,无法主动控制地理空间数据的传播和使用,不能达到主动控制用户对正确的地理空间数据访问权限的目的,没有考虑到网络环境中地理空间数据来源的多样性,水印算法对网络环境的复杂性适用度。因此有必要针对其缺陷设计新的面向网络环境的地理空间数据数字水印模型。
2 面向网络环境的数字水印模型首先建立一种面向网络环境的地理空间数据数字水印模型,该模型顾及网络环境的复杂性和地理空间数据来源的多样性,对网络环境下地理空间数据文件的访问权限控制、数据版权保护、使用流向跟踪等问题予以考虑和解决。面向网络环境的地理空间数据数字水印模型如图 1所示,其核心是算法1和算法2的设计与实现。
|
| 图 1 面向网络环境的数字水印模型 Fig. 1 digital watermarking model oriented network environment |
算法1顾及地理空间数据特性,运用一定规则将水印1与数据有机结合到一起,使得算法对合法用户在数据使用过程中所遭受常见的各种无意或恶意攻击具有抗差性,如数据压缩、噪声、锐化、剪裁、增删点等,以实现对地理空间数据版权保护、使用跟踪的功能。
算法2基于WebGIS数据传输特点,顾及水印算法对网络环境的复杂性适用度,设计了一种基于数据包的数字水印算法,算法的主要作用对象是数据包,通过将水印信息2实时、快速嵌入网络传输中的数据包,以达到标识地理空间数据流向和主动控制用户对所申请的正确数据访问权限的目的。
在本模型中,考虑到算法1的设计需要针对不同地理空间数据类型和不同数据特性,其算法思想和实现是不同的。而目前,针对不同数据类型和不同数据特性的数字水印算法研究较多,因此可以基于现有研究建立水印算法库,将现有水印算法加入算法库中,并根据数据类型、数据特性等原则对算法库中的水印算法进行归类处理。在实用中针对不同地理空间数据,服务器从数据类型、数据特性两方面来考虑选择,从水印算法库中调度适合的具体算法,在本文中将不再重复此方面工作。下面主要就算法2,即网络环境下基于数据包的地理空间数据数字水印算法进行深入的研究。
3 基于数据包的数字水印算法本算法设计的主要目的是标识地理空间数据流向和主动控制用户对所申请的正确数据访问权限。为了达到上述目的,一方面算法需要具有传统数字水印技术的版权保护、流向跟踪功能,水印信息必须包括数据版权、数据流向等信息,同时,水印信息应与地理空间数据紧密结合,使得算法具有好的抗差性,从而通过对流通状态下的地理空间数据进行水印信息的提取,能有效准确地检测出数据流向等相关水印信息,由此达到标识地理空间数据流向的目的,因此,所设计水印算法的抗差性是此功能能否实现的核心所在。另一方面,算法又必须达到有效降低地理空间数据精度及数据质量,甚至达到对数据加密的作用,使得非法用户在获取到含水印数据后无法访问正确的地理空间数据,而合法用户则会以授权的方式移除水印信息嵌入所引起的数据变化,从而访问正确的地理空间数据,通过这样的方式,达到主动控制用户对所申请的正确数据访问权限的目的,因此,水印信息嵌入所引起的地理空间数据变化量和变化率是此功能能否实现的关键所在。
由于数据在网络环境中的传输是以数据包为单位进行组织的,考虑到水印信息必须实时、快速嵌入网络传输状态的地理空间数据,因此地理空间数据在网络传输过程中,以数据包为水印嵌入单位既有利于增强算法的实用性,水印信息能实时、快速地嵌入数据包,又可以在嵌入水印信息的同时进行降低数据精度及数据质量、甚至对数据加密的处理。基于此,本算法以数据包为单位进行高强度水印信息的嵌入,在算法设计过程中,水印信息生成方案参照文献[3]中的无意义水印信息生成方法,在此不过多说明。下面主要就算法设计中的水印信息嵌入、水印信息检测和移除部分作出详细的阐述。
3.1 水印信息嵌入地理空间数据在网络环境中是以数据包的形式进行发布与接收的,数据包由字节组成,因此为实现地理空间数据在网络流通过程中的有效管控,并使得提出的算法具有普适性,在设计网络环境下水印嵌入算法时,始终以数据包为水印嵌入单位进行总体考虑,在嵌入单个水印信息位时则以字节为单位进行个体考虑。同时,为了使得嵌入水印后的地理空间数据质量和精度降低,在嵌入水印信息前可以对字节进行预处理,如位取反、置乱、加密等操作,这样就增强了含水印数据对非法用户的不可信度。
水印信息在数据包中嵌入位置的选择,直接关系到检测和移除水印信息时信息的定位。由于地理空间数据在网络环境传输的过程中,数据包有可能出现异步传输,或者可能存在某个数据包的部分丢失或遭受攻击而信息改变的情况,因此按照数据读取顺序依次选择水印嵌入位置的这种传统对应方案在网络环境中很容易出错,并不能胜任于网络环境下基于数据包的数字水印算法。
从上述分析可知,水印信息嵌入位置不能由数据包在地理数据中的位置决定,亦不能由字节在数据包中的位置决定,而应该由字节本身决定水印信息位的嵌入位置,即使得字节本身和其所嵌入的水印信息位保持同步关系,这样才能为实现算法盲检测水印信息提供可能。为此,引入数学映射思想,构建字节-水印同步函数,即建立根据字节本身定位水印信息位的函数,使得字节与水印信息位保持多对一的同步关系,通过建立的同步关系来确定水印信息位的嵌入位置。同步函数特有的多对一性质,使得算法能够保证,地理空间数据在网络传输中字节和水印信息位保持同步机制。具体算法如下:
假设水印信息长度为N,将地理空间数据包以双字节为单位依次取出,前字节作为同步函数的调节参数,后字节用于水印嵌入载体。首先将调节字节转化为相应的数值,采用多对一映射的思想,按照字节所对应的数值对应到[1,N]上。令同步函数为f(x),x为字节所对应的数值,水印信息为W={w[i],i=0,1,…,N-1},即要求1≤f(x)≤N。为建立多对一的同步关系,水印信息位采用重复嵌入的方式进行;考虑到算法的抗差性,f(x)应尽量均匀地把x映射到[1,N]上;且x的细微变化不会显著影响到水印信息位所对应的字节个数,从而保证字节数值与水印信息位之间的对应关系具有较好的稳定性。依据以上要求,构建抗差的具有双向定位性质的同步函数f(x),待嵌入字节将在同步函数和调节字节的指导下寻找对应的水印信息位,而后按照所制定的规则进行水印嵌入。
水印信息嵌入方式有:基于变换域和基于空间域的水印嵌入方式。为了分离数据包中字节之间的相互影响关系,增强水印盲检测中单个水印信息位的独立性,消除水印信息位之间的依赖性,本文采用在空间域中嵌入水印信息。基于统计的水印嵌入方式、基于最低有效位的水印嵌入方式、基于量化的水印嵌入方式是实现盲水印算法较好的方式,因此本文中采用量化思想实现水印信息的嵌入。在量化过程中,采用较大步长来变化字节数值,这样使得嵌入水印信息后能有效降低地理空间数据质量,破坏数据精度,甚至达到使数据不可用的目的。
由上述可知,基于数据包的数字水印嵌入算法流程如图 2所示。
3.2 水印信息检测和移除水印信息检测实际上与水印嵌入过程相逆,在此不过多阐述。需要强调的是,因建立的同步函数是多对一关系,所以提取的水印信息必须根据模糊模式识别的最大隶属度原则进行判别[15]。
|
| 图 2 水印嵌入流程图 Fig. 2 Chart of Watermark Embedding |
水印信息的移除工作是至关重要的步骤,它是对数据的还原过程。在用户获取地理空间数据后,使用该地理数据前需要验证是否为合法使用数据者。首先通过水印检测算法进行相关检测[20],然后依据检测结果作出相应的处理:当地理空间数据为含水印数据时,如果是数据授权用户,说明用户有权使用该地理空间数据,则移除数据中所含有的水印信息,将含水印数据恢复为原始数据,移除水印信息的过程即为水印嵌入的逆过程;否则,说明用户非法获取了该地理空间数据,由于用户没有权限移除此水印信息,因此地理空间数据仍为不可信数据,从而用户无法使用正确的地理空间数据,同时可以根据所提取的水印信息获取数据流向、版权等相关信息,从而保护数据的版权、追踪数据非法流出的源头。
4 模型验证与分析根据本文所述的模型与算法,建立水印算法库,将文献[3、12、15]中所提出的水印算法加入算法库,从而可以根据数据类型的不同从水印算法库中调度和使用适合的算法作为本文水印模型中算法1的基础;同时,将上节所设计的数字水印算法作为水印模型中算法2的基础,实现了面向网络环境的地理空间数据数字水印原型系统,其结构如图 3所示。
|
| 图 3 面向网络环境的地理空间数据水印原型系统 Fig. 3 Watermark prototype system for Geo-data oriented network environment |
在该原型系统中,算法1引用自文献,因此试验部分不再重复此部分工作,下面主要就面向网络环境的地理空间数据数字水印模型中算法2,即基于数据包的地理空间数据数字水印算法进行详细的试验,分析算法对降低数据质量及精度的性能和水印的抗差性。分3部分进行:可视化分析、误差分析和抗差性分析,试验用图为一幅808像素×758像素大小的彩色栅格地图。
4.1 可视化分析栅格地图嵌入水印信息后,对于非法用户来说,含水印栅格地图是不可用的,用户无法正常使用数据文件,而合法用户则可以通过授权的方式来移除水印信息嵌入给数据带来的影响,从而正常使用栅格地图。考虑到非法用户可以通过对含水印地理数据分析来进行相关处理,如逆置乱、解密、强行纠正数据参数等,以便能访问其所包含的数据信息。试验中对嵌入水印后的栅格地图进行逆置乱、解密、头文件相关属性参数纠正以访问数据文件,如下图 4 (a)和图 4 (b)为水印嵌入前后的栅格地图可视化效果,对其比较可以看出,嵌入水印后的栅格地图视觉上有很大程度的变化,在视觉上用户基本无法从含水印地图中获取相关地理信息。
|
| 图 4 水印嵌入前后对比 Fig. 4 Comparison of before and after embedding |
地理空间数据最重要的特性之一就是其具有精度特点,如果地理空间数据在嵌入水印信息后,其数据质量和精度发生较大改变,则会影响到使用者从地理空间数据中获取相关地理信息,从而控制用户对正确数据的访问权限。对相关纠正后的含水印栅格地图(图 4 (b)所示)与原栅格地图(图 4 (a)所示)进行误差比较统计;同时,水印信息的移除工作也是很重要的,这关系到用户所用地理空间数据的可信度,对移除水印信息后的栅格地图和原栅格地图进行误差比较。比较结果如表 1所示。
|
误差大小 (灰度变化) | 含水印信息的栅格 地图数据 | 移除水印信息后栅格 地图数据 | ||
| 数据点 个数/个 | 所占百 分比/(%) | 数据点 个数/个 | 所占百 分比/(%) | |
| 0 | 863768 | 47.01 | 1837392 | 100.00 |
| 0~50 | 53843 | 2.93 | 0 | 0.00 |
| 50~100 | 75840 | 4.13 | 0 | 0.00 |
| 100~200 | 255318 | 13.90 | 0 | 0.00 |
| 大于200 | 588623 | 32.04 | 0 | 0.00 |
从误差比较可以看出,水印信息嵌入所引起的数据变化很大,导致栅格地图数据质量和数据精度都有较大程度的降低,用户在使用含水印数据前,如果不进行移除水印信息等处理,则地图数据是不可信的甚至是不可用的,这样就有效地保护了数据所有者的版权利益。含水印栅格地图在进行移除水印操作后,与原栅格地图无误差变化,从而对地理数据的使用不会造成任何影响,这样就有效保护了数据合法使用者的使用权益。上述误差比较进一步地验证了:采用基于数据包的数字水印算法,含水印数据对于非法用户来说,由于水印信息的嵌入对栅格地理数据质量和精度造成了很大程度的破坏,所以数据对非法用户来说是不可用的,对于合法用户则通过授权的方式移除水印信息嵌入所引起的数据变化,使其能访问正确的栅格地理数据,从而有效实现了主动控制用户对所申请的正确数据访问权限的功能。
4.3 抗差性分析进一步地,对水印算法的抗攻击能力进行测试与分析。由于算法主要是对网络传输中的数据进行保护,而地理空间数据在网络环境下的传输、流通过程中是以数据包为单位进行组织的,数据包又由字节组成,因此这里攻击的对象是数据字节。具体采用随机增加字节、随机删除字节、裁剪字节段、移位字节等作为攻击手段,测试内容是在各种强度的攻击处理后对含水印数据进行相关检测,表 2为抗差性测试结果。
| 攻击方式 | 不同强度下的水印检测系数 | |||||
| 增加字节 | 字节增加比率/(%) | 50 | 40 | 30 | 20 | 10 |
| 水印系数 | 0.64(√) | 0.73(√) | 0.84(√) | 0.90(√) | 0.99(√) | |
| 删除字节 | 字节裁剪比率/(%) | 50 | 40 | 30 | 20 | 10 |
| 水印系数 | 0.66(√) | 0.79(√) | 0.85(√) | 0.93(√) | 1.0(√) | |
| 裁剪 | 字节删除比率/(%) | 50 | 40 | 30 | 20 | 10 |
| 字节段 | 水印系数 | 0.91(√) | 0.98(√) | 1.0(√) | 1.0(√) | 1.0(√) |
| 改变 | 字节改变比率/(%) | 50 | 40 | 30 | 20 | 10 |
| 字节值 | 水印系数 | 0.41(ⅹ) | 0.64(√) | 0.69(√) | 0.78(√) | 0.89(√) |
| 移位 | 移位字节数 | 7 | 6 | 5 | 3 | 1 |
| 字节 | 水印系数 | 1.0(√) | 1.0(√) | 1.0(√) | 1.0(√) | 1.0(√) |
由上述攻击测试后的水印相关检测结果可以看出,提出的算法不仅能对数据起到降低数据精度和数据质量的作用,同时对地理空间数据在网络环境下传输、流通过程中常见的字节丢失、字节移位和字节增删等攻击,算法也具有较好的抗差性。由于水印信息中包含有数据所有权、流向、使用权等相关信息,运用本算法就能正确判断出数据的版权和流向等信息。因此可知,基于数据包的数字水印算法有效地实现了标识地理空间数据流向的功能,水印算法能有效保护处于网路环境中的地理空间数据版权,并起到追踪数据非法流出源头的作用。但从表 2数据可以看出,算法抵抗较强幅度的修改字节值攻击的能力相对较弱。
5 结 论本文从网络环境下地理空间数据来源的多样性和数据传输的复杂性出发考虑,构建了一种面向网络环境的地理空间数据数字水印模型;通过分析网络环境中地理空间数据的传输特点,设计了一种针对数据包的水印算法。整体来说,本文的研究成果具有下列优势:
(1) 基于此模型,可将现有好的研究成果集成于水印算法库,实现对地理空间数据版权保护、使用跟踪作用。
(2) 基于数据包的数字水印算法,具有标识地理空间数据流向和主动控制用户对所申请的正确数据访问权限功能。
(3) 本文所提出的算法和模型,不受地理空间数据类型和数据特征限制,针对地理空间数据在网络环境中的流通适应性好。
试验表明,对于在网络环境中传输、流通的地理空间数据来说,本文作为一种面向网络环境的地理空间数据数字水印模型,研究成果对于地理空间数据的网络安全分发、数据访问权限控制、追踪数据流向等具有广泛的应用价值。
| [1] | SUN Shenghe, LU Zheming, NIU Xiamu, et al. Digital Watermarking Technique and Application [M].Beijing: Science Press,2004:10-14.(孙圣和,陆哲明,牛夏牧,等.数字水印技术及应用[M].北京:科学出版社,2004:10-14.) |
| [2] | ZHONG Hua, ZHANG Xiaohua, JIAO Licheng. Digital Watermarking and Image Authentication: Algorithm and Application[M].Xi’an:Xidian University Press,2006:1-2.(钟桦,张小华,焦李成.数字水印与图像认证:算法及应用[M].西安:西安电子科技大学出版社,2006:1-2.) |
| [3] | YANG Chengsong, ZHU Changqing. Research on Watermarking Algorithm Robust to Geometrical Transform for Vector Geo-Spatial Data Based on Invariant Function[J]. Acta Geodaetica et Cartographica Sinica, 2011, 2(40): 256-261.(杨成松, 朱长青. 基于常函数的抗几何变换的矢量地理数据水印算法[J], 测绘学报, 2011, 2(40): 256-261.) |
| [4] | NIKOLAIDIS N, PITAS I, SOLACHIDIS V. Fourier Descriptors Watermarking of Vector Graphics Images [C]//Proceedings of the International Conference of Image Processing. Vancouver: [s. n.], 2000:10-13. |
| [5] | MIN Lianquan. A Robust Digital Watermarking in Cartographic Data in Vector Format[J]. Acta Geodaetica et Cartographica Sinica, 2008,37(2):262-267.(闵连权. 一种鲁棒的矢量地图数据的数字水印[J]. 测绘学报, 2008,37(2):262-267.) |
| [6] | SOLACHIDIS V, NIKOLAIDIS N, PITAS I. Watermarking Polygonal Lines Using Fourier Descriptors[J]. IEEE Computer Graphics and Applications, 2004, 24(3): 44-51. |
| [7] | VOIGT M, YANG B, BUSCH C.Reversible Watermarking of 2D-vector Data[C]// Proceedings of the 2004 Multimedia and Security Workshop on Multimedia and Security. Magdeburg: [s. n.], 2004: 160-165. |
| [8] | WANG Xiangyang, YANG Hongying, WU Jun. Content-based Adaptive Discrete Cosine Transform Domain Watermarking Algorithm for Remote Sensing Image[J]. Acta Geodaetica et Cartographica Sinica, 2005,34(4):324-330. (王向阳, 杨红颖, 邬俊. 基于内容的离散余弦变换域自适应遥感图像数字水印算法[J]. 测绘学报, 2005,34(4):324-330.) |
| [9] | WANG Xianmin, GUAN Zequn, WU Chenhan. A Blind Algorithm with High Fidelity for 2-Dimension Secrete Infor mation Hiding in Remote Sensing Image[J]. Computer Engineering and Applications, 2004,13:2-5.(王贤敏,关泽群,吴沉寒.遥感影像高逼真度二维信息隐藏盲算法[J].计算机工程与应用,2004,13:2-5.) |
| [10] | ISMAIL I B, FARAH I R, AHMED M B. Satellite Images Watermarking Based on Wavelet Technique[C]//Information and Communication Technologies. Damascus:[s.n.], 2006: 1988-1993. |
| [11] | ZHU Changqing, REN Na. An Algorithm for Digital Watermark Based on Pseudo-Random Sequence and DCT for Remote Sensing Image[J].Geomatics and Information Science of Wuhan University, 2011.36(12):1427-1427. (朱长青, 任娜. 一种基于伪随机序列和DCT的遥感影像水印算法[J]. 武汉大学学报: 信息科学版, 2011.36(12):1427-1427.) |
| [12] | REN Na, ZHU Changqing, WANG Zhiwei. Blind Watermarking Algorithm Based on Mapping Mechanism for Remote Sensing Image[J]. Acta Geodaetica et Cartographica Sinica, 2011,40(5):623-627.( 任娜,朱长 青,王志伟. 基于映射机制的遥感影像盲水印算法[J]. 测绘学报, 2011,40(5):623-627.) |
| [13] | WANG Xun, ZHU Xiajun, BAO Hujun. Complementary Watermarking Algorithm for Digital Grid Map[J]. Journal of Zhejiang University: Engineering Science, 2006, 40(6): 1056-1059. (王勋, 朱夏君, 鲍虎军. 一种互补的数字栅格地图水印算法[J]. 浙江大学学报: 工学版, 2006, 40(6): 1056-1059.) |
| [14] | FU Haojun, ZHU Changqing, MIAO Jian, et al. Multipurpose Watermarking Algorithm for Digital Raster Map Based on Wavelet Transformation[J]. Acta Geodaetica et Cartographica Sinica, 2011,3(40): 397-400. (符浩军, 朱长青, 缪剑, 等. 基于小波变换的数字栅格地图复合式水印算法[J]. 测绘学报,2011, 3(40): 397-400.) |
| [15] | ZHU Changqing, FU Haojun, YANG Chengsong, et al. Watermarking Algorithm for Digital Grid Map Based on Integer Wavelet Transformation[J]. Geomatics and Information Science of Wuhan University, 2009, 34(5), 619-621. (朱长青, 符浩军, 杨成松, 等. 基于整数小波变换的数字栅格地图数字水印算法[J]. 武汉大学学报: 信息科学版, 2009, 34(5), 619-621.) |
| [16] | WANG Xiangyang, YANG Hongying, HOU Limin. A Digital Image Watermarking Scheme for Copyright Protection in DCT and DWT Domain[J]. Acta Geodaetica et Cartographica Sinica, 2006,35(3): 240-250. (王向阳, 杨红颖, 候丽敏. 一种用于版权保护的混合域数字图像水印算法[J]. 测绘学报, 2006,35(3): 240-250.) |
| [17] | LIU Shuiqiang, CHEN Jiye, ZHU Hongpeng. Information Disguising for Digital Elevation Model Data via Empirical Mode Decomposition[J]. Geomatics and Information Science of Wuhan University, 2008, 33(6):652-655.( 刘水强,陈继业,朱鸿鹏. 基于经验模式分解的数字高程模型数据伪装方法[J]. 武汉大学学报: 信息科学版,2008,33(6):652-655.) |
| [18] | LIU Xuchong, WANG Jianxin, LUO Yong. Lossless DEM Watermark Signature Based on Directional Wavelet [C]// 2nd International Congress on Image and Signal Processing. Tianjin:[s.n.], 2009:1-5. |
| [19] | ZHU Changqing, WANG Zhiwei, LONG Yi, et al. An Adaptive Watermarking Algorithm for DEM Based on DFT[C]//Proceedings of 24th International Cartographic Conference. Chile:[s. n.], 2009:11-19. |
| [20] | YANG C S, ZHU C Q, WANG Q S. Research on the Autocorrelation Detection in Digital Watermarking Technology[C]//Proceedings of the XXI International Congress for Photogrammetry and Remote Sensing, Beijing:[s. n.], 2008: 127-130. |


