2. 湖南涉外经济学院信息科学与工程学院. 长沙 410205;
3. 中南大学交通运输工程学院. 长沙 410013
2. School of Information Science and Engineering, Hunan International Economics University, Changsha 410205, China;
3. School of Traffic and Transportation Engineering, Central South University, Changsha 410013, China
广域电磁勘探是基于广域电磁法理论形成的一种新的电磁勘探技术(何继善,2010;鲍力知,2013),由于理论及技术比较新,与此相关的勘探仪器设备(蒋奇云,2010;裴婧,2010)、数据处理软件等均还在不断发展中.在地球物理勘探、测绘等领域中,需要对原始数据进行预处理及各种分析,采取直接观察数值的方式无法得到数据形态的直观信息,因此,数据分析时一般要对数据进行可视化,并在可视化的环境中分析和处理数据(Laurentiu ASIMOPOLOS等,2010;蔡军涛等,2010;汤井田等,2012;冯威等,2013).为提高数据处理效率,一般都期望在一个集成的软件系统中对勘探数据进行处理和解释,因此,自主开发集成化的数据处理和解释软件系统非常必要(底青云等,2013).
目前广域电磁勘探数据预处理环节没有专用的预处理软件,勘探生产得到的原始数据采用Surfer电子表格以及文本编辑等手段进行手工预处理,存在处理步骤多、手工操作繁复、可视化程度低、处理效率低等问题.为解决广域电磁勘探数据处理无专用软件而导致的上述问题和不足,我们设计和开发了一套可视化预处理软件,软件名称为:GDC VDAE,GDC为广域电磁的拼音首字母,用于广域电磁法相关的仪器设备和专用软件系统的命名,VDAE是Visual Data Analysis and Edit的缩写,即可视化数据分析与编辑.本软件中未使用任何的第三方提供的二次开发SDK,所有功能代码均为自主开发,具备完全的自主知识产权(目前正在申报著作权,未申报专利).软件在重新设计勘探采集的原始数据文件格式的基础上,专为解决广域电磁勘探数据预处理而开发的一个实时数据可视化、交互式的数据预处理软件.软件采用MVC(Model View Controller)模型-视图-控制模式构架(维基百科,2013),完全面向对象思想设计和实现,以C++ 语言开发,开发环境为C++ Builder6.0,并在程序中广泛使用C++ STL(Standard Template Library)标准模板库(维基百科,2013)提供的泛型数据类型.
1 采集数据存储格式设计
为实现采用多样本采集模式提高数据质量的要求,广域勘探接收设备在每个频点计算多个测量样本值,每个样本包含电场强度和相位等信息,所有计算的样本结果均保存在采集到的原始数据文件中.我们重新设计了勘探采集的原始数据格式(定义为CSD格式,Calculated Structured Data,计算后的结构化数据),统一了数据采集软件和预处理软件的数据接口.此文件格式采用ASCII编码纯文本方式存储数据,工作信息和数据分节组织,文件内分为四节,分别为:文件类型([FILE_TYPE])、工作信息([WORK_INFO])、数据模式([DATA_SCHEMA])和数据集([DATA_SET]),其中前三节为文件头部(包含文件格式标记、勘测工作信息和数据集模式信息),最后一节存储所有采集到的原始数据(柳建新等,2012).文件格式说明见表 1.
![]() |
表 1 CSD数据文件格式说明表 Table 1 CSD data file schema table |
CSD数据文件格式设计的优点有:(1)可以根据数据解释的需要,灵活设置采集不同数据量的样本数据,扩展方便;(2)可以在同一测点进行多次采集,然后将多次采集得到的多个CSD数据文件合并到一个CSD文件中,方便分析处理与存储管理;(3)采用采用ASCII编码纯文本方式存储,使得数据具有更好的通用性和可移植性.
2 软件设计与实现
本预处理软件集成广域电磁勘探数据预处理中所需要的全部功能,在完全图形化的环境中采用实时交互式操作,实现对勘探原始数据的分析和编辑,并结合一些自动处理功能进行辅助.总体上,需要具备以下功能(谢维等,2009):
(1)勘探数据文件的存取(读入和保存);
(2)将测点多次探测的数据文件进行合并;
(3)建立测点频率曲线坐标系(支持在线性坐标和对数坐标之间任意切换);
(4)建立单频点数据集可视化坐标系;
(5)双坐标系同屏显示测点频率曲线和某频点(热点)数据点集分布;
(6)单频点数据点集坐标系中可实时显示均值线、数值分布范围、相对均方误差线、数据分布直方图、拟合直线(斜率图例)等;
(7)具有水平或垂直方向参考线功能,可手工移动参考线位置,以剔除线外数据;
(8)具有频点数据集排序、恢复原顺序功能;
(9)具有粗大误差自动分析及剔除功能;
以上功能需要集成到一个软件系统中,以方便直观的方 式提供给使用者操作使用.目前完成的功能模块如图 1所示.
![]() | 图 1 软件功能模块图 Fig. 1 Function modules chart of software |
软件采用MVC模式设计软件,提高软件的重用性、易维护性和扩展性.MVC(Model View Controller的简称)是一种软件设计典范,用于组织代码用一种业务逻辑和数据显示分离的方法,典型的MVC模式的软件框架如图 2所示.在软件程序中广泛采用C++ STL标准模板库,构造各种复合数据结构.STL(St and ard Template Library的简写)是由惠普实验室开发的一套标准的泛型数据结构及相关操作的类库,已经成为C++标准中的一部分.利用STL提供的容器(包括vector(向量)、list(列表)、set(集合)和映射(map)),能够方便而高效地构造出开发者需要的复合数据结构.STL内部以指针方式实现数据结构的相关操作,能够提供很好的数据结构操作效率.比如使用vector定义的双精度向量,相当于一个传统的双精度浮点型的动态数组,可通过下标或迭代器简便而高效的访问其每个元素,并可通过STL提供的算法或容器自带的方法对其进行高效的操作(如查找、插入或删除元素等),在获得良好的便利性和高效率的同时,大大地减少了数据结构实现的程序代码编写量,同时,STL内部实现对动态内存的申请和释放进行管理,无需程序员考虑复杂而易出错的内存管理.
![]() | 图 2 MVC模式软件基本框架 Fig. 2 Basic architecture of MVC pattern software |
2.1 CSD数据文件合并
广域电磁勘探工作时,预先将需要观测的频率进行编组,每个频组(一般为7个频点)按2n组合频率(如128,256,512,1024,2048,4096,8192为一个频组).工作时发送机和接收机在相同的频组下工作,每个测点要获得从高频到低频的广域频率信号数据,则需要依次选择不同的频组进行发送和接收采集.为提高观测信号的可信度,需要在每个频率采集多个样本,甚至对某个频组进行多次数据采集.多频组依次工作时,需要分多次采集不同频组的信号数据.每次采集操作均为独立操作,采集到的数据保存在一个单独的CSD原始数据文件中,单个测点的多次采集,得到测点采集的多个CSD原始数据文件.为便于对测点数据进行分析和预处理,软件具有测点数据合并功能,通过读取CSD数据文件头部中保存的勘测工作信息和数据模式定义,将同一采集设备 在不同频组时分多次采集到的多个CSD原始数据文件进行合并,合并为每个测点单一的CSD数据文件,在接下来对单个测点数据进行分析与编辑时,只需调取合并后的单个CSD数据文件即可.由于CSD文件格式的可伸缩性,合并后的CSD文件内部格式仍然不变,只是描述信息和数据集中的样本量发生了变化,此特性使得CSD文件可多次合并.
![]() | 图 3 CSD数据文件合并功能示意图Fig. 3 Function sketch map of CSD data file merge |
2.2 数据图形化设计与实现
软件采用C++ Builder 6.0为开发环境,采用C++ Builder提供VCL(Visual Component Library)可视化组件库(维基百科,2013)实现基于窗体的基本用户界面的构建,并借助VCL提供的二维图形库实现图形的绘制,除此之外,软件中的坐标系变换、数据可视化计算、统计指标图形化、交互操作与计算等均为自主开发的C++代码实现.对于坐标系和数据图形化绘制等需要实时计算并绘制到屏幕的功能,程序中均采用双缓冲(江建国等,2012)机制实现,即先将计算结果在内存位图上绘制好,然后将内存位图中的内容复制到窗体表面,避免了在交互操作实时绘制时窗体产生闪烁感,程序实现后效果良好.
系统主要功能模块之间的关系如图 4所示.
![]() | 图 4 数据可视化及交互操作功能模块关系示意图 Fig. 4 Sketch map of data visualization and interactive operation modules |
软件主界面采用双坐标系加控制面板模式(如图 5所示).在主工作区中建立双坐标系,上部坐标系用于实时显示多个测点的频率数据曲线(经测试在同时显示上个测点的频率曲线时,交互操作时无延时).根据广域电磁法的频率特性,X和Y轴坐标刻度均采用对数坐标(软件中实现X、Y轴独立在对数坐标和线性坐标之间的实时任意切换).下部坐标系用于实时显示在上方频率曲线中选择的某个频点包含的数据样本集,采用线性坐标系(X为数据点索引号,Y为数据值).为便于观察和分析样本集,在坐标系区域中除以图形化方式显示显示样本集数据点外,同时还图形化显示样本集相关的统计信息,包括数据均值线、相对均方误差条、数据分布直方图、数据拟合直线以及拟合直线斜率图例等.控制面板位于主界面右侧,包含两个选项页面,一个页面显示当前打开的数据文件列表(可通过单击、双击以及勾选等方式控制频率曲线的选取、热点选择和曲线显示/隐藏),另一页面用于设置频率曲线坐标模式以及图形化外观相关选项.
![]() | 图 5 软件主界面视图 (a)控制面板为测点曲线列表;(b)控制面板为坐标模式及可视化化外观选项.Fig. 5 Main work view of this software (a)Prospecting points list in control panel;(b)Coordinate system mode and visual options in control panel. |
2.3 数据处理功能设计与实现
为了对大量的勘探生产数据进行快速分析和预处理,软件集成了自动数据处理和图形化手工交互式操作两种处理方式.自动数据处理功能包括排序、恢复原序、数据平滑、粗大误差剔除等功能,其中粗大误差剔除是数据预处理中一个关键的基础功能,软件中除集成莱伊达、格拉布斯、狄克逊等经典方法(马宏等,2009)外,还集成两种自主提出的自动处理算法(其中一种方法正在申请专利).除自动处理功能外,软件中实现的图形化手工交互式操作为数据处理提供一种直观、简便的交互式数据处理方式,其中参考线交互式剔除操作与凤凰公司V5-2000配套的数据处理软件中的MTEditor功能类似(凤凰公司,2007).
在采用图形化手工交互式操作方式时,可在水平或垂直双参考线两种模式下操作,参考线直观地显示在频点数据集坐标系中,可通过鼠标拾取并实时拖动任意一条参考线以分析参考线内数据统计信息,或剔除参考线外的数据点(软件界面如图 6所示).参考线拖动时实时计算并显示参考线外和线内数据点的分析信息包括剔除数据点个数/比率、线内数据均值线、线内数据均方差、线内数据分布直方图、线内数据拟合直线及斜率图例等,并可将线内数据集的均值实时反映到测点频率曲线坐标系中对应频点的坐标位置,使得在手工交互处理时能够实时分析和处理某频点的数据集,通过鼠标拖动参考线的方式实现最优的误差数据剔除处理.
![]() | 图 6 手动交互式粗大误差剔除操作界面图 (a)水平参考线模式;(b)垂直参考线模式.Fig. 6 User interface of manual interactively gross error kick-out operation (a)Horizontal reference lines mode;(b)Vertical reference lines mode. |
在数据自动处理和手工处理分析时,往往需要对原始数据集进行排序,而数据集中各个数据点的位置与其采集时间相关(按时间顺序采集),为保留采集时间顺序信息,在处理或分析完成后,需要将已排序的数据集恢复为原顺序.软件中普遍采用一种简单的数据结构有效地解决数据排序和恢复原序功能.定义数据点元素的基本结构为(C语言结构体):
typedef struct
{
doubleval;
int index;
}complex_float; // 数据元素结构
typedef vector
结构体定义中val域存放数据点的数值,index域存放数据点的原始位置索引号,再采用STL中的vector容器定义数据点向量(相当于动态数组).
在读入原始要处理的数据集时,按原始顺序设置数据元素的 index域,在排序时以val域大小为依据进行排序,即实现数据集按数据大小排序,便于算法处理和分析.在需要存储或以数据原序观察数据时,再以index域大小为依据进行排序即可恢复数据集的原序.
3 处理实例分析
广域电磁法勘探能够在相对较短的工作时间内获得更多的频率信息,同时,为获得更好的数据质量,往往增加采集时间以获得更多的勘探样本数据,采集到的数据量也随之增长,向数据预处理的效率提出了挑战.以近期完成的甘肃玉门老君庙地区油气勘探项目的实际生产数据为例,对软件的功能和效果进行说明和评价.
3.1 湘西花垣县页岩气勘探数据处理实例 湘西北地区是湖南省页岩气勘探的一个重要区块,勘探范围覆盖花垣、保靖、永顺等几个县,测线长度一般为几公里至几十公里(一条较长测线长40公里),测点距离一般为100米左右,勘探深度为3千米,此区块为山区地形,地形起伏较大,因此现场勘探施工难度较大.以每个测点只进行一次6个频组的勘探(每个频组包含7个频率),则每个测点至少产生6个数据文件.在干扰较强的情况下,一般对每个测点的各个频组均进行2~6次采集操作(中低频组至少两次),因此,在实际勘探生产时,每个频点的数据文件数目为6~60个,每公里约60~600个数据文件,若每天完成两公里勘探,则数据量约120~1200个原始数据文件,要完成这样规模的数据预处理,若不采用专用的预处理软件,将会极大的影响勘探生产的工作效率.
以花垣第13号测线,第113至118号测点(6个生产测点,1个检查点)实际勘探数据为例,说明处理过程.本例中测点干扰较弱,因此每个测点的每个频点只采集一次,共采集到42个原始数据文件.经过原始数据文件合并,可视化数据预处理以及生成视电阻率计算文件三个步骤,完成对勘探数据的预处理,如图 7所示.
在此例中,通过使用本软件一方面提高了大批数据的处理效率,另一方面,在数据可视化的环境中实时交互地完成对数据的粗大误差处理,经过使得处理完成后的频率曲线变化平缓(如图 7中的(d)和(e)所示).在实际操作中对数据的粗大误差处理采用了自动处理结合手动调整的方式进行,自动或手工方式处理过程中只判别并剔除部分粗大误差数据点,对所有原始数据值无任何修改.本例中对0.0625 Hz以上频率采用自动处理方式剔除粗大误差,而0.0625 Hz及以下低频部分则采用手工方式进行处理,最终达到了满意的处理效果,处理过程部分操作如图 8所示.
3.2 甘肃省玉门地区石油气勘探数据处理实例 在甘肃玉门地区采用广域电磁法进行油气资源勘探,勘探区域地形较为平,其它情况花垣页岩气勘探大致相似.此勘探项目也使用本软件进行勘探原始数据预处理,处理效率和效果与花垣页岩气勘探基本相同.
以玉门第229号测线,第140至145号测点(6个测点)实际勘探数据为例,说明处理过程,如图 9所示.
3.3 实例小结 在采用本软件前,每个勘探生产小组完成5个测点的数据处理,约需要2.5个小时,采用本软件后,在数据量增加的情况下,每小组可在1个小时内完成数据预处理(包括人工检查频率曲线形态,自动和手工剔除粗大误差等),提高数据预处理效率1.5倍以上.同时,由于增加了采集数据样本量,并通过自动处理算法和直观的图形化手工交互式处理对粗大误差进行了剔除,使得预处理后的数据质量也得到了大幅的提高.
4 结 论
本软件的开发和应用,使得广域电磁勘探法在数据预处理环节有了专用的预处理软件,衔接了数据采集到数据解释的中间环节,较大地提高了数据预处理过程的工作效率,并提高了预处理后的数据质量.通过使用本软件,使得广域电磁法在实际勘探生产时,能够更好的运用通过采集更多的数据样本来获得更准确的地下信息这种工作方式,以发挥方法和仪器设备更好的潜力,为后续的数据解释提供更加可靠的数据基础.本软件具有运行稳定,占用计算机资源少,数据图形化和交互操作实时性好等特点.
目前广域电磁勘探运用于生产勘探还处于成长期,本软件只解决了原始数据采集后的预处理环节的问题.一方面,软件自身尚有不断完善和发展的空间;另一方面,随着方法和仪器设备的不断发展,软件也需要不断发展与之匹配,同时,还需要与数据采集以及数据解释软件实现更好的集成.相信广域电磁法的发展日新月异,数据处理软件也将不断发展成熟.
图 7 湖南省湘西北地区页岩气勘探生产数据预处理过程截图
Fig. 7 Preprocessing example of shale-gas prospecting data in Huayuan county area of Hunan province 图 8 粗大误差处理过程示例图
Fig. 8 Sample pictures of gross error h and le procedure 图 9 甘肃玉门地区油气勘探生产数据预处理实例
Fig. 9 Preprocessing example of oil-gas prospecting data in Yumen area of Gansu province
[1] | BAO Li-zhi.2013.Main features of WFEM[J].Guizhou Geology,30(1):9-13.doi:10.3969/j.issn.1000-5943.2013.01.002. |
[2] | CAI Jun-Tao,CHEN Xiao-Bin.2010.Refined techniques for data processing and two-dimensional inversion in magnetotelluric Ⅱ:Which data polarization mode should be used in 2D inversion[J].Chinese J. Geophys.(in Chinese),53(11):2703-2714. |
[3] | DI Qing-yun, FANG Guang-you, ZHANG Yi-ming.2013.Research of the Electromagnetic Prospecting(SEP) System[J].Chinese J. Geophys.(in Chinese),56(11):3629-3639.doi:10.6038/cjg20131104. |
[4] | FENG Wei,HUANG Ding-Fa,LI Meng et al.2013.Ground motion monitoring during strong shake with high-rate GPS double-differenced residual model[J]. Chinese J. Geophys.(in Chinese),53(9):3022-3028.doi:10.6038/cjg20130915. |
[5] | HE Ji-shan.2010.Wide Field Electromagnetic and Pseudo Random Signal electrical method[M].Beijin,Higher Education Press (HEP). |
[6] | HE Ji-shan.2010.Wide field electromagnetic sounding methods[J]. Journal of Central South University (Science and Technology),41(3):1065-1072. |
[7] | JIANG Qi-yun.2010.Study on the key technology of wide field electromagnetic sounding instrument[D][Ph.D.thesis]. Changsha:School of Geosciences and Info-Physics, Central South University. |
[8] | PEI Jing.2010.Hardware design and implementation of receiver instrument of wide field electromagnetic method[D][Master thesis]. Changsha:School of Geosciences and Info-Physics, Central South University. |
[9] | Laurentiu ASIMOPOLOS,Agata Monica PESTINA,Natalia Silvia ASIMOPOLOS.2010.Considerations on Geomagnetic Data Analysis[J].Chinese J. Geophys.(in Chinese),53(3):765-772. |
[10] | LIU Jian-xin,LIU Chun-ming,MA jie et al.2012.Research of file head format of V5-2000 Magnetotelluric sounding instrument[J].Computing Techniques for Geophysical and Geochemical Exploration,29(4):359-362.doi:10.3969/j.issn.1001-1749.2007.04.018. |
[11] | MA Hong,WANG Jin-bo.2009.Instrument Precision Theory[M].Beijin:Beihang University Press,80-87. |
[12] | TANG Jing-Tian,XU Zhi-Min,XIAO Xiao et al.2012.Effect rules of strong noise on magnetotelluric(MT) sounding in the Luzong ore cluster area[J].Chinese J. Geophys.(in Chinese),55(12):4147-4159.doi:10.6038/j.issn.0001-5733.2012.12.027. |
[13] | XIE Wei,LIU Jian-xin,ZHANG Dong-feng, et al.2009.Development of magnetotelluric data processing software based on VC++[J].Progress in Geophys.(in Chinese),24(6):2242-2249.doi:10.3969/j.issn.1004-2903.2009.06.044. |
[14] | JIANG Jian-guo,WEN Shao-ying,ZHANG Rui-nan.2012.Flicker-free GDI+ drawing based on double buffering[J].32(S2):136-139. |
[15] | 鲍力知.2013.广域电磁法的主要特点[J].贵州地质,30(1):9-13.doi:10.3969/j.issn.1000-5943.2013.01.002. |
[16] | 马宏,王金波.2009.仪器精度理论[M].北京:北京航空航天大学出版社,80-87.. |
[17] | 蔡军涛,陈小斌.2010.大地电磁资料精细处理和二维反演解释技术研究(二)-反演数据极化模式选择[J].地球物理学报,53(11):2703-2714. |
[18] | 底青云,方广有,张一鸣.2013.地面电磁探测系统(SEP)研究[J].地球物理学报,56(11):3629-3639.doi:10.6038/cjg20131104. |
[20] | 冯威,黄丁发,李萌,等.2013.高频GPS双差残差模型监测强震地表运动[J].地球物理学报,56(9):3022-3028.doi:10.6038/cjg20130915. |
[21] | 凤凰公司.2007.数据处理用户手册[M].加拿大凤凰地球物理有限公司. |
[22] | 何继善.2010.广域电磁测深法研究[J].中南大学学报(自然科学版),41(3):1065-1072. |
[23] | 江建国,温少营,张瑞楠.2012.基于双缓冲技术的GDI+无闪烁绘图[J].计算机应用,32(S2): 136-139. |
[24] | 蒋奇云.2010.广域电磁测深仪关键技术研究[D][博士论文].长沙:中南大学地球科学与信息物理学院. |
[25] | Laurentiu ASIMOPOLOS,Agata Monica PESTINA,Natalia Silvia ASIMOPOLOS.2010.地磁数据分析的一些思考[J].地球物理学报,53(3):765-772. |
[26] | 柳建新,刘春明,马捷,等.2012.V5-2000大地电磁测深仪文件头数据格式研究[J].物探化探计算技术,29(4):359-362.doi:10.3969/j.issn.1001-1749.2007.04.018. |
[27] | 裴婧.2010.广域电磁接收机硬件设计与实现[D][硕士论文]. 长沙:中南大学地球科学与信息物理学院. |
[28] | 汤井田,徐志敏,肖晓,等.2012.庐枞矿集区大地电磁测深强噪声的影响规律[J].地球物理学报,55(12):4147-4159.doi:10.6038/j.issn.0001-5733.2012.12.027. |
[29] | 裴婧.2010.广域电磁接收机硬件设计与实现[D][硕士论文]. 长沙:中南大学地球科学与信息物理学院. |
[30] | 汤井田,徐志敏,肖晓,等.2012.庐枞矿集区大地电磁测深强噪声的影响规律[J].地球物理学报,55(12):4147-4159.doi:10.6038/j.issn.0001-5733.2012.12.027. |
[31] | 维基百科.2013.Model-view-controller[OL]http://en.wikipedia.org/wiki/Model%E2%80%93view%E2%80%93controller. |
[32] | 谢维,柳建新,张东风,等.2009.基于VC++大地电磁数据处理软件开发[J].地球物理学进展,24(6):2242-2249.doi:10.3969/j.issn.1004-2903.2009.06.044. |