2. 中国江苏 210000 江苏省地震局南京基准地震台;
3. 中国北京 100081 中国地震局地球物理研究所
2. Nanjing Standard Seismic Station, Jiangsu Earthquake Agency, Jiangsu Province 210000, China;
3. Institute of Geophysics, China Earthquake Administration, Beijing 100081, China
地磁活动性是范围广、分量多、种类繁、形态异、频谱宽、原因复杂的时变过程(徐文耀,2009)。科学家通过实测资料,利用系统的简便分类和指标,即地磁活动指数,对地磁活动性进行描述。地磁指数是描述某一时段内(世界时)地磁扰动强度的一种指标,其应用范围逐渐扩展到日地能量耦合计算、电离层—磁层—太阳风空间环境状态描述、空间环境监测、空间天气预报等相关领域(徐文耀,2009),不再仅是表征地磁活动现象的重要参数。
国家地磁台网中心提供地磁数据服务,每日定时获取各类指数数据并产出报告。但由于跨部门跨行业间信息交流的滞后与不完善,在一定程度上形成数据孤岛,既造成数据与应用之间的壁垒,也影响了科学决策和科研产出的时效性与可操作性,而每日指数报告也需要由人工获取相关数据后产出,存在大量重复劳动。因此,急需开发一套可以获取跨行业跨平台数据、可视化、流程化、低代码的技术系统,满足每日指数报告产出的科研需要。
本文从需求分析、系统设计与实现等方面,全面介绍基于数据专家软件的地磁台网指数报告产出系统,通过开发测试与应用实践,显示本系统可实现每日指数报告的自动化产出,减少了指数报告资料处理的工作量,避免了重复劳动,有效改善并解放更多生产力,提升工作效率。
1 数据中台与数据专家数据中台是数据与业务之间联系的纽带和中间层,可以理解为数据中台从数据的角度来梳理业务,用数据的思维对业务进行建模。数据中台定位于为各专业、各单位提供数据共享和分析应用服务。以数据分析与管理域为基础,沉淀共性数据服务能力,通过数据服务满足横向跨专业、纵向跨不同层级的数据共享、价值挖掘、分析应用和融通需求(李炳森,2019)。
数据专家(Datist)是一种服务于大数据时代的场景式(Context)数据分析与挖掘工具软件,通过组合可视化的节点来完成数据的获取、组织、清洗和有形化表达,能根据用户场景组织数据加工业务流程(顾基发,2010;李爱凤,2019)。数据专家设计遵循了零代码原则,包含各种功能节点,用户仅需要连接组合功能节点,进行乐高式开发,即可针对性地实现对多元数据的管理与信息挖掘。数据专家的3大特色优势在于:①可视化的流程设计,软件融合了可视化开发技术,通过组合节点来直观地控制数据处理流向;②具备多元数据访问能力,能够面向绝大多数主流数据库,还可以对接各类结构化或非结构化的数据文件、FTP服务器和网页内容;③多种输出形式,提供报表、图件和模型文件3种形式的有形化自定义式输出,方便输出结果的交流互享。
2 系统设计数据中台可以将地磁台网内部数据进行汇总、管理和使用。依托数据专家软件,实现地磁台网数据的采集、清洗、处理以及使用,以数据驱动产品服务,因此这样的流水线可称之为数据中台。基于数据中台的研发理念和数据专家软件的技术平台,梳理地磁台网指数报告涉及的业务需求,针对提出的业务问题进行业务到数据的问题转换,从数据层面进行地磁台网指数报告产出系统设计。使用统一的数据服务进行封装、开发和处理,借助数据专家软件的开发工具满足数据和应用的个性化需求,以实现数据应用的服务化。
2.1 需求分析国家地磁台网中心产出的地磁台网指数报告综合了地磁活动的重要参数与趋势,不仅用于地震行业,也为空间环境监测、国家电网、天气预报等行业领域提供辅助决策依据。地磁台网指数报告产出系统作为生成该类型科研报告的定制化业务平台,旨在进一步适应和推动地磁业务的发展需求,辅助地磁指数数据的多元异构融合、清洗加工、空间分析计算和图形化,实现地磁指数报告信息的自动收集、处理、推送。
通过需求调研,收集现有地磁台网地磁指数报告产品的数据来源、产出内容、报告格式等;针对新形式下报告内容的需求和产出设想,征集地磁产品相关资料使用的管理及预报等人员的需求,形成具有统一标准格式的产品报告。统计最终形成的产品需求,主要有:4个参考台站的7天K指数曲线图、红山台30天的K指数日总和直方图、国际地磁指数Dst指数近30天的数据图、地磁Kp指数日总和当月图、地磁Ap指数实测值和28天预测值、部分台站三分量日变幅最大值全国分布图。
2.2 系统设计基于数据专家平台,地磁台网指数报告产出系统自动化流程结构分为数据资源层、逻辑处理层以及成果表现层3部分(图 1),主要功能如下:①数据资源层:根据数据需要,从地磁台网中心及国内外权威网站选择自动获取相应数据;②逻辑处理层:获取汇总至指定数据库的数据资源,使用数据专家平台的节点操作进行自动化处理;③成果表现层:通过GMT、Python等接口绘制各类定制化产出的时间序列图、趋势图、空间分布图,等等,借助数据专家平台的报告自动生成技术,将成果整合,产出地磁台网指数报告。
本系统支持本地与服务器运行2种模式,通过定时触发或人工触发方式实现有关图件的产出,并通过微信完成产品报告的推送。
3 系统功能实现 3.1 数据获取地磁台网指数报告产出系统的数据来源于国家地磁台网中心的地磁备份数据库以及国内外3家行业网站的公开数据。借助数据专家平台的多源异构数据融合技术,可以访问和同步处理多种格式和结构的外部数据资源,不仅支持绝大多数数据库,也支持常见文本文件和空间数据,同时覆盖了FTP服务器、网页、磁盘目录等数据抓取采集方式。本系统使用数据专家的节点进行定向抓取和网页爬取,授权数据传输至本系统的数据库,并可以实现自动、定时采集获取。
3.2 数据处理地磁台网指数报告产出系统软件数据处理流程如下:通过数据读取与定时获取得到不同格式不同来源的数据,经格式转换,将数据格式统一后存入数据专家平台专用数据库,检查数据质量,并借助集成的专业软件进行数据清洗,生成多个图件,最终整合为一份地磁台网指数报告,具体流程见图 2。
地磁台网指数报告产出系统的数据专家平台处理流程如下:通过连接和组合各种功能节点,进行低代码、乐高式的开发,本系统设置了一系列数据清洗的处理节点,不仅使用其内置的数据处理函数,还充分利用了数据专家平台所提供的强大的算法集成能力,通过内置的开放接口与DLL、Matlab等常用的算法库集成起来,使用Python节点无缝对接Python程序,借助专业成熟的算法扩展了本系统的专业数据处理能力,实现地磁指数数据的加工与清洗,将原始的数据资源加工成为系统需要的数据。开发人员无需进行复杂的语法代码学习,使用现成的基础组件进行功能组合,从而直观、快速、智能地实现从数据到业务的需求。对于研发人员而言,低代码、乐高式的开发可以节约更多研发时间,提升工作效率;对于使用人员而言,地磁指数数据程式化的繁琐处理工作由每日大量时间的重复工作变为自动化、智能化处理,降低了工作量,提高了产出效率。
3.3 图件生成与报告发布本系统设置了一系列节点,利用数据专家平台内置的空间数据分析功能和可扩展的图形绘制技术进行图件绘制。指数报告中的子午链台站日变幅最大变幅分布等图件均使用Python等节点进行自定义绘制与二次开发。系统最终产出6个图件,通过自动生成技术汇集成完整报告,而数据来源固定、制作格式规范的研究报告可以借助数据专家平台的自动生成报告功能完美解决。
本系统设置了一组节点,用以把PPT形式的地磁指数报告直接推送给用户,可以利用Webchat节点将报告发送到微信企业号/企业微信(图 3),也可以通过预设邮箱列表发送到指定邮箱。产品成果主要以指数报告的形式对不同需求人群进行推送,考虑到不同行业对指数报告的产出所需不同,系统可针对具体需求进行定制化处理。
地磁数据产品服务于地震系统内各台站、省地震局、研究所等单位,及时收取地磁台网产出的全国性地磁数据产品,有助于日常工作的开展。可与其他系统部门合作,将地磁数据产品应用于电力、石油、交通、空间天气预警等领域。地磁数据及磁暴数据可以满足上述领域防灾减灾的一定需求。
依托本系统,可将现阶段占用总工作时间80%的数据收集、整理、清洗、绘图、报告编写等繁杂的工作,转换成可在本地和服务器模式下自主运行的可视化智能化业务流程,避免了每日耗时耗力的重复性劳动,显著减轻了科研人员的工作量,提升了工作效率。本系统可按照预设流程自动触发运行机制,每日9时完成数据下载、处理、模型计算、成图和报告产出,并将地磁指数报告发送至系统和业务人员的移动客户端,实现跨平台和跨终端通信。本系统充分利用了多平台多行业数据资源,实时便捷地获取数据和产出成果,方便相关部门及用户及时了解磁情指数的变化,便于辅助应用人员进行实时响应、快速研判及精准决策,优化了服务能力。
陈石老师及其团队和地磁学科专家对本项目予以大力支持,并提出宝贵意见和建议,在此表示诚挚谢意。
顾基发, 宋武琪, 朱正祥. 2010. 综合集成方法与专家挖掘[J]. 前沿科学, 4(4): 35-41. |
李爱凤, 梁碧允, 李晓丹. 2019. 基于学生一卡通消费大数据的贫困生挖掘分析[J]. 计算技术与自动化, 38(2): 130-134. |
李炳森, 胡全贵, 陈小峰, 高秉强. 2019. 电网企业数据中台的研究与设计[J]. 电力信息与通信技术, 17(7): 29-34. |
徐文耀. 2009. 地磁活动指数的过去、现在和未来[J]. 地球物理学进展, 24(3): 830-841. |