空间VLBI数据记录格式RDF解析与数据解码
张浩1,2, 张娟1,4, 刘磊1,4, 郑为民1,3,4, 芮萍1     
1. 中国科学院上海天文台, 上海 200030;
2. 中国科学院大学, 北京 100049;
3. 中国科学院射电天文重点实验室, 江苏 南京 210008;
4. 上海市导航定位重点实验室, 上海 200030
摘要: 空间甚长基线干涉测量(Very Long Baseline Interferometry,VLBI)由于基线更长,在相同的观测频率下,可获得比地基甚长基线干涉测量更高的分辨率。我国正在推进空间甚长基线干涉测量科学与技术研究。俄罗斯RadioAstron空间甚长基线干涉测量项目于2018年结束,其成功经验可以借鉴。该项目采用不同于常规地面甚长基线干涉测量的专用数据格式RDF(RadioAstron Data Format)记录观测数据,利用配备的星载或地面上行氢原子频标提供频率基准,数据经采集量化后传输至地面站,打上时标并记录于硬盘。为处理RadioAstron数据,分析了RDF格式,完成了RDF数据解码及相关处理,然后对比分析了Mark5B、VDIF等地面甚长基线干涉测量通用数据格式和RDF格式的特点,为我国未来空间甚长基线干涉测量数据格式设计与处理积累经验。
关键词: 空间VLBI    RDF格式    数据解码    Mark5B    
A Study of Space VLBI Data Recording Format -RDF and Its Data Decoding
Zhang Hao1,2, Zhang Juan1,4, Liu Lei1,4, Zheng Weimin1,3,4, Rui Ping1     
1. Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China;
2. University of Chinese Academy of Sciences, Beijing 100049, China;
3. Key Laboratory of Radio Astronomy, Chinese Academy of Sciences, Nanjing 210008, China;
4. Shanghai Key Laboratory of Navigation and Positioning, Shanghai 200030, China
Abstract: Compared with ground VLBI, space VLBI provides higher angular resolution since its baseline is much longer. Our country has started the development of our own space VLBI science and technology. Russian space-VLBI project RadioAstron was finished in 2018. We can learn a lot from its successful experience. This project, which is quite different from ground-VLBI, uses a dedicated data format Radio Astron Data Format (RDF). Besides, the frequency reference is provided by the on-board or ground-based uplinking hydrogen atomic frequency standard. The data is quantized and transferred to the ground station, and is then labeled with time-tag and recorded in the hard disk. In this paper, we analyze the RDF format, carry out RDF data decoding and VLBI correlation. Moreover, we compare RDF with other commonly used VLBI data format, e.g., Mark5B and VDIF. Our work will pave the way for the format designing and data processing of space-VLBI data in China.
Key words: Space VLBI    RDF format    Data decoding    Mark5B    

甚长基线干涉测量技术是目前角分辨率最高的天文观测技术,在天文观测、大地测量和深空探测等领域得到了广泛的应用[1],其分辨率取决于天线的口径和两天线之间的基线长度。随着甚长基线干涉测量科学研究与火星探测等工程任务的推进,对空间分辨率提出了越来越高的要求。为进一步提高甚长基线干涉测量网的空间分辨率,需要增加基线长度。受地球尺度的限制,地面VLBI基线长度无法超过地球直径,因此,对空间甚长基线干涉测量(Space Very Long Baseline Interferometry, SVLBI)技术的研究变得越来越迫切。

早在20世纪80年代初,欧洲空间局和美国国家航空航天局联合提出QUASAT(QUASARSATELLITE)计划的立项建议,计划在太空放置一个15 m口径的天线,并在预研阶段就空间甚长基线干涉测量的技术要求、观测性能、数据分析成图能力及预期科学目标等做了广泛研究,为后来的空间甚长基线干涉测量发展提供了经验[2]。随后1986~1988年间,美国国家航空航天局利用TDRSS(Tracking Data and Relay Satellite System)测控中继卫星上的4.9 m天线和地面上的两个64 m射电望远镜对一批致密河外射电源在2.3 GHz和15 GHz频率进行了3次甚长基线干涉测量,大部分源检测到干涉条纹,证实了空间甚长基线干涉测量技术的可行性[2]。在此期间,前苏联提出RadioAstron计划,受到苏联解体的影响,该项目曾中断执行,后于2010年恢复并正式进行空间甚长基线干涉测量发射及观测任务。日本也于1997年2月提出HALCA(Highly Advanced Laboratory for Communications and Astronomy)空间干涉测量计划,首次提供了空间甚长基线干涉测量多望远镜成图观测条件,旨在实现活动星系核和射电源的高分辨率成图[2]

目前只有日本和俄罗斯完成了正式的空间甚长基线干涉测量项目。上海天文台正在推进我国空间甚长基线干涉测量发展,其中“空间低频射电天文台”项目,计划发射两个大口径低频射电望远镜至近地空间,形成地-空、空-空干涉能力。地月甚长基线干涉测量计划也在推进中。由于空间与地面环境的巨大差异,空间甚长基线干涉测量研究存在一些亟待解决的问题,比如,怎样保持空间射电望远镜和地面跟踪站之间稳定的信号链接,如何建立实用有效的空间甚长基线干涉测量时延模型等。本文主要讨论空间甚长基线干涉测量数据终端记录格式的问题,通过对RadioAstron原始观测数据开展研究,解析其数据记录格式,完成数据解码,使之能够与地面观测数据进行相关处理。现阶段,国际上使用的地基甚长基线干涉测量格式有很多种,而空间甚长基线干涉测量格式(如RDF)只有日本和俄罗斯在使用。

Mark5B数据格式是美国麻省理工学院Haystack天文台设计的数据终端记录格式,采用硬盘存储数据,存储成本低,便于通过互联网传输,并促进了e-VLBI技术的发展。Mark5B格式严格遵守VSI-H(The VLBI Standard Interface Hardware Interface Specification)规范,能够兼容所有采用VSI接口的数据记录格式,有效降低了数据记录硬件设施更新的频率[3]。Mark5B格式数据分为多个磁盘帧,每帧由固定大小的帧头和紧随其后的数据块组成,帧头包含同步字、循环冗余校验码(Cyclic Redundancy Check, CRC)、秒内帧号和起始协调世界时等信息,能够有效保证数据的安全性[4]。由于存在丢帧、乱帧的现象,为监测数据的质量,Mark5B需要每秒统计一次数据有效率,作为数据可靠性和网络诊断的参考[4]。中国甚长基线干涉测量网的5个台站均使用上海天文台自行研制的中国数据获取系统(ChinaData Acquirement System, CDAS)[5]。CDAS采用Mark5B格式记录原始观测数据,已成功完成了中国探月工程任务。

VDIF(VLBI Data Interchange Format)是一种新的标准化数据交换格式,支持实时和准实时e-VLBI以及磁盘文件存储[6]。VDIF格式基于自适应长度的数据帧制定,帧头携带帧起始时间、帧长和线程号等关键信息,数据帧长度由帧头中的帧长指定,用户可以自由设定数据帧长度,以最佳地匹配所选择的数据传输协议[6]。例如,在实时网络传输情况下,适当选择数据帧的长度使得每个线上数据包只携带一个数据帧。另外,VDIF还支持多线程。同一频率通道的时间序列数据帧存储在同一线程,不同频率通道的数据存储在多个并行的数据线程。对于通过串行网络的数据传输,多个并行的数据线程合并为单个串行的数据流[6]。很明显,VDIF的优势在于数据网络交换和数据兼容性,但目前支持VDIF格式的设备不多,应用受到限制。

俄罗斯空间甚长基线干涉测量项目RadioAstron采用RDF格式用于地面数据采集。由于RadioAstron没有搭载大容量存储设备,采集的空间甚长基线干涉测量数据必须实时发送至地面。实际上,空间射电望远镜数据采集包含空间天线和地面跟踪站两部分。空间天线负责接收原始观测信号,地面跟踪站负责锁定空间天线的下行信号,实时采集空间天线发送的数据并以RDF格式记录。

VSOP和RadioAstron的空间甚长基线干涉测量射电望远镜系统,采用了不同于常规地面站的结构(图 1)。为实现对空间天线椭圆轨道的全天候实时跟踪,必须在全球建立多个地面跟踪站。地面跟踪站的主要作用之一是为空间望远镜提供一个稳定的频率参考[7],确保精准控制空间天线的采样率。此外,由于空间天线时间频率系统的不稳定性,为了确保数据接收时刻的准确性,地面跟踪站记录空间甚长基线干涉测量数据到达跟踪站的时刻,该时刻随着数据字段的增长而增加,相关处理时由处理机根据计算的光行时(光行时等于空间天线与地面跟踪站的距离除以光速)反算出每个数据字段在空间天线上对应的时刻。出于科学需求基础上数据格式最简的考虑,一个RDF文件只需要在起始的文件头打上时间标签,后续的数据接收时刻根据数据采样率依次推算。空地数据传输不支持复杂的数据格式,因此RDF结构简单,在未来的空间甚长基线干涉测量项目中或将继续使用。

图 1 甚长基线干涉测量空间射电望远镜系统组成结构示意图[7] Fig. 1 Schematic diagram of the composition of the VLBI space radio telescope system[7]
1 RDF数据格式

RDF格式是由空间射电望远镜RadioAstron采集数据并以特定频率实时发送至地面,由地面跟踪站记录并输出的一种基于磁盘存储的数据格式。

地面跟踪站会在一组文件中记录时间连续的射电天文数据,除了最后一个文件外,每个文件的数据长度约为15分钟的数据量。一个文件记录到指定的数据量后,系统会新建一个文件记录其后的数据,直至达到指定数据量后再建立新的文件,这样周而复始,直到数据记录终止。

文件命名按照“测站名+协调世界时”的格式,以文件记录的第1个甚长基线干涉测量数据对应的协调世界时为准,这个时间一定是整数秒。具体形式如下:

“station_YYYYDDDHHMMSS.rdf”

其中,station为测站名;YYYY为公历年号;DDD为观测当天的年积日;HH, MM和SS分别为协调世界时对应的时、分、秒。

RDF的文件结构不像Mark5B那样分成若干个等长的磁盘帧,每一帧用固定格式的帧头作为标识,帧头包含该帧的相关信息。与之不同的是,单个RDF格式文件只包含一个文件头,其后的所有数据都是原始观测数据,如图 2

图 2 RDF文件结构示意图 Fig. 2 Schematic diagram of RDF file structure
1.1 文件头格式

RDF文件头固定占用256字节,原始数据从第257字节开始不间断记录,直到停止数据采样。文件头记录了数据起始协调世界时、数据传输速率和接收模式等重要信息。结构如图 3

图 3 RDF文件头格式 Fig. 3 The structure of RDF header

图 3标记了头文件每个数据项的起始字节号和占用空间的大小。文件类型是一个由4个ASCII字符组成的同步字,用来识别射电天文数据文件,这里必须为“RDF1”。头文件大小一定是256字节,用二进制数“00000001 00000000”表示。UTC表示数据开始记录的日期和时间,以“YYYY DDD-hh:mm:ss”的形式存储为ASCII字符串,固定占用18字节空间。数据率即数据传输速率,按2字节的ASCII字符串存储,RadioAstron的数据率为16 MB/s,故存为“16”。接收模式用一个字符表示,有I、Q、A、R 4种,RadioAstron采用R模式。数据源存储为3字节字符串,地面望远镜记作DAS,空间望远镜记作DEC。字节63~160由相关处理机填入, 相关处理机从VEX文件中获取这些参数,其中望远镜坐标由轨道数据计算得到。字节161~256划分为16个通道,每个通道占用6字节空间,记录该通道的频率、边带和极化。

1.2 数据字格式

数据采集终端从接收机送来的中频信号中选出需要观测的频率通道,然后经过频率变换至基频信号,再经过数字化采样和编码后记录在磁盘上[8]。实际使用中常常需要同时选出多个频率通道[8]

数据块中数据流的记录格式是由通道数和量化方式决定的,每个通道对应一条比特流。Mark5B硬盘记录器能够记录的比特流数量只能是1, 2, 4, 8, 16, 32共6种[9]图 4列出了通道数为8或16、量化方式为1 bit或2 bit时的数据单元记录格式。

图 4 数据块中数据单元的格式 Fig. 4 The format of single unit in a block

以16通道、1 bit量化为例,数据块部分的第0, 16, 32, 48, 64, 80, …, bit的数据是按照先后顺序依次记录的通道0中的比特流,第1, 17, 33, 49, 65, 81, …, bit的数据是通道1中的比特流,依此类推可以得到其他通道的比特流。图 4只是一个示意图,实际上各通道并不是如此规律地排布,多比特量化模式下通道内的比特位也不一定是相邻的。通道的数目以及数据单元中的比特位的排布由地面跟踪站给出的VEX文件指定。

图 5为VEX文件中跟踪站指定比特位排布的字段样例。图 6给出了4通道、2比特量化下比特位排布的示意图。

图 5 VEX文件中的比特位排布规则 Fig. 5 Bit arrangement rules in VEX files
图 6 数据单元比特位排布示意图 Fig. 6 Schematic diagram ofbits layout in a data unit
2 数据解码

数据解码是进行相关处理之前的数据预处理过程,对于不同的数据格式,采用的解码算法也不同。设计解码算法的关键在于了解数据存储结构。通过国际空间甚长基线干涉测量合作项目获取了部分RDF数据源文件,研究并针对RDF设计了实用可行的解码算法。

解码算法具体流程如图 7。由于RDF只有一个文件头,首先读取文件头,提取数据解码最为关键的两个信息:起始协调世界时和数据率,再根据数据率计算每秒的数据量T,然后从数据块中循环读取数据量大小为T的数据到新建的以整秒协调世界时命名的文件当中,直至数据读取完毕。

图 7 RDF文件数据解码流程图 Fig. 7 Data-decoding flowchart of RDF file
3 数据验证

通过对解码后数据的相关处理,可以验证上述解码过程的正确性。采用的RDF数据来自2014年俄罗斯空间甚长基线干涉测量网对河外射电源0823 + 033的一次观测试验。参与此次观测的望远镜除了RadioAstron之外,还有美国的Arecibo和荷兰的Westerbork两个地面射电望远镜,其中Arecibo数据记录格式为Mark5A,Westerbork数据记录格式为Mark5B。在上海天文台甚长基线干涉测量中心进行相关处理之前,每个观测台站的数据都需经过解码,转换为特定格式的预处理输入数据。经自行研制的软件相关处理机SCORR处理后,成功获得了清晰的干涉条纹(图 8)。

图 8 空间甚长基线干涉测量数据相关处理干涉条纹 Fig. 8 Fringes after correlation-processing with space-VLBI data

图 8给出了空间甚长基线干涉测量数据相关处理结果,其中红色表示相位谱,蓝色表示幅度谱。Ar-Ra基线存在明显的干涉条纹(Ar表示Arecibo, Ra表示RadioAstron)。结果说明参与相关处理的经解码得到的预处理数据是有效的,验证了RDF格式数据解码的正确性。Wb-Ra基线信噪比较低,可能的原因是两望远镜口径相对较小(Westerbork是由14个25 m网状天线组成的综合孔径射电望远镜,等效口径为66 m,综合灵敏度没有Arecibo高,空间射电望远镜RadioAstron口径10 m),加之基线很长(约200 000 km),导致条纹较弱。Arecibo口径相对较大(300 m),条纹较清晰。

经计算,Wb-Ar基线条纹的信噪比为654.32,Wb-Ra基线条纹的信噪比为10.27,Ar-Ra基线条纹的信噪比为102.22。采用的信噪比计算方法与HOPS(Haystack Observatory Postprocessing System)一致(见(1)式)。

https://www.haystack.mit.edu/tech/vlbi/hops.html

$ S_{\mathrm{NR}}=A_{\mathrm{mp}} \frac{\sqrt{2 B T_{\mathrm{ap}} / n_{\mathrm{ap}}}}{n_{\mathrm{lags}-1}}, $ (1)

其中,Amp为积分周期和通道内所有频点相加后求得的幅值(去除第1个频点的直流分量);B为通道带宽;Tap为单位积分周期;nlags为每通道的频率点数;nap为所有积分周期和通道的权值总和。权值从相关处理机的输出文件中读取。

4 三种数据格式对比

表 1列出了常用地面和空间甚长基线干涉测量使用的VDIF,Mark5B和RDF 3种数据格式的简要特点。

表 1 Mark5B, RDF和VDIF格式对比 Table 1 Comparison between Mark5B, RDF and VDIF
Mark5B RDF VDIF
Description GVLBI recording format SVLBI recording format VLBI data interchange format
Application Recording data for ground observation Recording data for SVLBI observation e-VLBI data transmission, data format conversion between e-VLBI and traditional VLBI
Header There are multiple frame headers, occupying 4X32 bits, including synchronization word, frame number in one second, time code, CRC check code nad other information There is only one header, occupying 256 bytes, including the starting UTC of sampling data, station information, data rate, etc. There are multiple frame headers, occupying 32 bytes, including seconds from reference epoch, frame number, frame length, etc.
Block Raw VLBI data, occupying 10000 bytes, each data block follows the corresponding frame header There is only one data block, all the original VLBI data is behind the header Raw VLBI data, each data block follows the corresponding frame header, the data block capacity is determined by the frame length (including the space occupied by the frame)
Besides Multi-thread support

RDF格式由于只有一个文件头的额外数据记录,其余的记录都是原始甚长基线干涉测量数据,相较而言RDF具有更高的记录效率。为保证数据记录的可靠性,RadioAstron项目采用了一个额外的解码器,当解码器检测到数据丢失或者发生偏移,解码器就会新建一个RDF文件开始记录。由于数据丢失或偏移出现的频率比较低,且RDF文件避免了其他两种格式中帧头数据的记录,这种方法同时兼备了较好的数据记录可靠性和记录效率。

Mark5B格式将数据文件划分成多个磁盘帧,每个磁盘帧帧长固定为10 000字节,由额外的16字节帧头引导。虽然不可避免地出现丢帧、帧号乱序和帧长不足等情况,但是通过帧头中的协调世界时和秒内帧号可以确定当前帧在时间序列中的位置,并采用相应的数据纠错方法可以提高整个数据文件的有效率[4],因此,Mark5B格式具有较高的数据可靠性。此外,Mark5B格式完全按照VSI标准制定,与现有的甚长基线干涉测量系统保持广泛的兼容性[10]。目前国际上使用最多的终端是MK系列终端系统[11],因此,Mark5B格式具有应用的广泛性。

VDIF格式同样采用多个数据帧的形式保存数据,与Mark5B不同,VDIF采取可变帧长(可变帧长指的是针对不同的传输协议可以设定与其对应的帧长以适应单个数据包的容量,同一个观测文件数据帧的长度是固定的)的机制以确保所采用的传输协议的数据包刚好容纳一个VDIF数据帧[6],这样在传输过程中如果发生丢包事件或者数据包未能按序交付,接收端也能够通过数据包内的帧头信息恢复数据时序以及补足缺失数据(用0补足)。如果将Mark5B等传统甚长基线干涉测量数据记录格式用于网络传输,可能会因为丢包使得数据位发生移位,而相关处理对数据位移位非常敏感[4],由此导致接收端接收的数据文件不可靠。相比之下,VDIF格式的网络传输安全性更高。VDIF格式设计的目的是解决当前国际上数据终端记录格式多样化导致数据交换不便的问题,除了方便数据交换之外,VDIF格式也支持磁盘存储[6]。随着数据终端设备的更新换代,VDIF将得到更加广泛的应用,成为兼具数据记录和数据网络交换功能的宽带甚长基线干涉测量通用数据格式。

综上所述,RDF是一种应用于空间甚长基线干涉测量地面跟踪站的数据记录格式,Mark5B格式是现阶段应用范围最广的地基甚长基线干涉测量数据记录格式,而VDIF以其灵活的设计和较高的网络传输安全性可能成为未来一段时间的通用数据格式。需要说明的是,Mark5B格式由Haystack天文台于2005年前后设计完成[3],同样基于磁盘的VLBI数据记录格式Mark5A于2002年设计完成[10],而RDF格式于RadioAstron预研阶段(20世纪80年代)研制成功,早于Mark5B和VDIF格式。随着时间的推移,未来RDF也可能被更加先进的数据记录格式取代。

5 总结

本文在国内首次分析了俄罗斯空间射电望远镜RadioAstron特有的数据记录格式RDF,完成了RDF格式的实测空间甚长基线干涉测量数据解码,在此基础上利用SCORR软件处理机成功进行了空间甚长基线干涉测量相关处理及验证,掌握了RDF格式解码方法。最后对比了RDF格式及RDF相关现有地基甚长基线干涉测量格式,分析了它们各自具有的特点,有助于后续深入分析处理更多的RadioAstron实测数据,推进我国空间甚长基线干涉测量数据处理技术的研究。

致谢: 在研究过程中,俄罗斯科学院列别捷夫物理所天文宇航中心Andrianov Andrey博士对RDF格式的一些细节问题在邮件中给予了热心回复;上海天文台国际访问学者Tetsuro Kondo教授和童锋贤博士对数据相关处理工作给予了大力支持,向他们表示感谢。

参考文献
[1] 朱新颖, 李春来, 张洪波. 深空探测VLBI技术综述及我国的现状和发展[J]. 宇航学报, 2010, 31(8): 1894–1897
[2] 沈志强. 空间VLBI的研究现状[J]. 天文学进展, 1998(2): 117–134
[3] MIT Haystack Observatory. Mark5B system user's manual[EB/OL]. (2006-08-08)[2019-06-18]. https://www.haystack.mit.edu/tech/vlbi/mark5/docs/Mark%205B%20users%20manual.pdf.
[4] 郭迎, 郑为民. 一种高性能VLBI数据预处理方法及其软件实现[J]. 中国科学院上海天文台年刊, 2013(34): 114–122
[5] 杨文军, 郝龙飞. VLBI终端系统的发展历史和未来展望[J]. 天文研究与技术——国家天文台台刊, 2012, 9(4): 374–381
[6] WHITNEY A, KETTENIS M, PHILLIPS C, et al. VLBI Data Interchange Format (VDIF)[C]//The 19th European VLBI for Geodesy and Astrometry Working Meeting. 2010, 194: 156-160.
[7] TAYLOR G B, CARILLI C L, PERLEY R A. Synthesis imaging in radio astronomy Ⅱ[C]//ASP Conference Series. 1999.
[8] 钱志瀚.甚长基线干涉测量技术在深空探测中的应用[C]//中国宇航学会深空探测技术专业委员会第七届学术年会论文集. 2010.
[9] 朱新颖, 张洪波, 李春来. VLBI MK5B通道检测软件的设计与实现[J]. 天文研究与技术——国家天文台台刊, 2011, 8(3): 236–241
[10] 韦文仁, 薛祝和. 基于磁盘的新型VLBI终端系统——MK5A终端系统[J]. 天文学进展, 2004, 22(3): 269–274
[11] 陈中, 郑为民, 陈肖. 中国e-VLBI网的建立及应用[J]. 中国科学院上海天文台年刊, 2015(36): 136–147
由中国科学院国家天文台主办。
0

文章信息

张浩, 张娟, 刘磊, 郑为民, 芮萍
Zhang Hao, Zhang Juan, Liu Lei, Zheng Weimin, Rui Ping
空间VLBI数据记录格式RDF解析与数据解码
A Study of Space VLBI Data Recording Format -RDF and Its Data Decoding
天文研究与技术, 2020, 17(2): 163-170.
Astronomical Research and Technology, 2020, 17(2): 163-170.
收稿日期: 2019-06-18
修订日期: 2019-09-26

工作空间