HXMT高能望远镜毛刺的识别方法
赵海升1,2, 刘聪展1,2, 李小波1,2, 宋黎明1,2     
1. 中国科学院粒子天体物理重点实验室, 北京 100049;
2. 中国科学院高能物理研究所, 北京 100049
摘要: 硬X射线调制望远镜(Hard X-ray Modulation Telescope,HXMT)卫星搭载的高能望远镜(High Energy Telescope)数据存在非真实光子事例的聚集,突出表现在光变曲线上存在许多毛刺,这对光变和能谱的研究产生一定的影响。分析了大量毛刺事例的性质,并基于这些性质通过事例时间间隔相邻法识别毛刺,这种方法可以在事例级别识别毛刺,比利用一些特征函数如信噪比方法有较大优势。毛刺事例的识别对正常光子事例的影响非常小,且毛刺事例在光变上不会产生周期和准周期信号。
关键词: 毛刺    时间间隔    信噪比    数据分析    
The Spikes Identification of High Energy Telescope Onboard Insight-HXMT
Zhao Haisheng1,2, Liu Congzhan1,2, Li Xiaobo1,2, Song Liming1,2     
1. Key Laboratory of Particle Astrophysics, Chinese Academy of Sciences, Beijing 100049, China;
2. Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100049, China
Abstract: Spikes exist in the raw light curves of the High Energy Telescope (HE) onboard Hard X-ray Modulation Telescope (HXMT), which has brought data analysis of HE with a lot of negative influence, especially for the study of light curves and energy spectra. A large amount of spikes are accumulated and these properties, such as time interval, duration time, channel distribution, are studied using statistical method. Base on these performances in light curves, two methods of spikes identification are established. In this work, the properties and identification methods of spikes are introduced, which has many advantages over methods using certain eigenfunctions such as SNR.
Key words: Spike    Time interval    Signal-to-noise    Data analysis    

硬X射线调制望远镜卫星[1] 于2017年6月15日在酒泉卫星发射中心发射升空,开启了我国在X射线波段对天体源的观测研究。它覆盖1~250 keV能段,具有大天区、大有效面积巡天和高精度定点观测能力,同时还能监测高能X射线和伽马射线暴发现象。硬X射线调制望远镜卫星搭载的高能望远镜[2]是实现其科学探测能力的关键载荷,高能望远镜采用条栅式准直器和NaI(TI)/CsI(Na)复合晶体探测器,由18个主探测器单元组成,NaI晶体可以对20~250 keV的硬X射线实现高灵敏度探测,CsI晶体可以对0.2~3 MeV的伽玛暴发进行监测,同时两种晶体均具有能谱和时变探测能力。每个主探测单元由复合晶体探测器、光电倍增管(Photomultiplier Tube, PMT)、前端电子学和后端电子学组成[3]。X射线光子入射到NaI晶体后沉积全部能量,而CsI晶体作为主动式屏蔽探测器,对入射的粒子本底、伽马光子等进行监测,两种晶体产生的信号可以通过脉冲形状甄别技术(脉冲宽度)加以区分。光电倍增管与晶体相连用于采集光信号,采集的光子信号经过前端电子学成形和放大,此时,如果信号超过触发阈值,后端电子学将对信号进行采集,最终记录光子的能量、脉冲宽度和时间信息等。但是,如果信号超过上阈值(称之为大信号),后端电子学将不进行模数(Analog-to-Digital, AD)转换而直接丢弃。高能望远镜的能量分辨率在60 keV时接近19%,时间分辨率约8 μs,时间精度为2~4 μs,其快速的处理方式使得死时间仅占3%~5%[2],如此快速的数据处理也造成电子学产生一些非真实光子信号,并在两种晶体中同时存在,突出表现在光变曲线上出现一些尖峰,这些信号称为毛刺。

毛刺对光变和能谱的影响非常大。光变上,毛刺表现为一系列尖峰,容易对光变的这种结构产生误解,比如可能认为这种现象是来自天体源的变化。在小天区扫描和伽马暴寻找方面,这些毛刺与源、伽马暴有一定程度的混淆,特别是对于一些能谱较软、流强较弱的短时伽马暴,难以与毛刺区分。这些毛刺事例还会改变源光变的功率谱结构,在直接解调成像[4]时引起本底的涨落,对寻找源造成干扰。能谱上,它主要集中在低能段,给能谱拟合模型的选择和参数的约束带来一定的不确定性。当然,低能段事例可以被剔除,但是这样会降低源的显著性,低能段有效面积大,源光子数目多,剔除这些因为仪器原因引起的毛刺信号就变得非常重要。

目前,国内外对毛刺现象的描述比较少,本文主要介绍毛刺的一些统计性质及识别方法,有助于分析硬X射线调制望远镜的数据,同时对未来快速电子学处理系统的设计及后续的数据处理提供参考。另外,高能望远镜探测器有18个单体,它们的电子学设计是一样的,各个单体产生的毛刺在分布和性质上也基本一致。本文主要以2号单体探测器为例进行描述。

1 毛刺的性质

毛刺的产生与晶体中大的能量沉积事例有一定的关联。地面实验发现,毛刺基本在大信号后产生,这些大信号可能引起光电倍增管中空间电荷效应,进而引起大量的随机过阈事例。高能望远镜在低增益观测时,其高压降低,毛刺显著减少,这也说明毛刺与大信号的关系密切。

毛刺与高能望远镜电子学结构有较大的关系,比如提高数据处理时间或者降低高压都可以显著减少毛刺。然而毛刺的真实来源仍然不清楚,它的产生可能与晶体发光、光电子产生及前端电子学有关。目前地面实验不倾向于电子学噪声引起毛刺,而是倾向于大事例的输入引起。本文通过数据处理降低毛刺对正常事例的影响,对毛刺的识别也只限于显著的毛刺。

图 1(a)是一段2号单体探测器观测Crab源的原始数据光变曲线,数据仅扣除了在轨标定放射源事例,时间起点为2018年11月20日13时40分26秒。源信号相对比较平稳,本底主要是轨道粒子,在纬度比较高的区域计数升高,而毛刺在很短的时间内计数迅速升高并迅速下降。本文利用数据分析软件(软件模块为hepical)[5],适当调整其默认参数得到图 1(b)的毛刺事例,可以清晰地看到该方法将单个毛刺孤立地挑选出来;图 1(c)为剔除毛刺后的光变,上面还有些疑似毛刺的事例。

图 1 一段观测原始数据,挑选的毛刺和剔除毛刺后的光变,原始数据仅扣除了在轨放射源事例,单体为2号。(a)原始的光变曲线,时间分辨为0.01 s;(b)挑选的毛刺信号,时间分辨为0.01 s;(c)剔除毛刺后的光变,时间分辨为0.01 s Fig. 1 A raw light curve of HE and only the calibration events are removed from this light curve: (a) The raw light curve with bin size 0.01 second; (b) The spikes with bin size 0.01 second; (c) The light curve removed spikes with bin size 0.01 second

图 2是利用2号单体探测器约60 ks的Crab源观测数据统计毛刺事例,大约得到762个孤立毛刺,事例数为45 807。(a)为这些事例在电子学的能道分布,高能望远镜有自动增益控制,它可以根据在轨放射源峰位自动校正增益,所以采集这些光子的电子学增益是相同的,0~10道为超上阈信号,这些事例主要由本底引起,毛刺事例主要集中在18~35道,比较接近电子学阈值;(b)为脉冲宽度分布,与晶体发光时间有关,对于光子信号80以下主要是NaI事例,80以上为CsI事例,毛刺的脉冲宽度分布较广,几乎覆盖了NaI和CsI的典型宽度;(c)为单个毛刺事例的时间间隔,多数毛刺事例的相邻时间小于100 μs,而且符合指数分布;(d)为单个毛刺的持续时间分布,多数毛刺的持续时间在1~2 ms,但是持续时间依赖于软件参数。

图 2 毛刺事例的分布。(a)在电子学能道上的分布;(b)脉冲宽度分布;(c)相邻事例的时间间隔;(d)毛刺持续时间分布 Fig. 2 The properties of accumulated spikes: (a) Channel distribution; (b) Pulse width distribution; (c) Time interval between continuous spike events; (d) Duration time distribution
2 毛刺的识别

毛刺的识别主要针对显著毛刺,即识别短时间内的大量触发事例。如果将毛刺看作信号,光子事例看作本底,可以用信噪比判断毛刺(称为函数识别方法)。毛刺的持续时间多数在5 ms内,将光变的时间间隔(bin)设置为10 ms。本底的估计可以利用一段时间光变计数的平均或者线性拟合方法获得,适当将本底计数扩大以覆盖正常的光子计数区间,本底的计算步长200 s,这样本底计数可以认为基本不变。信噪比方法[6]采用RSN=S/(S + B)1/2图 3为毛刺信噪比大于3时挑选的毛刺,这个结果与图 1(b)相符。此方法有本底计数和信噪比两个参数,根据实际测量给出本底计数,信噪比取3或者5。信噪比公式也可以用其它方法代替,比如采用不完全伽马函数IG(x, a),它的形式为

$ IG(x, a) = \frac{1}{{\mathit{\Gamma }(x)}}\int\limits_0^a {{t^{x - 1}}{{\rm{e}}^{ - t}}{\rm{d}}t} , $ (1)
$ \mathit{\Gamma }(x) = \int\limits_0^\infty {{t^{x - 1}}{{\rm{e}}^{ - t}}{\rm{d}}t, x > 0, a > 0} . $ (2)
图 3 信噪比方法挑选的毛刺,数据已经扣除在轨放射源事例,单体为2号,时间分辨为0.01 s Fig. 3 The light curve with bin size 0.01 second of spike events screened by the signal-to-noise method, and the data was acquired by detector of number 2 of HE

其中,a为本底;x为数据点,如果IG(x, a)大于某一值(比如0.999 999),则认为数据点为毛刺信号。

目前硬X射线调制望远镜的数据分析软件采用判断相邻事例时间间隔的方法识别毛刺(称为相邻法),如果相邻事例的时间间隔小于某一阈值(用参数TIMEDEL表示),则使用计数器累计事例;如果持续有多个事例符合条件,最终得到的事例个数大于事例总数(EVTNUM),则认为这个事例为毛刺。图 1(b)是利用相邻法得到的毛刺,阈值和事例总数分别设置为250 μs和25个。这两个参数需要合理选择,一般来讲,阈值越大,事例总数也越大,这样做的好处是避免真正的光子事例被识别为毛刺事例,但是事例总数过大,会造成一部分毛刺事例不能识别,所以事例总数的选择有人为性。毛刺识别中没有对电子学能道和脉冲宽度进行限制,前者是防止在能谱上有截断,后者是最大可能地利用毛刺计数高于信号这一特点(无论是NaI还是CsI信号,它们的计数都要小于毛刺计数)。

相邻法和函数识别法的区别在于前者是毛刺事例的识别,后者是毛刺光变计数的识别。两者都需要设置两个参数,前者是事例时间间隔和事例总数,后者是本底数和判断函数的阈值。函数识别法参数的设置比较简单,而相邻法比较复杂。如果毛刺来自电子学噪声随机过阈,这样正常光子事例也可以引起噪声变化,从而产生毛刺事例,一种解决方法是将相邻时间间隔比较小的事例扣除,这在事例级别比较容易实现。另外,按光变计数识别毛刺,会造成毛刺事例分到相邻的时间并上,容易漏掉一部分毛刺事例,而且正常事例也会被过滤,但是可以通过缩小时间并来识别更多毛刺,同时降低正常事例的扣除。总之,这两种方法在合适的参数下可以得到相似的结果,但是相邻法在毛刺识别中更有优势。

相邻法的参数为事例时间间隔和事例总数,本文在设置这两个参数时主要考虑到事例的时间间隔多在250 μs内,并且在毛刺的持续时间内,可以认为本底和源的光子很少,如果毛刺显著,需要达到25个(RSN=S/(S + B)1/2=25/(25)1/2=5)。图 4(a)为将时间间隔和事例总数分别设置为250 μs和5个事例时,毛刺中光子事例数目的分布随着毛刺事例数目降低,毛刺个数快速升高。我们模拟了一段平均计数为1 000 counts/s的数据,利用相同的方法得到的毛刺事例数分布如图 5(a),识别的毛刺数目随着毛刺包含的光子计数增大而迅速下降,在模拟过程中,最大包含光子计数为10个。这一结果依赖于平均计数的设置,而实际的Crab数据(源和本底)计数在600~1 400 counts/s之间,这样将事例总数设置为25,可以避免正常光子识别为毛刺。图 4(b)图 5(b)为毛刺(或者识别出的毛刺)的持续时间分布,由毫秒(EVTNUM=25)缩减到几百微秒(EVTNUM=5)。

图 4 相邻法中将事例时间间隔、事例总数设置为250 μs和5个,(a)毛刺中(假)光子事例数目的分布,其中横坐标为毛刺中光子事例的个数,纵坐标为毛刺计数;(b)毛刺持续时间分布,其中横坐标为毛刺的持续时间,纵坐标为毛刺计数。数据来自Crab,毛刺数目为87 104个 Fig. 4 The distributions of event number and duration time of spikes identified by the neighborhood method, when the parameters of TIMEDEL and EVTNUM are set to be 250 microsecond and 5 events, respectively. (a) The distribution of event number in a spike; (b) The distribution of duration time of spike. The data is originated from Crab observation and the total number of spikes is 87 104
图 5 相邻法中将事例时间间隔、事例总数设置为250 μs和5个,(a)识别的毛刺事例数分布;(b)识别的毛刺持续时间分布。数据来自产生1 000 counts/s的模拟数据,时间长度为1 h,识别的毛刺数目为6 767个 Fig. 5 The distributions of event number and duration time of spikes identified by the neighborhood method, when the parameters of TIMEDEL and EVTNUM are set to be 250 microsecond and 5 events, respectively. (a) The distribution of event number in a spike; (b) The distribution of duration time of spike. The data is originated from Monte Carlo simulation and the counts rate is about 1 000 counts/s. The duration of data is 1 hour and the total number of identified spikes is 6 767
3 毛刺对数据分析的影响

硬X射线调制望远镜数据分析软件使用相邻方法,最大可能地识别毛刺事例,同时保留正常事例,但在事例筛选过后或多或少对能谱和光变产生影响。

源能谱分析中,毛刺事例主要影响低能段能谱,但是难以估计尚有多少毛刺事例未被识别,这是因为低能段的不确定因素比较多,比如探测器中晶体荧光产生效率的涨落和光电倍增管光电子产生涨落使得光子探测效率难以有效确定,电子学噪声和粒子本底也使得本底难以有效估计,而且探测效率和本底的研究还有一定的耦合性。同时,各种方法不可避免地将一部分源光子误识别为毛刺事例,这种误识别包括两种情况:(1)正常光子在毛刺发生时间内被识别为毛刺事例;(2)正常光子事例与毛刺产生、结束时间接近而被识别为毛刺。相邻法的误识别主要是前者。我们选取一段3 000 s的Crab数据,源和本底的光子计数率约为800 counts/s,利用在轨标定放射源事例估计误判率,在52 384个放射源事例中,仅有7个识别为毛刺事例。相邻法对正常光子能谱也有一定的影响,主要表现在曝光时间上,毛刺使得连续的观测数据出现毫秒和微秒的断裂,但是毛刺的持续时间多在1~2 ms之间,对总曝光影响很小,比如在上述3 000 s曝光时间内,毛刺总的持续时间仅占0.11 s。毛刺事例是否引起周期或者准周期信号是光变分析中需要解决的问题。图 6是一段Crab观测数据中识别的毛刺事例的功率谱,从功率谱上没有看到明显的周期或者准周期信号。Crab源存在大约33 ms的周期信号,毛刺功率谱上没有看到此信号也说明正常事例识别为毛刺事例的比例非常小。

图 6 毛刺事例的功率谱,来自一段Crab数据中识别的毛刺事例。毛刺事例非常不连续,对于不连续的光变时间间隔,填充了0 Fig. 6 Power spectrum of spike events. The data is from Crab observation, and the bin without spike events is filled with 0
4 总结及讨论

硬X射线调制望远镜卫星高能望远镜数据存在一些非真实光子事例的聚集,在光变上表现为毛刺事例,它们的持续时间多在2 ms内,事例时间间隔多在100 μs内。从能谱上看,毛刺事例主要分布在低能段,脉冲宽度较广,几乎覆盖了NaI和CsI的典型宽度。基于这些性质,采用判断相邻事例时间间隔的方法识别毛刺,这种方法可以在事例级别识别毛刺,比利用一些特征函数有较大的优势。毛刺事例的识别对正常光子事例的影响非常小,而且毛刺事例在光变上不会产生周期或准周期信号。但是,目前尚未真正理解毛刺产生的原因,只是发现与大信号有关系,而且也无法得知还有多少毛刺事例尚未识别,从光变上讲,显著的毛刺事例都可以识别。毛刺对低能段能谱的影响又由此能段标定,本底估计相互耦合。值得注意的是硬X射线调制望远镜的本底估计依赖盲探测器的计数和能谱形状,而盲探测器与其它探测器在晶体结构和电子学上一致,未识别的毛刺可以通过本底扣除减少。

本文主要在全能段扣除毛刺,实际上硬X射线调制望远镜数据分析软件也提供了能段选择,可以在该能段中选择毛刺而不影响其它能段。毛刺事例与真实光子产生的伽马暴等的最大区别是毛刺的持续时间非常短,并且不可能在多个单体上同时存在,可以利用这两个特点区分伽马暴和毛刺。毛刺与大信号有关联,但是这些大信号的性质还有待分析。

参考文献
[1] ZHANG S N, LI T P, LU F J, et al. Overview to the Hard X-ray Modulation Telescope (Insight-HXMT) satellite[J]. Science China:Physics, Mechanics & Astronomy, 2020, 63(4): 249502.
[2] LIU C Z, ZHANG Y F, LI X F, et al. The High Energy X-ray telescope (HE) onboard the Insight-HXMT astronomy satellite[J]. Science China:Physics, Mechanics & Astronomy, 2020, 63(4): 249503.
[3] 李旭芳, 刘聪展, 张翼飞, 等. 硬X射线调制望远镜卫星高能望远镜设计与验证[J]. 航天器工程, 2018, 27(5): 120–126
LI X F, LIU C Z, ZHANG Y F, et al. Design and verification of high energy telescope onboard HXMT satellite[J]. Spacecraft Engineering, 2018, 27(5): 120–126. DOI: 10.3969/j.issn.1673-8748.2018.05.021
[4] GUAN J, LU F J, ZHANG S, et al. A modified direct demodulation method applied to Insight-HXMT Galactic plane scanning survey[J]. Journal of High Energy Astrophysics, 2020, 26: 11–20. DOI: 10.1016/j.jheap.2020.02.002
[5] ZHAO H S, LI C K, LI X B, et al. High Energy X-ray Telescope data analysis method[J]. Chinese Journal of Space Science, 2016, 36(6): 938–944.
[6] ZHU Y S. On statistical significance of signal[J]. High Energy Physics and Nuclear Physics, 2006, 30(4): 331–334.
由中国科学院国家天文台主办。
0

文章信息

赵海升, 刘聪展, 李小波, 宋黎明
Zhao Haisheng, Liu Congzhan, Li Xiaobo, Song Liming
HXMT高能望远镜毛刺的识别方法
The Spikes Identification of High Energy Telescope Onboard Insight-HXMT
天文研究与技术, 2021, 18(1): 138-144.
Astronomical Research and Technology, 2021, 18(1): 138-144.
收稿日期: 2020-05-20
修订日期: 2020-06-16

工作空间