自动化学报  2017, Vol. 43 Issue (12): 2170-2177   PDF    
天文瞬变源快速自动识别系统的研究与实现
吴潮1, 马冬1,2, 田海俊2, 李乡儒3, 魏建彦1     
1. 中国科学院国家天文台 北京 100012;
2. 三峡大学 宜昌 443002;
3. 华南师范大学 广州 510631
摘要: 大视场和高时间采样率是现代天文光学瞬变源巡天项目的两个主要发展方向,相对传统的巡天项目将会产生更大的数据量和要求更快的瞬变源识别处理速度.为满足新技术下的瞬变源识别处理要求,本文提出用基于等光度测量星像轮廓等13个新的特征参量取代原有的轮廓拟合参量;使用实际星像轮廓仿真和构建较真实的训练样本算法;加入基于实测数据分析的噪声过滤判据等方法.实现了基于随机林森算法的天文光学瞬变源自动快速识别系统.通过仿真和实测数据的测试表明:本识别系统较国际主流的同类识别算法提速约10倍,样本识别的总体正确检出率和错误检出率都基本相同,而在低信噪比处,本文的识别算法有较良好的表现.本识别系统已成功应用于我国的迷你地基广角相机阵(地基广角相机阵的先导项目),同时,本系统对于其他天文光学瞬变源巡天项目也有着重要的应用价值.
关键词: 机器学习     随机森林     瞬变源自动搜寻     星像轮廓     等光度测光    
Study and Development of a Fast and Automatic Astronomical-transient-identification System
WU Chao1, MA Dong1,2, TIAN Hai-Jun2, LI Xiang-Ru3, WEI Jian-Yan1     
1. National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012;
2. Three Gorges University of China, Yichang 443002;
3. South China Normal University, Guangzhou 510631
Manuscript received : March 24, 2016, accepted: December 10, 2016.
Foundation Item: Supported by National Natural Science Foundation of China (U1431108, U1231123, U1331202, 61273248, 11503012, U1731124) and Natural Science Foundation of Guangdong Province (2014A030313425)
Author brief: WU Chao Associate professor at National Astronomical Observatories, Chinese Academy of Sciences. His research interest covers data mining and astronomical transient search;
MA Dong Master student at Three Gorges University and National Astronomical Observatories, Chinese Academy of Sciences. His main research interest is data mining;
LI Xiang-Ru Professor at South China Normal University. He received his Ph. D. degree from the Institute of Automation, Chinese Academy of Sciences in 2006. His research interest covers data mining and robust vision;
WEI Jian-Yan Professor at National Astronomical Observatories, Chinese Academy of Sciences. His research interest covers observation and science of astronomical transients
Corresponding author. TIAN Hai-Jun Associate professor at the College of Science, Three Gorges University. His research interest covers galactic astronomy and astroinformatics. Corresponding author of this paper
Recommended by Associate Editor HU Qing-Hua
Abstract: With the development of observational technology, modern transient survey projects are required to select the transient candidates fast and automatically from large volume data with noise. We present a fast and automatic identification system to search transients by the following methods:introducing 13 new features to measure objects' profiles by isophotometry in the place of PSF fit, using high simulation data based on real objects' profiles as training sample, and designing a special noise filter function. The identification system is realized by supervised machine learning technique of random forest. Our test demonstrates that the processing speed is 10 times faster than the popular identification system in the world, while their true and false positive rates are at the same level. Additionally, our system shows good performance for low signal-to-noise-ratio data due to its isophotometry's features. Our system has been successfully operating in the Mini-GWAC (Miniature ground wide angle camera) online data processing pipeline.
Key words: Machine learning     random forest     robotic identification of transient     profile of star     isophotometry    

瞬变源是一种偶发的短暂的非周期性的天文现象.从观测上, 其持续时标从数秒到数周甚至数年.目前已知的主要瞬变源为:超新星1、伽玛暴2、微引力透镜3、恒星被大质量黑洞所瓦解的潮汐瓦解事件4以及引力波的电磁对应体5等.瞬变源对于研究宇宙的起源和极端环境下的物理现象有着重要意义.宇宙加速膨胀现象的发现[1-3]正是通过对大样本瞬变源超新星的观测研究发现的.超新星、伽玛暴等瞬变源爆发时辐射的能量超过整个星系的光度, 这种极高能量的短时大爆发为研究极端物理环境下的物理现象提供了难得的观测条件.

1https://en.wikipedia.org/wiki/Supernova

2https://en.wikipedia.org/wiki/Gamma-ray\_burst

3https://en.wikipedia.org/wiki/Gravitational\_microlensing

4https://en.wikipedia.org/wiki/Tidal\_disruption\_event

5https://en.wikipedia.org/wiki/Gravitational\_wave

由于瞬变源是偶发天文事件, 要求瞬变源搜索的观测设备具有大视场(即单位时间内能观测到更大的天区)和高时间采样率(即对同一天区的高回访观测频率)的特点.我国建设中的瞬变源搜索设备地基广角相机阵(Ground wide angle camera, GWAC), 由36台直径为18 cm的广角相机组成, 每个广角相机配有4 k×4 k的CCD探测器, 整个相机阵的视场达到5 000平方度.每15秒产生一幅观测图像(10秒曝光+5秒读出数据), 即15秒会对原视场作一次回访.该设备对于未知短时标瞬变源的搜索具有重要的意义, 同时也对传统的瞬变源搜索技术提出了巨大挑战.相对于国际主流的瞬变源搜索设备, 地基广角相机阵设备在视场和采样频率上都将提高1~2个数量级.

经典的瞬变源搜索过程如图 1所示.主要原理是通过将观测图像(图 1(a))与模板图像(图 1(b))进行相减, 如果是一个瞬变源(即新出现的源), 那么在减完后的残差图像(图 1(c))中就是一个类似完整点源的像(如图 1(c)中的$o1$$o2$), 而其他残缺的像斑则为相减过程中产生的噪声(如图 1(c)中的$n1$, $n2$, $n3$).如何将残差图像中的瞬变源从周围的噪声中自动快速地识别出来是本文要解决的关键问题.传统的识别方法是人眼识别, 由天文学家对所有观测图像进行逐幅识别.这种方法虽然正确率高, 但是效率非常低, 对于现代的大数据瞬变源巡天的处理是无法适用的.

图 1 图像相减法处理示例 Figure 1 An example of difference image procedure

随着数据处理技术的发展, 不同国家的天文学家曾尝试开展利用机器学习的自动分类方法进行瞬变源自动分类的研究.最早的开创性工作是2007年Bailey等[4]将监督式机器学习分类技术实验性地应用于超新星工厂(The nearby supernova factory, SNFactory)巡天项目; 2012年, Brink等[5]在Bailey等[4]的算法基础上, 开发了基于高精随机森林架构下的分类器来识别帕洛马(Palomar transient factory, PTF)巡天项目的瞬变源; 2013年, Brink等[5]利用递归方法对Bloom等[6]使用的特征参量进行了优化, 提高了分类性能. 2014年, Buisson等[7]基于由主成分分析法得到的特征参量对随机森林、K-近邻、支持向量机、神经网络、贝叶斯等多种算法进行综合比较, 结果表明随机森林算法在瞬变源识别中具有最好性能.最新工作是2015年Goldstein等[8]在文献[5-6]的基础上进行特征参量的添加和优化, 最后选取38个特征参量来进行训练分类器, 基于随机森林算法, 使得分类的正确率和处理效率较前面文献中的工作都有了较大的提高[8].

本文以文献[8]的算法为基础, 结合地基广角相机阵的数据特点, 提出基于等光度测量星像轮廓等新的特征参量, 使用实际星像轮廓仿真和构建较真实的训练样本算法; 加入基于实测数据分析的噪声过滤判据等方法, 实现一个优化的瞬变源快速自动识别系统.

本文的组织结构如下:第1节阐述瞬变源识别系统的特征参量及其提取, 着重描述了基于等光度测量星像轮廓的特征参量; 第2节描述训练样本的构建过程; 第3节和第4节阐述本识别系统的实现过程和具体的测试与验证; 第5节对本文提出的识别系统进行讨论与总结.

1 瞬变源特征参量的研究

瞬变源的自动识别就是将瞬变源从残差图像提取的点源样本中识别出来.残差图像中的识别样本主要分为真实点源(瞬变源候选体)和噪声源两类.其实例的效果如图 1(c)$o1$, $o2$$n1$, $n2$, $n3$所示.从理论上分析, 残差图像中的真实点源应具有类似于观测图像中点源的能量分布轮廓, 即星像的能量从中心到边缘应具有仪器自身特点的点扩散函数分布(一般为类似于高斯函数分布); 而残差图像中的噪声则主要来自于个别像元的随机噪声、位置及轮廓匹配中的差异引起的残差像斑、饱和星留下的残差等.虽然噪声源的类型多种多样, 但都不具有真实点源所具有的能量分布和形状等主要特点, 因此点源的能量分布及形状相关的特征参量是进行自动分类的基本特征参量.如何提取特征参量来表达星像轮廓的特征直接会影响到分类模型的最后识别结果和数据处理速度.

分析文献[8]中的38个特征参量, 保留其中与星像轮廓相关的以及具有高权重值的18个特征参量.去除如星系相关星等、CCD编号等与GWAC项目及其科学目标无关的参量.同时, 为了提高处理速度, 取消部分耗时过长和权重较低的特征参量.保留的18个特征参量根据是否与星像轮廓相关分成两组参量, 即第Ⅱ和第Ⅲ组(详见表 1).第Ⅱ组特征参量的计算需要对图像进行预处理.第Ⅲ组的参量主要是利用点扩散函数(PSF)拟合方法来确定星像的轮廓.本文新引入13个特征参量记为第Ⅰ组参量, 主要是基于等光度方法测定星像轮廓参量, 取代原算法中的第Ⅲ组参量来获得更好的性能优化.

表 1 特征参量 Table 1 Feature sets
1.1 残差图像的预处理

我们的实测数据6对比测试实验结果表明:对于地基广角相机阵做图像的预处理[5, 8], 同样能提高系统的识别正确率, 但预处理过程的基本参数选取与文献[8]不同, 具体处理过程如下:

6迷你地基广角相机阵(Mini-GWAC)是GWAC的先导项目, 由12个7厘米望远望组成的阵.其观测策略、科学目标和数据特点与GWAC相同.

1) 以残差图像中找到的星像目标为中心, 截取出$(2k+1)$像素× $(2k+1)$像素的窗口图像.我们的实测对比试验结果表明:对于GWAC图像采用$k = 15$ (即31像素×31像素)的窗口像图最为有效.等效于星像轮廓参量半高全宽(FWHM)的大约20倍为经验的合理参量.其中, 每个$(x, y)$处的像元响应量标记为$I_{x, y}$.

2)计算表 1中第Ⅱ组参量中涉及的矩阵RB, 计算方法即文献[8]中的式(1)、式(4)和式(5), 具体表述如下:

$ C_{x, y} = \frac{1}{N_{u}} \sum\limits_{i=0}^1 \sum\limits_{j=0}^1I_{2x+i, 2y+j} $ (1)

矩阵$C_{x, y}$即为原图像每相邻4个像元的压缩.压缩处理提高了图像的对比度, 能更容易地区分出真实像斑与噪声的轮廓.对矩阵$C_{x, y}$做流量的归一化处理后, 即可得到矩阵R.其计算表达式为

$ R_{x, y}\approx\frac{1}{1.4826}\left[\frac{C_{x, y}-{\rm med}(C)}{{\rm med}(| C_{x, y}-{\rm med}(C)|)}\right] $ (2)

其中, ${\rm med}(\cdot)$为中值计算符.

矩阵B由未经过压缩的原窗口图像(GWAC采用: 31像素×31像素)的直接处理得到, 表示像元响应与中值的偏移量的归一化值.计算公式为

$ B_{x, y}=\frac{I_{x, y}-{\rm med}(I)}{\max(| I |)} $ (3)

3) 表 1第Ⅱ组中的相关参量可根据“参量描述”列中的说明, 由前面的相关矩阵公式计算得出.

1.2 特征参量的优化提取

基于GWAC数据的特点分析, 利用点扩散函数(Point spread function, PSF)拟合来描述星像轮廓主要有以下不足: 1)拟合所需的计算比较耗时; 2)对于拟合轮廓所用的数学模型有依赖性. GWAC的PSF轮廓主要由光学轮廓而非大气视宁度决定, 相比由大气视宁度占主导的望远镜, 其PSF比较复杂难以用简单的高斯模型拟合.因此, 通过引入新的基于等光度测量星像轮廓的特征参量取代原有的PSF拟合参量进行优化(表 1中第Ⅰ组参量).

图 2显示了三种不同的星像轮廓测量方法[9].等光度轮廓(ISO)的测量主要将光度水平相同处连结成一条线构成星像的轮廓区域.第Ⅰ组参量中的ISO 0~ISO 4表示5组处于不同光度水平的轮廓面积.不同光度$I_{i}$的计算公式为

图 2 三种不同的轮廓测量方法示例 Figure 2 The profile measurements by three different methods
$ I_{i}=S\ast\left( \frac{I_{p}}{S}\right)^{\frac{i}{8}} $ (4)

其中, S表示背景涨落标准方差($\sigma$)的5倍, $I_{p}$为像斑中最大的像元响应值. ISO 0~ISO 4的光度值计算取i=(0~4)由式(4)计算可得. ISOCOR表示将等光度计算的轮廓等效到高斯模型下的圆形轮廓.

除了等光度轮廓的测量, 第Ⅰ组新参量中还包含其他的轮廓辅助测量参量.例如参量1~3分别表示占流量20%和10%处的孔径大小, 以及孔径为2.5像元内的总流量; 参量9~11表示由不同测光方法得到的光度流量比值; 参量12表示星等的测量误差; 参量13表示恒星与星系的分类标识, 取值为0~1之间, 是一个与星像椭率相关的量.

2 训练样本的构建

天文瞬变源自动识别系统使用监督式机器学习方法.即在大量训练样本类别已知的情况下, 通过机器学习训练分类器.数学表述为: $o[(v_{1}, v_{2}, v_{3}, \cdots), class]$, o表示一个对象, $v_{i}$表示对象第i个特征参量, 所有特征参量一起构成对象的特征参量空间, 而$class$则表示对象o的类别.

天文瞬变源是相对稀有事件, 实际观测瞬变源数据难以提供足够数量的训练样本集, 尤其对于无历史数据积累的刚建成的观测设备.利用仿真的方法构建训练样本是唯一可行的途径, 但如何使仿真的样本具有较高的真实性, 是要解决问题的关键点.像斑的轮廓是能正确分类的关键因素.因此在仿真重构训练样本时, 采用真实的星像作为星像轮廓模板, 而仿真调整的参数仅仅是像斑的位置和像斑的响应流量.

主要通过两种方法仿真瞬变源: 1)从去除背景的图像中选出一批(约400颗/幅图)从亮到暗不等的星, 作为星像轮廓模板.选取星像轮廓模板时需要保证这些星像不受周围星的干扰, 相对比较孤立.将这些星像轮廓模板按随机位置(或有规则排列)叠加到原始观测图像中构建出含有瞬变源的仿真观测图像. 2)从去除背景的图像中选出一颗较为孤立的星, 以10倍半高全宽7的窗口从图像中裁剪出来, 作为星像轮廓模板.然后, 对该模板的流量进行仿真重构.仿真重构的流量从饱和星等开始一直到极限星等附近(最暗星仿真到$2.5\, \sigma$).最后按照随机方式(或者有规则排列)将这些仿真的星撒回到实际观测的图像中构建出含有瞬变源的仿真图像.

7半高全宽(FWHM):二维高斯函数拟合计算.

以上两种方法仿真瞬变源的整个过程如图 3所示, 得到的仿真观测图像与实测的模板图像相减得到残差图像, 然后通过特征参量的提取得到前述的$v_{1}, v_{2}, v_{3}, \cdots, v_{i}$, 而$class$可由仿真瞬变源注入时的位置信息, 利用位置搜索得到相应的瞬变源分类信息.最后加入肉眼识别去除因饱和星带来的干扰.考虑饱星和变星等干扰因素后, 我们的样本污染程度<5%, 而根据以前的研究[6], 样本的受污染程度<10%都是可靠的.

图 3 仿真瞬变源样本构建过程 Figure 3 The flowchart of transients simulation

以上两种方法各有优点.方法1能够仿真构建出多种真实轮廓, 因为一幅图像在不同位置星像轮廓会有一些细小的差异.方法2能根据需要仿真出任何不同亮度的目标, 便于对探测极限附近星像的仿真和探测能力评估.两种方法相辅相成, 共同完成训练样本的有效构建.

3 系统的实现

天文瞬变源候选体搜索的数据处理流程如图 4所示.主要包括如下过程: 1)图像相减过程, 即在完成观测图像与模板图的轮廓与流量匹配后进行相减获取残差图像; 2)对残差图像完成点源提取; 3)点源提取的星表和残差图像输入到自动识别系统(虚线框部分).自动识别系统主要完成图像预处理与特征参量提取、数值过滤器、自动分类器. 4)输出自动识别出的瞬变源候选体.

图 4 瞬变源候选体的搜索流程图 Figure 4 The flowchart of transient candidates search

本识别系统的工程化实现主要基于pyth-on(2.7)和机器学习处理包python-sklearn以及其他相关的天文数据处理包pyfits等.除前述算法外, 还加入一个数值过滤器处理模块, 主要实现对亮星相减后残差噪声的定向去除.判据的物理意义是相减后的残差图像像斑的相应孔径内存在若干个光度小于(接近)零或者大大小于背景噪声水平的像元, 则认为是噪声而非真实瞬变源.判断标准主要通过对实测数据的处理分析总结得出, 数学描述如下:

$ \begin{align} \begin{cases} {\rm len}(Flux15_{x, y}==1e-30)>10\\[1mm] {\rm len}(Flux8_{x, y}==1e-30)>3\\[1mm] {\rm len}(Flux15_{x, y}<{\rm med}(Flux15_{x, y})-6\sigma)>5\\[1mm] {\rm len}(Flux8_{x, y}<{\rm med}(Flux8_{x, y})-4\sigma)>3 \end{cases} \end{align} $ (5)

其中, $Flux15_{x, y}$$Flux8_{x, y}$分别表示以像斑中心为中心分别截取的$15\times15$$8\times8$像元大小的窗口图像. len$(\cdot)$表示统计满足条件像元数目算符, med$(\cdot)$为中值计算算符, $\sigma$为窗口图像背景的标准方差.式(5)中的4个判据条件只要满足其一即被证伪, 从瞬变源候选体中排除出去.

Buisson等[7]的系统性对比测试表明针对瞬变源识别的数据和处理特点, 随机森林(Random forest, RF)[10-12]算法具有较优秀的表现.随机森林是利用多棵决策树对样本进行训练和预测的一种分类器.在预测某一个测试样本类别时, 由随机森林中的所有树共同投票决定, 样本的类别取决于投票数多少.该算法具有训练速度快、容易实现并行化, 能够快速处理高维数据、可以处理离散型变量(分类)和连续型变量(回归)、分类器训练完成后能够给出特征参量的重要性信息、预测时能够给出测试集中每个实例属于不同类别的概率等优点.因此, 采用随机森林算法实现样本的训练与分类.主要的设置参数取值如表 2所示.

表 2 随机森林主要参数 Table 2 The main parameters of random forest
4 自动识别系统的测试与验证

为了测试与验证本系统的识别正确率及在处理速度上的表现能力, 主要通过两种途径: 1)在Mini-GWAC的实测数据中加入仿真瞬变源的方法. 2) Mini-GWAC在实际观测中的性能表现.

测试途径1.采用1 200幅与训练样本不同的分别来自不同观测夜的数据.在每一幅实测的观测图像中注入大约400颗不同亮度的仿真瞬变源, 仿真瞬变源通过实际星像轮廓模板的仿真方法得出.然后按照图 4的流程执行处理.为了测试数值过滤器的性能, 对过滤器执行过滤的源不做真实剔除而是仅做标识便于前后对比.对比测试主要分成3组:测试A组为本系统, 采用特征参量为Ⅰ+Ⅱ组; 测试B组采用特征参量Ⅱ+Ⅲ组; 测试C组仅采用特征参量第Ⅱ组.测试平台的硬件设备CPU为: Core i7 2 600 K, 内存15 GB.软件系统为Scientific Linux 6.0版本.

测试的结果与分析: 1)数据处理速度: A、B、C三组处理每幅图像的平均时间为9.7 s, 98 s, 8.4 s.三组数据的比较表明, A组(本系统)较B组(文献[8]的主要参量)提速近10倍.从总的分析来看, 主要的数据处理耗时来自特征参量的提取.差异的主要原因分析:等光度轮廓测量较PSF做拟合的测量方法处理速度更快.另外, B组部分参量需要对模板图像进行操作, 从过程来说更为复杂, 因而增加了数据处理时间. C组仅用一组特征参量因此耗时最短. 2)筛选样本的正确检出率与错误检出率:图 5表示A(Ⅰ+Ⅱ)、B(Ⅱ+Ⅲ)、C(Ⅱ)三组方法在对不同信噪比(点源测光提取时的信噪比)瞬变源的正确检出率.结果表明, 信噪比>20的所有源都能被三组方法100%正确识别.信噪比等于=14时A和B能保持一致的10%识别正确率.随着信噪降低, A方法相对B方法在低信噪比降低过程中, 体现出更高的识别正确率, 在信噪比为3.4时8仍有85%以上的正确识别率.错误检出率(不是瞬变源当成瞬变源的数目占总检出数目的比率): A方法为8.6%, B方法为3.6%, C方法为6.4%. A的错检率最高, 当加入数值滤波器后, A的错检率会降到和B同等水平, 接近3%.结果分析: PSF拟合方法对星像轮廓的描述对于低信噪比不敏感, 而等光度轮廓测量不依赖拟合而是直接测量对于低信噪比部份更为敏感, 同时对于是否圆形形状不敏感, 导致对部分亮星留下的残差的错误识别.当加数值过滤处理后, 能很好地消除这方面噪声引起的错误检出.

8在此信噪比下即使肉眼辨星也有些困难.

图 5 新特征参量的有效性 Figure 5 Effectiveness of the new features

测试途径2.本系统应用于Mini-GWAC实际观测的实时处理测试.经过大约半年的应用测试, 结果表明, 能实时地完成瞬变源的自动快速识别, 通过与星表交叉法找瞬变源在线处理结果交叉验证, 对比测试交叉的正确率在$99%$以上.交叉测试结果表明, 本文的识别方法在暗弱目标及有背景亮星干扰的情况下, 具有更好的筛选能力.图 6为实际观测中, 本文的快速自动识别方法发现的一个真实的瞬变源耀星.

图 6 一个真实的瞬变源耀星 Figure 6 An example transient of flare star
5 讨论与总结

针对现代大数据瞬变源巡天要求快速自动搜索瞬变源的技术需求, 结合我国在建中的地基广角相机阵的数据特点, 抓住星像轮廓的光度分布是自动识别的关键特征参量, 通过优化研究并开发了天文瞬变源自动识别系统.

本识别系统主要通过引入新的13个包括等光度测量星像轮廓的特征参量取代国际主流算法(Goldstein等[8])中的PSF拟合方法测量星像轮廓的参量.同时, 去除与模板相关的特征参量, 降低了数据处理的复杂度, 提高了数据处理速度.与Goldstein等[8]的算法相比, 处理速度提高近10倍.而正确检出率具有相同水平, 尤其在低信噪比处, 等光度测光星像轮廓参量比拟合法测轮廓参量更为敏感.从理论上分析也支持了这一测试结果.

基于天文瞬变源是相对稀有事件, 难以获取足够数量的训练样本.利用仿真方法构建训练样本集, 即采用真实的星像作为星像轮廓模板, 而仿真调整的参数仅是像斑的位置和像斑的响应流量, 从而实现较真实的数据仿真.研究表明, 对于由饱和星(较亮星)相减留下的部分残差噪声被误识别成瞬变源, 导致错误检出率较文献[8]的算法高出5%$, 表明等光度测量轮廓法相对于PSF拟合法对于星像轮廓是否是圆形形状不敏感.我们通过引入数值过滤器专门对此类噪声进行滤除, 最后的错误检出率能控制到与文献[8]的相同水平.

本识别系统已成功应用于我国已建成的迷你地基广角相机阵的实际数据在线处理.通过与星表交叉法找瞬变源在线处理结果的交叉验证, 表明正确率在99%$以上.在正式的地基广角相机阵(GWAC)建成以后, 只需要根据GWAC数据特点重新构建分类训练器, 便可快速实现系统的移植.因而, 本系统对于其他类似的天文大视场, 要求快速实时处理的天文瞬变源识别的项目也具有应用与参考价值.

致谢: 感谢GWAC项目组天文观测与工程维护人员在本系统开发测试过程中提供实测数据及在硬件设备支撑上给予的帮助.
参考文献
1
Perlmutter S, Aldering G, Goldhaber G, Knop R A, Nugent P, Castro P G, Deustua S, Fabbro S, Goobar A, Groom D E. Measurements Ω of Λ and from 42 high-redshift supernovae. The Astronomical Journal, 1999, 517(2): 565-586.
2
Riess A G, Filippenko A V, Challis P, Clocchiatti A, Diercks A, Garnavich P M, Gilliland R L, Hogan C J, Jha S, Kirshner R P, Leibundgut B, Phillips M M, Reiss D, Schmidt B P, Schommer R A, Smith R C, Spyromilio J, Stubbs C, Suntzeff N B, Tonry J. Observational evidence from supernovae for an accelerating universe and a cosmological constant. The Astronomical Journal, 1998, 116(3): 1009-1038. DOI:10.1086/300499
3
Wu Chao, Zhang Tian-Meng, Wang Xiao-Feng, Qiu Yu-Lei. Supernova cosmology:observations and progress. Progress in Astronomy, 2013, 31(1): 37-55.
( 吴潮, 张天萌, 王晓峰, 裘予雷. 超新星宇宙学的观测与研究进展. 天文学进展, 2013, 31(1): 37-55.)
4
Bailey S, Aragon C, Romano R, Thomas R C, Weaver B A, Wong D. How to find more supernovae with less work:object classification techniques for difference imaging. The Astronomical Journal, 2007, 665(2): 1246-1253.
5
Brink H, Richards J W, Poznanski D, Bloom J S, Rice J, Negahban S, Wainwright M. Using machine learning for discovery in synoptic survey imaging data. Monthly Notices of the Royal Astronomical Society, 2013, 435(2): 1047-1060. DOI:10.1093/mnras/stt1306
6
Bloom J S, Richards J W, Nugent P E, Quimby R M, Kasliwal M M, Starr D L, Poznanski D, Ofek E O, Cenko S B, Butler N R, Kulkarni S R, Gal-Yam A, Law N. Automating discovery and classification of transients and variable stars in the synoptic survey era. Publications of the Astronomical Society of the Pacific, 2012, 124(921): 1175-1196. DOI:10.1086/668468
7
Buisson du L, Sivanandam N, Bassett B A, Smith M. Machine learning classification of SDSS transient survey images. Monthly Notices of the Royal Astronomical Society, 2015, 454(2): 2026-2038. DOI:10.1093/mnras/stv2041
8
Goldstein D A, D'Andrea C B, Fischer J A, Foley R J, Gupta R R, Kessler R, Kim A G, Nichol R C, Nugent P E, Papadopoulos A, Sako M, Smith M, Sullivan M, Thomas R C, Wester W, Wolf R C, Abdalla F B, Banerji M, Benoit-Lévy A, Bertin E, Brooks D, Rosell A C, Castander F J, Costa L N D, Covarrubias R, DePoy D L, Desai S, Diehl H T, Doel P, Eifler T F, Neto A F, Finley D A, Flaugher B, Fosalba P, Frieman J, Gerdes D, Gruen D, Gruendl R A, James D, Kuehn K, Kuropatkin N, Lahav O, Li T S, Maia M A G, Makler M, March M, Marshall J L, Martini P, Merritt K W, Miquel R, Nord B, Ogando R, Plazas A A, Romer A K, Roodman A, Sanchez E, Scarpine V, Schubnell M, Sevilla-Noarbe I, Smith R C, Soares-Santos M, Sobreira F, Suchyta E, Swanson M E C, Tarle G, Thaler J, Walker A R. Automated transient identification in the dark energy survey. The Astronomical Journal, 2015, 150(3):Article No. 82 http://www.oalib.com/paper/3558300
9
Bertin E, Arnouts S. SExtractor:software for source extraction. Astronomy and Astrophysics Supplement Series, 1996, 117: 393-404. DOI:10.1051/aas:1996164
10
Breiman L, Forests R. Machine Learning. Netherlands:Kluwer Academic Publishers, 2001, 45:5-32
11
Fang Kuang-Nan, Wu Jian-Bin, Zhu Jian-Ping, Xie Bang-Chang. A review of technologies on random forests. Statistics and Information Forum, 2011, 26(3): 32-38.
( 方匡南, 吴见彬, 朱建平, 谢邦昌. 随机森林方法研究综述. 统计与信息论坛, 2011, 26(3): 32-38.)
12
Huang Yan, Zha Wei-Xiong. Comparison on classification performance between random forests and support vector machine. Software, 2012, 33(6): 107-110.
( 黄衍, 查伟雄. 随机森林与支持向量机分类性能比较. 软件, 2012, 33(6): 107-110.)