在大数据时代,数据可视化 (data visualization) 技术将各种繁杂的数据转换成直观的图形和图像[1],显示数据之间的关联和趋势等关系,通过人脑的视觉思维能力帮助理解大量的数据信息,发现数据中隐含的规律,从而提高数据的使用效率。目前随着电子化数据采集 (EDC) 系统的普遍应用[2],快速实时的数据采集为临床试验数据可视化的实现提供基础。基于EDC的数据可视化可同时向研究者、监查员、数据管理员以及其他相关研究成员呈现数据组织模式、方法及分析结果,实现临床研究数据信息化和图形化的直观展现,可显著提高临床数据管理效率和质量。数据可视化作为一个完整的技术应包括标准图形库、图形软件、标准操作流程 (SOP) 和人员。本文针对临床数据管理过程中的不同阶段和不同类型数据,重点讨论标准图形及其作用。
1 试验过程数据图法检视受试者数据是临床研究的核心内容,数据管理员通过整体比较各访视数据更易甄别其中异常数据点。对于传统临床试验,数据管理员需逐页翻阅病例报告表 (CRF) 或浏览录入数据库才能获得受试者全部数据内容,即使采用eCRF仍需逐个表单查阅才能获取受试者整体数据。而通过数据可视化技术,基于标准的数据库结构可实时的生成受试者轮廓图 (图 1),从整体上直观查阅受试者的各访视期所有数据点及状态。如生命体征的合规数据点及超范围数据点,不良事件发生的开始时间、持续状态、结束时间等,所有数据点均可视化,有利于数据管理员从全局把握临床数据质量。
![]() |
图 1 受试者数据轮廓 |
此外,受试者状态也是整个试验过程中数据管理员、申办方和研究者的关注重点。而通过受试者情况分布图 (图 2) 可以直观了解所有受试者的入组和出组情况,以及各个试验组受试者的脱落原因。分布图通常以条形图为主,如图 2可转换为各研究中心 的受试者筛选和随机入组情况分布图,及时了解各研究中心受试者招募进展从而进行有效追踪和管 理,也可转换为受试者eCRF的数据表单状态 (已录入、未录入、已核查、未核查、已锁定和未锁定) 分布图。以上图形可通过不同状态指标的分析统计直 观地展现和概览整个试验过程的进展状况以掌控试验质量。
![]() |
图 2 试验完成情况分布图. Reason 1: 死亡; Reason 2: 疾病进展; Reason 3: 受试者或其法定代理人要求退出研究; Reason 4: 研究者从受试者的最大利益出发判定应终止研究; Reason 5: 暂停给药后14天内患者无法恢复至≤NCI CTC AE1级或基线值 |
临床试验研究目的不同其疗效指标各不相同,本部分列举的4类可视化图形可针对不同终点指标的特点和不同应用目的进行设计。若直接比较疗前和疗后时间节点疗效指标,可采用Bland-Altman图 (图 3) 结合数据标准范围 (reference range) 来应用; 若通过各访视期历史性动态比较各疗效指标及趋势判断,可采用箱式图 (图 4)、泡泡图 (图 5) 或瀑布图 (图 6) 进行动态观察。
![]() |
图 3 治疗前后血糖状况Bland-Altman图 |
![]() |
图 4 疗效指标收缩压的历史性变化图 |
![]() |
图 5 非劣效高血压临床试验各访视期血压趋势变化泡泡图 |
![]() |
图 6 临床终点疗效指标评估瀑布图 |
Bland-Altman图可以用来显示疗前指标和疗后指标的单一比较,更易于对某些关键指标的重点追踪分析。图 3以血糖为例,将疗前和疗后的血糖值各除以正常值范围上限 (upper limit of normal,ULN)。对角线以上表示血糖变高,对角线以下的表示血糖降低趋势变好,而y = 1的横线以下表示血糖恢复到正常范围的受试者,疗后血糖缺失的受试者均默认值为0全部落在x轴上,并根据血糖值变化的不同 幅度将这些数据点通过不同颜色来区别显示。通过 该图可清楚地了解试验药物的疗效趋势和预计结果。
对于需展现历史性变化的疗效指标,箱式图可以汇聚所有受试者数据点,直观了解该指标在不同试验组间的变化差异和趋势,并可快速发现异常数据点。图 4以收缩压为例比较各组降压情况,所有离群数据点均在箱体外列出。泡泡图可以通过指标趋势变化反映临床试验的结果趋势。如图 5以非劣效设计高血压临床试验为例,若整个临床研究过程中试验组和对照组在各访视期收缩压和舒张压变化趋同,则可以预判该试验结果趋势符合临床试验非劣效的研究假设。
瀑布图根据所有受试者的终点疗效指标评价结果,图形化显示试验组与对照组的最终试验结果与差异,比统计数字更能生动地说明试验结果。图 6以临床有效率判断为终点指标,有效、显效和无效通过不同的颜色显示量化特点,可直观发现该临床试验结果趋势,比统计数据更有利于对试验结果的理解。
3 安全性数据的图法检视在临床试验过程中,药物的安全性数据和疗效数据同等重要,安全性数据通常包括实验室安全性指标及不良事件等。既往对实验室安全性指标通常以文字或列表的形式进行描述,而结合可视化技术可使安全信号监测更直观。对于实验室安全性指标,可通过其正异常转变图直观判断这些指标的正异常转变趋势,适用于所有的常规实验室检查指标与基线值的比较与趋势判断。药物性肝损伤是试验过程中需重点关注的安全性问题,肝损伤的标志有丙氨酸氨基转移酶 (ALT) 高出正常值上限3倍、碱性磷酸酶(ALP) 高出正常值上限2倍、胆红素 (BILI) 高出正常值上限2倍并伴有ALT或ALP的上升。此外,天门冬氨酸氨基转移酶 (AST) 也是一个评价肝损伤及肝毒性的重要依据。通过肝毒性最大值矩阵图 (图 7) 可发现有肝功能受损倾向的受试者,若这些受试者的数据点落在右上方 (第一象限) 内,则表示两项指标同时升高应给予重点关注[3]。
![]() |
图 7 肝毒性最大值矩阵图 |
目前对于不良事件 (AE) 的分析通常只列出AE记录并描述AE发生率,很难发现隐含在这些数据背后的药物安全性信号。而通过可视化技术将必要的统计量整合到图形中,可更直观地发现一些重要AE。通常AE发生率是描述AE发生情况最常用的度量,相对危险度是反映AE发生率在试验组和对照组之间的差异。图 8基于森林图的原理将AE发生率及相对危险度组间差异的统计量进行组合,更直观突显最需要关注的AE。如图中所示“皮肤及皮下组织类疾病”和“肾脏及泌尿系统疾病”是该安慰剂对照临床试验需重点关注的AE。
![]() |
图 8 不良事件发生率及相对风险的组合图 |
数据可视化通过图像图形技术对数据进行形象化处理,通过信息技术对数据进行准确实时的自动化集中处理,不仅直观呈现数据,更易于理解和发现数据中隐藏的规律。以上8类图型分别对临床数据管理过程中不同阶段和不同类型的数据进行了可视化转换,形成一个基础的应用路径,并将多方面信息整合在一起,相对于表格和文字描述既简洁又高效,使临床数据的评价和管理既简单又生动,显著提高基于EDC的电子化数据管理效率。基于此,数据管理员不仅可快速发现问题数据,及时对这些数据进行清理和追踪,同时更易于从整体全局上观察和监控疗效及安全性数据,为受试者提供最大的安全保障。
目前用于临床试验数据管理的图形化工具软件较多[4],包括JMP clinical、Jreview和Spotfire等数据分析软件,并可直接与EDC系统临床数据库对接。通过这些软件可以生成二维和三维散点图、树图、马赛克图、平行图、叠加图、等高线图、气泡图等各种自定义图形; 基于图形生成器通过简单的拖拽生成高度动态的图形,能对数据模式进行可视化的探索性分析; 通过缩放和过滤功能可以用来对数据进行向下钻取,发现具备统计显著性的事件等[5]。随着这些应用的增多,同时EDC系统自带的数据可视化图形功能的扩展和增强,可视化技术将彻底改变电子化数据管理模式,显著提升整个临床试验质量和效率。
[1] | Zhao JG, Luo QY. The research and implementation of network based data visualization [J]. J Daqing Norm Univ (大庆师范学院学报), 2010, 30: 5−7. |
[2] | Chen JC, Liu HX, HE YC, et al. The development of the electronic clinical trials and its future vision [J]. Chin J New Drugs (中国新药杂志), 2014, 23: 377−380. |
[3] | Yuan YN, Yao C, Yan XY, et al. Visualization of laboratory data from clinical trials [J]. Chin J New Drugs (中国新药杂志), 2015, 21: 402−430. |
[4] | Chen JC, Zheng QS, Huang JH, et al. The current new technologies in e-clinical trials [J]. Chin J New Drugs (中国新药杂志), 2014, 23: 84−87. |
[5] | JMP. JMP Clinical User Guide (version 2.0) [S]. SAS Institute Inc, 2010. |