2. 昆明理工大学 数据科学研究中心,云南 昆明 650500;
3. 中国科学院 大数据挖掘与知识管理重点实验室,北京 100190
2. Center of Data Science, Kunming University of Science and Technology, Kunming 650500, China;
3. Key Laboratory of Big Data Mining and Knowledge Management, Chinese Academy of Sciences, Beijing 100190, China
中国公共数据库系统发展到一定阶段,公共数据资源将成为国家战略资产。有效的数据治理是数据资产形成和高效利用的必要条件[1]。公共数据治理是指在公共部门、公民、企业和社会组织所提供的零散数据基础上形成统一的、可信的主数据,并且依法有序地提供给公共部门、公众、企业和社会组织综合运用的过程。
为公众提供优质的公共数据库数据服务是公共数据当局的首要任务,提供高可信度的电子数据是最重要的任务。其中有一大类电子数据将用作相应的公共产品的证据要件,如居民户籍证明、婚姻证明等,乃至司法和仲裁等维护社会公平正义的一类公共产品中的电子证据。与一般的商业数据治理相比,公共数据治理更多地涉及法律适定性问题。公共数据库数据的电子证据功能涉及很多方面,比如电子证据的生命周期管理以及电子证据存储和归档格式、电子证据与案件事实的关联性等。这类具有电子证据性质的公共数据产品的基本要求是真实可信性及其与现实案件的高度关联性。因此,构造多层的、分布式且防篡改算法和安全的电子证据取证系统是基于公共数据库的电子证据的关键技术。以求解拜占庭将军问题的算法为基础发展起来的区块链技术在去中心化安全技术领域已经取得一定成效,如比特币区块链技术、能源互联网区块链技术等[2-3]。此外,在医疗保健中广泛地实施区块链以提高数据隐私性、互操作性和可扩展性[4-5]。在司法和公共安全信息技术领域,分布式的电子证据广泛存在,急需建立更加严密的电子证据信任技术体系。
按物证说的观点,相对于传统物证而言,电子证据产生和存在的方式有很大的区别,主要体现在电子证据的符号化、易篡改性、可删除性、可分离性、易复制性、易破坏性,使得电子证据在收集和使用过程中真实性会发生改变。狭义的电子证据是指以存储于介质载体中的电磁记录或光电记录并对司法案件审理、仲裁等事实起证明作用的电子数据(含视听资料)及其附属物。除了具有证据的客观性和可知性之外,电子证据还具有非直观性和多态性、电子物理和诉讼证据的多重属性。为了保持电子证据的客观真实性,在获取电子证据时,应采用取证专用的数据拷贝机和电子证据勘验取证技术,附加上时间戳数据,一次性提取和固定介质载体中的全部电子数据。广义的电子证据是指,用于公共管理、认证认可、司法、仲裁、公证等事务的电子数据及其附属物。广义的电子证据与狭义的电子证据相比,应用范围更宽、取证过程相对简单。
电子证据与传统证据相比,最突出的特点是:1)它需要借助一定的介质存储,通常存储于电子设备的存储器中;2)电子证据不能直观查看,必须借助适当的电子系统软硬件环境显示后才能查看;3)由于电子证据存在于虚拟空间,所以可以迅速传播并且精确复制;4)电子证据中的数字证据很容易被修改或删除,并且不易找到更改“痕迹” ;5)有些电子证据有时限性,可能随时间而消失[6]。
电子数据的真实性、合法性、关联性和证明力是电子证据的4个维度。根据刘品新[7]的研究,在司法实践中电子证据被质疑的几率是比较高的。在司法实务中,电子证据的攻防成效令人堪忧,司法运用电子证据尚未形成成熟的机制。鉴于电子证据易受质疑,中华人民共和国最高检察院对电子数据和视听资料的审查、认定和是否作为定案依据有明确的规定,严格要求对电子数据和视听资料结合案件的其它证据审查其真实性和关联性。
由此可见,电子证据的关联性和真实性是电子证据在法庭上是否被采信的关键性指标。作为一种虚拟空间的证据,电子证据用于定案必须同时满足内容上以及载体上的关联性和真实性。互联网、物联网与大数据的出现和发展在极大提高公众和公共部门数据交互效率的同时,也为保障电子证据的真实性、关联性带来了新的挑战。由于公共部门以维护社会公平正义为目的,因此公共数据库的电子证据从内容到载体都应该是电子证据中最为可信的。
传统的公共数据库中数据的应用需求主要包含公共产品供给和消费过程的记录。但是随着网络和智能终端的日益普及,公共数据的边界日益扩大,大量的公共数据的电子化,纳入了海量的机器数据,这将带来公共数据库中的电子数据证据功能复杂化。随着公共数据库数据边界的扩张,公共数据库的电子证据功能将成为公共数据库主要功能之一。如公共安全数据库中的涉案物品记录、消防数据、环境监测、宾馆饭店住宿记录、出租车定位记录以及医疗健康数据库中的电子病历、防疫检疫记录等。
公共数据库的电子证据系统的应用与法律密切相关,可信性是必然要求。在中国的法律框架之下,数据必须满足:1)及时性,数据必须是及时收集的;2)过程性,过程的数据必须被记录;3)不可篡改性,所收集及存储的数据必须证明没有被篡改过。
其中不可篡改性是电子证据的特性,也是电子证据系统设计的关键技术难点。不可篡改性有两个环节:1)公共数据库内部的电子证据生成过程的不可篡改性,即电子证据的保障品质,或保质;2)电子证据的外部转移与再现过程的不可篡改性,即电子证据的保障安全,或保全。
在中国的法律中,电子数据、电子证据概念经常混合使用。在司法、仲裁和行政案件处理实务中,虽然可以作为证据使用(电子证据、电子书证或视听电子材料),但是单一的电子证据并不能够作为判定事实的根据,电子证据需要跟其他证据一起使用,并且可以相互印证,因此组成证据链条来证明案件事实。电子证据有效的前提是电子数据本身是可信的。区块链技术在解决共享经济中的信任问题方面颇具潜力,在某种程度上区块链适合取代第三方的信任[8-9]。
公共数据库是公共产品,公共部门是其供给者。公共部门有义务依法从其主导的公共数据库中提供公民和法人所需要的一切电子证据(证明)。当公民和组织必须需要公共数据库中的电子数据维护自身权益的时候,公共部门必须向他们提供具有完整法律效力的电子证据。这些电子证据的运用可能不仅限于司法事务。在公共部门提供电子证据时,必须保证数据的真实性和证明力,同时要尽量保护当事人隐私和他人利益。因此,从公共数据库中提取电子数据并形成有效电子证据既是法律难题也是技术难题。
本文将构建自动生成中国公共数据库电子证据系统的区块链模型及其取证技术体系,在一定程度上保证了司法、公证和公共事务中电子证据的可信性。最后提出了公共数据治理的电子证据生命周期管理并对电子证据的关联性进行了分析。
1 电子证据可信性的影响因素分析电子证据的不可篡改性包括数据的保质和保全,它与传统证据的有效性与证据保全相对应,具体体现在电子证据的数据攫取、固定、保管、转移等各个环节。但与传统证据相比,电子证据的产生和存在的形式完全不同[10]。由于电子数据科技含量高、易篡改、可分离等特点,使之非常容易被修改、伪造和删除,加大了电子证据的保质和保全难度,仅仅通过法律措施和公证机关很难有效控制电子证据的法律效力。从普通证据学的原理来说,司法实践中对传统证据认定普遍采用正面认定法和侧面认定法,其中正面认定法是主要方法。参照传统证据的认定,电子证据的正面认定须保证电子数据的可靠性,在其运行的各个环节都有辅助证据(如数据标签、时间戳)加以证明,形成电子数据保管锁链。由于电子数据通常是潜在的且与大量的无关信息纠缠共存,有时甚至已经被删除,故需要通过专门的技术手段发现和获得有价值的证据信息,这就是电子证据检验技术。电子证据检验技术是对电子设备中存在的电子数据(电子证据)进行识别、发现、提取、保存、恢复、展示、分析和鉴定的一种全过程的科学技术,其检验结果可作为法庭证据或案件侦查线索。
电子证据正面认定的审查需要以下环节:
1)生成环节,即电子证据中的数据是如何生成的。这一环节审查电子证据数据是设备采集还是人工录入。如果是设备采集的则进一步确认是由人工使用设备采集还是设备自动采集。如果是人工使用设备采集,则需要确认采集者是否具备采集资格和设备是否正常。如果是机器自动采集数据,则需认定设备是否正常。采集人员和设备是否正常,则需要合法的第三方认定或检测机构相关电子文书。
2)获取的方式。审查内容包括:采集过程是否合法,采集方法是否科学、可靠,采集过程是否得到被采集方认可。
3)传输环节。审查电子证据的数据形成过程和传输过程中使用的计算机网络或专用设备是否正常,传输过程中电子证据的数据是否可能被修改,传输过程中数据是否被非法复制、截取。
4)存储环节。该环节审查电子证据数据是怎样存储的,是否科学,存储介质与存储过程是否安全可靠,是否以加密形式存储,存储后是否有访问权限上的漏洞,存储中是否有非法篡改和销毁的风险。
2 电子证据系统的区块链数据模型关于电子证据系统的保质问题,我国迄今为止没有法律规定,也没有完整的行政规范。为了解决公共数据库中可能用于电子证据的数据的可信性,必须建立公共数据库的全局信任机制。有效的解决办法是在公共数据库中建立区块链系统的“智能合约”层,即建立一种无法被篡改和操控的“代码合同”[11]。智能合约并非法律所界定的合同,而是执行在区块链上的代码,故也称作“链上代码”。为了实现中国公共数据库中用于提供电子证据的部分数据的法律效力,这种链上代码必须遵从不可篡改性和法律上的可验证性。电子证据系统在公共数据库数据生产过程中提取的数据在数据博弈参与者之间形成区块链,其分布式账本将保证数据的一致性、不可篡改性和合法性[12]。在事务方式上,电子证据系统的区块链的每个节点上都有自己的本地数据库。
根据电子证据系统的上述要求,我们构建一种基于区块链的数据安全共享网络体系,如图1所示。
![]() |
Download:
|
图 1 电子证据区块链结构 Fig. 1 Blockchain structure of the E-evidence system |
该体系依赖于现有的数据仓库架构[13-14],将电子数据作为一种资产进行统一标识,利用区块链技术将数据进行分布式存储,通过设计高效分发协议,实现数据在参与者之间的自主对等的P2P电子证据网络(peer to peer i-evidence network,P2PIEN)。该电子证据网络依托于公共数据库网络的物理系统和数据博弈覆盖网络,在逻辑上遵从电子证据系统的法律要求,并且将部分公共数据库系统事务流程去中心化[15]。本质上讲,电子证据系统是将法规所要求部分公共电子数据本地备份并形成共识节点。P2PIEN的具体内容参见文献[16]。
例1 学历认证的电子证据系统原型的核心区块链。学历认证的电子证据区块链系统原型主要由从教育公共数据库(目前包括校级、省级及国家级数据库)中自动获取数据、形成区块并将数据加载进区块链中及进行学历认证过程3部分组成。
1)获取数据阶段:将学生信息按学号自动从数据库提取出来,提取出的同一学生的不同粒度的记录将会起到相互佐证作用。获取公共数据库记录部分源码如图2。
![]() |
Download:
|
图 2 获取数据部分源码 Fig. 2 Get the data part of the source code |
2)数据加入区块链阶段:首先,将提取的每一条学生信息形成一个区块;其次,各用户对该区块进行共识;最后,一旦共识成功,对区块进行链接,形成完整的区块链。通过共识算法来保证用户账本之间的一致性,即分布式记账核心。将具体的区块加入区块链过程如图3~6。
![]() |
Download:
|
图 3 数据加入区块链 Fig. 3 Data is added to the blockchain |
![]() |
Download:
|
图 4 校级联盟区块链 Fig. 4 School-level alliance blockchain |
![]() |
Download:
|
图 5 省级联盟区块链 Fig. 5 Provincal-level alliance blockchain |
![]() |
Download:
|
图 6 国家级联盟区块链 Fig. 6 National-level alliance blockchain |
3)进行学历认证过程:一方面,尽管任何一级的数据库中的数据可以被管理员进行修改/删除,但是修改后的数据记录只能以新的区块形式加入对应的链条中去;另一方面,当试图修改/删除已形成的区块的数据,将导致其他用户账本对应的区块信息不一致,这是不允许发生的。图7~8显示的是区块链中的数据与某账本改变区块数据失败验证。
![]() |
Download:
|
图 7 读取区块链中的信息 Fig. 7 Read the information in the blockchain |
![]() |
Download:
|
图 8 修改信息失败 Fig. 8 Modifying information failed |
电子证据包括取证任务生成、物理介质、取证认证、电子数据和电子证据提交。电子证据本质上仍然是计算机产生的数据,在传输和存储过程中表现为0和1构成的字符串。在电子证据取证和保全过程中,需要设置CA服务器。通过运用信息安全技术生成对电子证据本身具有证明作用的辅助证据,形成电子证据的链锁。电子证据采集和保管系统由一个C/S架构的软件系统和相应的硬件部署,外加便携式U盘取证工具组成。硬件部署包括CA服务器、数据库服务器、工作主机、U盘取证终端。
1) CA服务器:提供对系统用户(如法院、检察院等)的注册和认证,项目和任务的认证和授权,任务证书的生成、签发,电子证据加密密钥和签名密钥的生成和发放等服务。
2)数据库服务器:提供对系统用户数据库、项目任务数据库和电子证据数据库的服务支持。其中电子证据数据库是公共数据库中区块链的本地数据服务器,负责相应各级数据提供者的数据变更和本地备份,将受到智能合约的控制