大数据时代科学研究新范式的哲学反思

引用本文

王东. 大数据时代科学研究新范式的哲学反思[J]. 科学与社会, 2016, 6(3): 116-127. 复制到剪切板

WANG Dong. Philosophical Reflection On the New Paradigm of Scientific Research in the Era of Big Data[J]. Science and Society, 2016, 6(3): 116-127. 复制到剪切板

作者简介

王东,北京工商大学法学院/马克思主义学院讲师。研究方向为一般科学哲学、认知科学哲学、数学哲学


目录 Contents	摘要 Abstract	全文 Full text	图表 Figures/Tables	PDF PDF

大数据时代科学研究新范式的哲学反思

王东

北京工商大学法学院/马克思主义学院

作者简介：王东,北京工商大学法学院/马克思主义学院讲师。研究方向为一般科学哲学、认知科学哲学、数学哲学

摘要: 大数据时代出现了一种新的科学研究类型——直接通过科学数据分析进行科学研究并作出科学发现。科学界及哲学界就其是否构成新的科学研究范式、数据驱动型科学发现是否会终结科学理论、数据与理论的关系等问题，展开了争论。但是，进一步的研究显示，还需要区分不同的学科和研究层次，并从认知角度从机制上说明数据在科学发现活动中的作用及其与理论的关系。

关键词: 数据驱动型科学研究范式转化认知机制

随着实验技术和信息技术的进步以及科学自身的累积性发展，科学研究中的数据无论是在量、种类还是复杂性上都呈爆炸式增长。加速器、望远镜、卫星、传感器网络、超级计算机、医疗成像设备、DNA测序仪、智能移动终端、互联网应用，计算机模拟等设施和活动正在快速产生着海量的数据，几乎每个学科领域都在经历着数据爆炸^[1]。例如高能物理中一些大型强子对撞机每年能产生PB级别的数据，各种口径的大型巡天望远镜一晚上能产生TB级别的数据，各种大型计算机上运行的科学模型也产生大量的数据，而分布在全球各个地点的各种科学用途的自动传感器更是在不间断地收集数据并传送到各种类型的专业数据库以供研究。

在此基础上，一部分科学家并不直接与真实物理世界的研究对象打交道，而是通过分析各种数据来进行科学研究并取得科学发现。这种类型的科学研究一般被称为数据密集型科学研究^[2]或者是数据驱动型科学研究，在此基础上主要依靠对数据的分析而做出的科学发现，则被称为数据密集型科学发现^[3]或者数据驱动型科学发现。例如，对高能物理实验产生的海量数据进行各种处理和分析后，才能找到其中的物理规律；很多天文学家就是在由大量巡天数据构建的虚拟天文馆中进行科学研究，而不是直接去操作望远镜；在生物多样性的研究中，则是通过各种渠道综合多样化的数据，例如地形、气候、动物活动信息等，建立统一的多维数据库，通过对数据库的分析得到科学发现^[4]；同样，在气象、地学、生物医学等领域也出现很多这类的科学研究^[1]。

“数据驱动型科学研究”这一名称被提出的同时，诸如当前的科学研究中哪些算是数据驱动的、效果如何、将来的发展如何等等相关的扩展问题也被提出来。要讨论这些问题，首先应该大致界定什么是所谓的数据驱动，但数据驱动科学研究或者说数据驱动方法本身的一般性特点很难被概括。本文即是要厘清围绕这样一种研究发现存在哪些争论，是否构成新的科学研究范式等问题，并从认知角度说明数据在科学发现活动中的作用及其与理论的关系。

一、数据驱动型科学发现的相关争论

在各种不同的学科中，直接通过科学数据分析进行科学研究并作出科学发现，其实际操作上差异极大，但是总结起来，可以看出两个主要的特征^[5]：一是，科学推理的关键方法是从已有的数据中进行归纳，并指导和帮助实验研究；二是，机器和自动推理在从已有数据中抽取有意义的信息中占有重要位置。除此之外，“数据密集型”与“数据驱动型”也有所区别。在基于数据密集型的科学发现中，数据扮演的角色各不相同。

在一些科学发现中，数据从属于理论。例如引力波探测，从完成实验到最后得出结论的这半年多的时间主要用于分析收集到的海量数据。这是典型的数据密集型科学活动，但是这一科学发现本身并不是直接由数据分析而来。也就是说，实验前期的科学理论假设对引力波探测起主导作用，实验数据只是对理论假设的一种验证，是从属性质的。这类研究可以算作是数据密集型，但不是数据驱动型。

还有一类基于数据密集型的科学发现主要是通过数据分析得到最终结果，但是数据的参与程度不同：一些科学发现在对数据进行采集或者分析之前，就已经通过已有的科学理论框定了待发现的大致框架，数据分析的作用仅仅是发现内容或者某些模式，例如上文提到的生物多样性的研究。而一些数据密集型的科学发现却有可能得到新的定律，或者发现旧定律的错误。例如在复杂性科学中，一些关于流量涨落的研究从大量的数据中发现过去的流量涨落律不正确，并提出了修正后的结果^[6]。这就是数据驱动型的科学发现。

针对科学研究中出现的上述特征，一些科学家和哲学家就一系列问题展开讨论，包括数据密集型科学研究是否带来科学研究范式的改变，当前科学及其发展取向究竟应该是理论驱动还是数据驱动等。其中，图灵奖得主吉姆·格瑞提出的第四范式理论比较有影响力。他认为，科学发展至今依次出现了四种范式：千年以前只有经验科学，仅仅描述自然现象；数百年前出现理论科学，出现各种定律和定理，并运用各种模型，比如开普勒定律、牛顿运动定律等；近几十年，理论分析方法变得非常复杂以至于难以解决难题，人们开始寻求模拟方法，于是产生了科学的计算分支；而科学无疑是不断向前发展的，模拟连同实验产生了大量的数据，于是一种新科研模式产生了——用软件处理由各种仪器或模拟实验产生的大量数据，并将得到的信息或知识存储在计算机中，科研人员再从这些计算机中查找数据。比如在天文学研究中，科研人员并不直接通过天文望远镜进行研究，而是通过数据中心查找所需数据进行分析研究。数据中心的这些数据是由各种天文设备收集的，且数量巨大。

吉姆·格瑞的第四种科学范式统一了经验、理论、模拟三种范式，并分成四个步骤^[3]：第一步，通过仪器设备获取数据或者通过仿真模拟产生数据；第二步，通过软件处理数据；第三步，将相关信息和知识存储在电脑中；第四步，科学家使用数据管理和统计方法分析数据库和文档。

除此之外，有一些极端的经验主义的观点认为，理论在大数据时代的科学研究中已经终结，我们只需要拿到全数据，就可以通过数据分析技术了解领域的所有知识。这种乐观的观点更多地是出现在科学技术商业应用和社会科学的研究上，且其鼓吹者是多科技媒体。例如，《连线》(Wired)杂志的前主编C·安德森(C·Anderson)就认为，我们不需要理论预设，相关性就已经足够并可以取代因果性，我们只需把大量数字扔到计算机中，找到其中的模式(pattern)就可以；甚至科学可以在没有清晰一致的模型、统一的理论下发展^[7]。还有一些观点认为大数据带来的数据驱动型科学研究已经构成科学研究的范式转化，同时在社会科学和人文领域也带来革命性冲击，但是需要批判性地反思这种认识论层次上的变化，并认为绝对地区分理论和数据的用途以及武断地宣称理论终结都是错误的^[8]。

相反，另一些观点则把那些认为可以依靠数据密集型科学研究推动科学发展的思想看作是曾经失败的归纳主义的思想。他们认为，仅仅靠数据驱动无法发现普世科学理论，数据驱动无法产出科学“发现的逻辑”；大数据与科学实验并不兼容，因为其主要都是被动的观察数据，而实验要求主动设计；就算是获得了研究对象的所有方面的数据，也无法产出科学理论，因为一切与一切系相关联会导致太多可能性，从而等于什么都没说。他们认为，找出真正的关联需要巨量的背景知识、理论预设等等。科学不仅仅要求把一个系统的输入和输出联系起来，还要求解释理论。例如，波义耳定律不仅要求知道在恒定温度下气体体积和压力的关系，还需要用气体分子运动理论去解释。除此之外，数据密集型科学研究还可能导致一种新型的“归纳偏见”。在对数据进行归纳的过程中，通过已知数据点得到一条通用曲线有很多选择，但是人们往往只用特定的标准(例如简单性等)来筛选。而在大数据的归纳分析中，也同样存在“归纳偏见”——机器学习等分析技术是黑箱版本的归纳偏见^[9]。

当然，除了一些比较极端的完全支持用相关性替代因果性^①以及完全反对大数据对科学研究革命性作用的观点之外，大多数讨论在结论上还是相对谨慎，主张当前大数据对科学研究的影响还在深化中，需要更加深入地研究数据驱动型的科学研究到底在认识论上有什么新特点，将来数据驱动与理论驱动谁会占主导，亦或两者融合成一种新的研究范式，等等问题。例如萨宾娜·来奥内利(Sabina Leonelli)就认为，首先应该去分析和研究科学研究中数据到底是如何传播以及被用来产生知识的。她分析、追踪了生物学中一些数据库的使用情况，例如过去几十年实验生物学中模式生物(model organisms)数据的传播、整合及在此基础上被再次使用的情况。

① 在当前大数据的话语体系下，相关性与因果性似乎是两种相排斥的东西，但如果从人类认知实践的角度看，实际上两者是有可能相通的，因为人类对因果性的处理或者感官来源可能恰恰就是相关性，相关性相对来说是一个范围更广的概念，有因果性就必然包含相关性。

数据密集型科学研究的大数据不仅数量大，而且种类多，这在生物学这个历史上曾经内部各子学科独立发展且多研究范式并存的学科中尤其明显。生物学多年来积累了大量各种不同类型的数据。来奥内利为了分析生物学数据库中这些数据的“历程”(journeys)，把数据依据从采集到使用的过程分为三个阶段：

第一个是去语境化(De-contextualization)阶段。由于生物学中数据产生和采集的碎片化和多样化，使得各个来源的数据如果想要兼容进入统一数据库，并更容易地被第一次接触到这些数据的研究者用于分析，就需要“去语境”这个操作。这一过程目前存在的难点是，由于语境涉及到数据背后不同的理论支持和技术规格等等因素，目前还无法自动去除，而是需要人工手动操作。所以，这在目前是一项需要大量人力的劳动密集型工作。

第二个阶段是恢复语境(Re-contextualization)或者说再构造语境阶段。各种不同种类的数据去语境纳入到统一数据库后，需要被一种新的研究语境重新编辑，这样才能与其他的数据整合，以便找到数据之间的联系从而做出科学发现。

第三个阶段是数据的再使用(Re-use)，即对已经重新统一语境和格式的数据进行分析和使用。通过这些分析，来奥内利发现，生物学数据库的构造和使用存在很多不足，例如，生物学中很多数据无法被去语境和再语境化，能够成功纳入数据库的很多都是低层级对象的数据(例如基因组数据)，这对生物学中的高层级对象研究来说是不利的。由此，她认为虽然大数据环境下的数据密集型科学研究有其特殊的方法论特点，但至少在生物学领域还没形成一种新的认知论，即一种范式的转换^[10]。更具体来说，她认为过去几十年间大数据下的科学带来了两个重要的转变：一是数据作为一种“商品”明显带有非常高的科学、经济、政治和社会的价值；二是一系列处理数据的新方法、设施和技术涌现出来。对于生物学来说，虽然这两点转变都非常明显，但是仍不能称之一种范式革命^[10]。

与国外学者关于数据驱动与理论驱动以及范式转换的争论相比，国内研究者更多地分析数据密集型科学的特征以及大数据对科学研究带来影响，以及对认识论的新发展。例如，张晓强等人分析了数据活动从经验层面、方法层面对传统科学研究的影响，以及造成的科学的研究对象、研究层次以及研究类型方面的转变^[11]；而黄欣荣分析了大数据对科学认识论的发展，认为大数据用相关性补充了传统认识论只追求因果性的偏执，发展了科学认识论的目标，数据挖掘手段补充了科学知识的生产手段，增添了科学发现的逻辑新通道，数据规律补充了单一的因果规律，从而拓展了科学规律的范围^[12]。

二、争论中存在的问题

当前，关于大数据环境下数据密集型科学研究和数据驱动型科学发现是否构成科学研究新范式，与传统科学研究和发现过程的本质区别，数据驱动与理论驱动的关系等一系列争论，至少还存在两个问题：

一是把科学作为一个整体来看待，没有区分不同的学科以及不同的科学研究类型和层次^①。在大数据环境下，数据密集型科学研究方法在不同的学科中作用不同，数据分析在复杂的科学发现中贡献也不同。例如，像粒子物理这样的基础学科虽然也在不断积累大量数据，其数据分析也常常对提出新的假说起到关键作用，但理论假设本身仍在科学发现过程中占据主导地位，大量的实验和数据采集仍需在理论的指导下做出。再例如，在各种大型强子对撞机上进行各种碰撞实验，一般都是在有预先设计的情况下寻找特定的现象。此外还有寻找引力波而构建的实验体系，目的都很明确。

① 来奥内利倒是以生物学的讨论为主，但做结论的时候还是没有区分生物学中不同的研究层次。

这类基础学科由于理论本身的深度，所需的实验技术高度专业和细化，目前理论本身涉及到的变量层次并不是单一实验仪器所能涵盖的，且实验数据本身的尺度就是研究对象的尺度，同时又需要通过人工强化和纯化自然现象从而发现新的现象。实验的目的大多在于拓展研究的深度，很难或者不可能做到全数据，因此在这些数据密集型科学发现中，数据分析仍然扮演从属角色。

在一些相对来说更加偏向应用型的科学领域中，例如生态学、地学等，其理论本身更加依赖于基础科学，而研究对象或者现象本身又大多是一种复杂性现象，因此需要通过更简单、更基础的现象和数据来解释，即数据本身的尺度与最终要获得科学发现的研究对象的尺度往往不在一个层次，通常这些科学发现是对变量之间模式的一种发现，可以通过对采集到的信息做数据分析从而得到重大科学发现。例如在认知神经科学中，最重要的工作就是找到人的心理学活动或者认知功能对应的神经活动模式或区域。认知神经科学在研究人的神经系统活动时，面对的变量主要是神经元的发放模式。进行相应的实验所需要的技术依赖于其他学科的发展以及技术进步，例如功能性核磁共振技术、脑电技术、单神经元追踪技术等等。获得数据之后(当然也同时要获知相应的认知功能和心理状态等相关数据)，常常仅仅通过数据处理，找到数据之间的关联性，就可以做出科学发现。同样，在其它学科例如系统科学和复杂性科学中，也有很多领域如此，特别是在复杂性科学中。除了不同学科之外，同一学科内部不同领域之间，例如物理学中基础物理学与应用物理领域也有很大的差别。此处不再一一列举。

二是仍旧用静态的和孤立的方式看待“数据”和“理论”之间的关系，没有把它们作为一个整体纳入到有机的科学实践活动中看待，同时对理论与数据之间的关系、数据在科学发现实践活动中的作用的探讨还未深入到机制层面，大多还停留在对现象的描述。如果说传统的科学研究是理论驱动的，那么理论到底是如何“驱动”科学研究的？仅仅说科学家根据已有的理论构造实验，构造科学假说并证实或证伪然后推进科学，这只是科学社会学式的描述，并没有在深层机制上说明驱动的原因。同样，在所谓的数据驱动科学发现中，数据到底如何起作用，数据分析为何得出有“意义”的发现和结论，也一直没有讨论清楚，而这些问题显然无法仅通过描述科学活动中科学家如何使用数据分析来回答。科学活动一直伴随理论的创造与数据的制造，两者在不同时代科学活动中的关系如何，对当前的问题极其重要。实际的理论活动及其与科学其它活动的关系错综复杂，理论需要通过科学实践才能够实现其驱动功能，而数据也不仅仅是用于分析的东西。对于这些问题，特别是数据分析在整个科学发现活动中占据什么样的位置，目前的研究也并未清晰。

科学数据历来在科学活动中发挥重要作用，是科学发现过程中的重要环节。对自然的数学化是近代科学的标志之一。数学化首先是对研究对象等进行量的刻画，而量的刻画可以看作是一种对比关系，或者说是在不同对象之间建立可比较和操作的联系；数学则是在不同的对象之间建立起联系，是一种齐一性的工具，由此得到的科学数据就是人类在比较和操作不同对象之间的各种联系。而基于此的理论则可以看作是一种关于数据的假说，用数据作为中介来说明各种不同对象之间的一种恒常性的关系。例如，开普勒在第谷留下的大量天文观测数据中发现了行星的椭圆运动，即不同天体之间的空间运行轨迹关系；孟德尔更是在豌豆实验的大量数据中发现了性状遗传规律。但是，对历史上的科学发现与数据之间的关系，我们也仅能考察到这个层面，虽然知道科学发现与数据之间的大致联系，但是利用数据做出科学发现的内部因果过程则是人的一种认知性活动，我们还无法了解这一内部规律。当我们想要去刻画当代数据密集型科学研究以及数据驱动型科学发现与传统的理论驱动型科学发现的不同时，这种对于数据与理论之间关系的简单化、表面化的说明显然就不够了。很多研究者认为两者的主要差别在于用相关性替代了因果性，但我们仍然需要深入到科学发现活动的内部考察所谓相关性的内部机制及其与因果性的异同。

三、从认知的角度考察数据在科学活动中的作用

要回应上述两个问题，首先需打破宏大叙事，区分不同学科、不同科学研究层次，考察数据密集型科学研究和数据驱动型科学发现带来的影响和变革，由此才能描绘其对于整个科学的影响。例如可以相对简单地区分科学研究的深度和广度这两个维度：一个维度是通过对已有的数据密集型科学研究领域的分析，进行理论扩展。例如，把某些基础的理论应用到其它领域，相对来说更容易做出数据驱动型科学发现。这是因为在此类研究中，数据获取技术已经定型，并不需要创新，我们更需要的是对所获取的数据进行分析。另一个维度是对某一领域做理论深度上的探索。很多时候数据密集型科学研究仍是一种辅助，相对来说不容易做出数据驱动型的科学发现。所以，如果在这两个维度上把不同科学研究领域依据程度不同进行分类，那么就可以画出一条大数据影响科学发现的曲线。这样比笼统分析大数据是否给科学研究带来范式转化要好得多。

相对第二个问题来说第一个问题更容易操作，只是需要在了解各个学科特点的基础上投入更多的研究资源。而第二个问题则需要深入到数据在科学活动中起作用的内部机制层面，更深层地分析人类使用数据的活动，从而作出一种因果性的说明。我们认为，这首先需要放弃那种静态看待数据与理论关系的方式(这种方式同时也是传统科学哲学一直以来的观点，即静态看待理论并把理论与实践区分开来)，用一种动态实践的角度看待科学实践过程，并考察数据在其中的作用。这种考察不能是现象描述式的，而应该是深入到认知层次的机制描述。

因此，我们可以从认知的角度，即从人类处理信息的认知过程切入，考察数据作为一种人类活动结果和更多活动源头，如何在整个科学活动中起作用。例如，从认知的角度，把人类的科学活动看作是一种从外部世界^①抽取信息并建立关于外部世界模型的过程。模型是一种表征，科学哲学家R·吉尔(R. Giere)甚至认为，科学模型相对于科学理论更重要。吉尔提出一种“模型理论”(model-theory)来理解科学理论，认为我们写在教科书中的，被数学等式定义的物理系统都不是真实世界的系统，而是一种抽象、理想化的系统，是真实世界系统的“模型”。这种模型作为一种表征存在于科学家的心智或大脑中，是科学家对真实世界的抽象，而科学理论则可以看作是这些模型的家族群与连接这些模型和真实世界系统的各种假说的组合。无论如何，如果把科学理论也看作一种广义的模型即对世界的一种表征，那么构建这些模型的数据当然必不可少，但是关键在于数据的运用，即通过实验得来的数据如何变成模型并作出预测，或者说是如何参与模型的建构。这就涉及到所谓“发现的逻辑”。这是逻辑实证主义避而不谈，而其他各种科学社会学等无法真正谈论的，因为这涉及到人的认知过程(当然当代的认知科学仍旧没有搞清楚这一点，甚至还差得远)。从这个角度看，数据与理论的关系可以部分地转化为：数据如何通过人类认知能力转化为各种“模型”。

① 严格区分外部世界和认知主体是认知科学中表征计算进路的基本预设。

从认知角度切入研究有很多优点，其中之一就是可以在深层机制上，把历史上数据在科学活动中的作用做一个统一的、连续的说明(这种连续性甚至可以从近代科学出现之前，从人类用语言文字构造数学系统开始)。通过这种历史连续谱，可以很好地分析所谓理论驱动与数据驱动之间的关系，因为所有的转变都不是瞬时完成的。从发展的角度看，数据密集型科学研究部分地把原来属于人的“发现的逻辑”自动地用机器替代，即传统科学研究中科学家通过已有理论知识和各种数据做出科学假设的认知活动已经部分地被“外包”给人工物执行了。自近代科学出现以来，这种替代过程其实一直在进行着^①，而信息技术大大加速了对人类脑力的这种扩展和替代。以前，由人类完成的科学发现过程——即从自然界抽取数据并最终形成对自然界的认识模型现在部分地被数据生产和分析自动替代。当然，关于具体替代哪些部分，替代到什么程度才算是一种研究范式的转化，还有哪些部分将来有可能被替代，等等问题都与科学范式转换密切相关，但目前相关研究并不明晰，所以还需要从认知的角度考察这种替代过程。

①宽泛地说，人类文明的发展就是一个人类认知能力不断外化、用人工物替代或扩展人类认知能力的过程。

从认知的角度考察数据在科学活动中的作用及其变迁，可以看作是对科学的认知研究的一部分。关于后者的相关研究从20世纪七八十年代就已经开始，主要的代表人物有达登(L. Darden)、吉尔、内尔赛西安(N. Nersessian)，萨迦德(P. Thagard)、丘奇兰德(P. Churchland)等。吉尔早期利用心理学中的范畴理论解释其模型理论，近期则提出基于主体的分布式认知进路；内尔赛西安通过“认知-历史”方法研究科学中基于模型的推理，并长期进行实验室研究；萨迦德近期则基于神经机制研究科学概念的创新^[13]。从认知角度考察科学活动中数据的角色，上述研究给了我们一定的启发。但正如在关于数据驱动型科学范式的研究中存在用静态和孤立的方式看待“数据”和“理论”关系这个问题一样，在对科学的认知研究中也相应地存在二元地区分和静态地看科学理论、科学实践的问题^[13]。而科学实践恰恰是一个产生科学数据的过程，所以这种区分又会导致对数据和理论的二元区分和静态研究。在对科学的认知研究中，这个问题很大程度上源于认知科学中主导的表征计算范式。所以，如果要真正地从机制上了解数据与理论创造之间那种历史上动态的影响关系，需要把理论与数据本身纳入科学实践活动中，把两者同时看作一种实践过程，在一个统一的认知框架或视角下看待。

科学数据与科学理论本身都离不开数量的规定与数学的使用。我们认为初期可以从数学认知，尤其是具身的数学认知入手，考察人类的认知能力和认知活动与产生数据的科学实践活动之间的关系。以数学认知为一个桥梁，一端连接科学实践活动，另一端连接“理论活动”——即人类用认知能力构造静态理论的动态活动。这样可以把两者放在同一个认知框架下，更好地看清数据与理论的关系及其历史变迁。当然，数学认知本身也处于发展初期，而从数学认知角度考察科学及其活动也才刚刚起步^[14]，针对其中数据与理论关系的研究还有待真正展开。

Philosophical Reflection On the New Paradigm of Scientific Research in the Era of Big Data

WANG Dong

College of the Law and Marxism, Beijing Technology and Business University

Abstract: It emerges a new type of scientific research in the era of big data-directly through the analysis of scientific data to make a scientific discovery; Scientific and philosophical circles had a related debate about whether it constitutes a new paradigm of scientific research, or whether the data driven scientific discovery will end scientific theory and other issues; However, it reveals that further research is needed to distinguish among different disciplines and research levels, and to explain from the cognitive perspective on the role of data and its relationship with theories in scientific discovery activities.

Key words: data driven scientific research paradigm transformation cognitive mechanism

参考文献

[1]	国际科技数据委员会(CODATA)中国全国委员会. 大数据时代的科研活动. 北京: 科学出版社, 2014 . (0)
[2]	Critchlow T,Van Dam K.K. Data-intensive Science. Chapman & Hall/CRC, 2013. http://cn.bing.com/academic/profile?id=576788405&encoded=0&v=paper_preview&mkt=zh-cn (0)
[3]	T.Hey,etc..The Fourth Paradigm: Data -intensive Scientific Discovery. Redmond: Microsoft Research,2009. 中译本见: Tony Hey等. 第四范式:数据密集型科学发现. 潘教峰等译. 北京: 科学出版社, 2012. (0)
[4]	Kelling S, Hochachka W M, Fink D, et al. Data-intensive Science: A New Paradigm for Biodiversity Studies. Bioscience,2009, 59 (7) : 613-620. DOI: 10.1525/bio.2009.59.7.12. (0)
[5]	Leonelli S. Introduction: Making Sense of Data-driven Research in the Biological and Biomedical Sciences. Studies in History & Philosophy of Science Part C Studies in History & Philosophy of Biological & Biomedical Sciences,2012, 43 (1) : 1-3. (0)
[6]	Zi-Gang Huang, Jia-Qi Dong, Liang Huang, Ying-Cheng Lai. Universal Flux-fluctuation Law in Small Systems. Scientific Reports 4, Article number: 6787 (2014). http://cn.bing.com/academic/profile?id=1990271875&encoded=0&v=paper_preview&mkt=zh-cn (0)
[7]	Anderson C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired, 23 June 2008. Available at: http://www.wired.com/science/discoveries/magazine/16-07/pb_theory.[2012-10-12]. (0)
[8]	Kitchin R. Big Data, New Epistemologies and Paradigm Shifts. Big Data & Society,2014, 1 (1) : 1-12. (0)
[9]	Frické M. Big Data and its Epistemology. Journal of the Association for Information Science & Technology,2015, 66 (4) : 651-661. (0)
[10]	Leonelli S. What Difference Does Quantity Make On the Epistemology of Big Data in Biology. Big Data & Society,2014, 1 (1) : 1-11. (0)
[11]	张晓强, 蔡端懿. 大数据对于科学研究影响的哲学分析. 自然辩证法研究,2014 (11) : 123-126. (0)
[12]	黄欣荣. 大数据对科学认识论的发展. 自然辩证法研究,2014 (9) : 83-88. (0)
[13]	王东, 吴彤. 科学哲学的认知进路研究:现状与问题. 哲学动态,2016 (5) : 98-103. (0)
[14]	王东. 数学可应用性的一种认知解释——以自由落体方程为例. 自然辩证法研究,2014 (4) : 35-40. (0)