文章信息
- 邓奕军, 李燮慧
- DENG Yi-jun, LI Xie-hui
- 基于大数据知识服务体系的数字图书馆构建
- The Construction of Digital Library based on the Big Data Knowledge Service System
- 广西民族大学学报(自然科学版), 2017, 23(3): 76-80
- Journal of Guangxi University for Nationalities(Natural Science Edition), 2017, 23(3): 76-80
-
文章历史
- 收稿日期: 2017-04-03
移动互联网、云计算、物联网等新兴信息技术的迅猛发展掀开了全球化大数据时代的序幕.在大数据时代的背景下,数字图书馆的管理和服务都将不断得到变化和升级,以保证数字图书馆的健康、持续发展.在2014年召开的图书馆现代技术研讨会上,国家图书馆副馆长魏大威指出:“国家数字图书馆的各类数据急剧增长,迎来了大数据时代.”[1]他还强调:“大数据环境下,面对信息‘快速、简单、准确’的要求,数字图书馆要全面提升服务能力.”[2]2015年中、美、英、德、日等国家的200多位专家、学者来到敦煌,召开“2015敦煌论坛:大数据环境下的数字图书馆和世界文化遗产保存与使用国际学术会议”,共同探讨了大数据环境下数字图书馆及世界文化遗产的保存、使用等相关领域的问题.稍后中国政府网发布了《促进大数据发展行动纲要》,其中特别指出要加强数字图书馆等公益设施建设,构建文化传播大数据综合服务平台,传播中国文化,为社会提供文化服务[3].未来的时代将是大数据引领各方面发展的时代,未来的数字图书馆将是建立在网络、智能、大数据等基础上的便利、高效、互联、互动、智能、个性的图书馆,而大数据知识服务体系作为一种智慧化的知识服务模式使得实现未来数字图书馆的新目标成为可能.笔者基于大数据知识服务体系来探讨数字图书馆的构建以期为数字图书馆的建设提供一种新思路.
1 数字图书馆与大数据知识服务 1.1 大数据的内涵大数据(Big data),又称巨量资料,是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产.通常,大数据是以多元的形式,自许多来源搜集而来的庞大数据组,往往具有实时性.大数据与云计算有着密不可分的关系,大数据必须采用分布式计算架构,依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术实现对海量数据的挖掘和分析.大数据一般满足“4V”特点:即Volume(数据量大),大数据的计量单位是以P(1000 T)、E(100万T)或Z(10亿T)计的;Velocity(高速),信息处理速度快,信息时效性高;Variety(数据类型多样),包括音频、视频、图片、日志等;Value(价值密度较低),数据价值密度相对较低,这是大数据挖掘和传统数据挖掘的最大区别.当今时代,在世界范围内大数据已涉及社会大数据、政府大数据、企业大数据、个人大数据等许多个领域.人们利用大数据,可以实现便利的信息收集,高效的信息传递,政府、企业、个人等可以根据大数据提供的实时、有效信息做出更加正确的决策或决定.大数据时代的来临既给人们带来了高效、便利、智能的信息服务,又给人们在利用数据方面提出了新的挑战,大数据标志着信息社会时代的来临.
1.2 数字图书馆的职能及其大数据的特点 1.2.1 数字图书馆的职能早在2012年举行的川、吉、冀、桂、苏五省图书馆学会第十三届学术研讨会上,中国国家图书馆的副馆长陈力就在“对我国公共图书馆未来发展的思考”中对数字图书馆作了高度的概括,指出“数字图书馆就是数字时代的图书馆”,同时肯定了美国弗吉尼亚理工大学的Edward Fox教授提出的数字图书馆5S理论,即数字图书馆是具备社会性要素(Societies),能够满足人们的信息需求;情境性要素(Scenarios),能够提供相应的信息服务;结构性要素(Structures),能够以有用的方式组织信息;空间性要素(Spaces),能够以有用的方式展示信息;流体性要素(Streams),能够与用户交流信息这五项要素的复杂系统,也就是说数字图书馆最主要的职能就是利用先进的技术与巨量的资源为广大的用户提供随时随地高效、便捷的信息和知识服务[4].
1.2.2 数字图书馆大数据的特征近几年来,数字图书馆的大数据呈现出以下几个突出的特征.
1) 各类数据急剧增长.以我国国家图书馆为例,2007年国家图书馆馆藏数字资源只有200 TB, 到2013年底,其数字资源总量已达到874.5 TB,预计到“十二五”末,国家数字图书馆数字资源总量将达到10000 TB.
2) 数据类型趋于复杂.随着数字图书馆的读者服务终端不断扩展,服务量不断增加,数字图书馆除了馆藏数据、书目数据、读者数据、工作数据外,其各业务系统每天还会产生大量的包含用户行为信息的日志数据等.
3) 数据使用效率越来越高.对数字图书馆的数据库进行大数据的分析,可以做到在海量的种类繁多的信息中找出许多用户最想了解的蕴藏在碎片化数据中的知识和信息以及最新的学科发展动态信息等,为科研活动等提供及时、高效的参考和咨询服务.
1.3 大数据知识服务的模式和特点 1.3.1 大数据知识服务的模式随着信息服务趋于智慧化、协作化和泛在化,为了更好地完成不同行业、领域的相应任务及目标, 在大数据获取、存储、分析信息资源和决策的过程中必须解决结构化、非结构化和半结构化数据的问题,必须提高信息服务中对信息、资源、服务过程等的配置及整合能力, 大数据知识服务正是在这种新趋势下应运而生的信息服务的新模式.大数据知识服务模式是在大数据知识服务平台上, 基于基础框架体系、大数据处理体系、过程管理体系、大数据分析与决策体系、交互体系这五个服务体系,围绕数据、知识、资源、能力、服务、过程和任务这七个元素,依据不同行业、不同领域的不同大数据处理需求, 为用户提供服务设计、性能分析、大数据获取、存储、组织、分析、决策、服务评估、服务过程管理、安全与隐私保护等服务并实现数据、知识、资源、能力、服务、过程和任务等资源和能力的共享、协作和交易[5].
1.3.2 大数据知识服务的特点大数据知识服务模式是趋于智能、体验、个性、虚拟化的, 其信息的获取、分析、应用和传播也是趋于数字、网络、规模、集约化的, 在此基础上, 可以将大数据知识服务主要特点概括为:
1) 是一种智慧知识服务;
2) 强调用户的自主参与和群体创新;
3) 强调信息、资源、服务和能力的共享与交易;
4) 支持按需使用和付费;
5) 是一种绿色环保的知识服务.
2 大数据知识服务体系应用于数字图书馆的必然性和意义 2.1 大数据时代数字图书馆面临的机遇 2.1.1 资源建设方面的机遇大数据的到来使得各种数字资源成倍增长,数字图书馆所处的信息环境正发生着巨变,可以通过大数据分析、预测和智能辅助决策等技术构建符合数字图书馆自身特色、科学而实用的资源采购及业务评估模型.利用这些模型来预测受读者欢迎的图书类型,大大提高图书资源的采购效率,从而加快数字图书馆资源建设的步伐.
2.1.2 信息安全方面的机遇可以通过对数字图书馆的信息资源和软硬件资源状况的大数据分析构建信息安全风险评估模型,通过此模型预测诸如软硬件故障、网络攻击、信息服务障碍等事故的发生,帮助图书馆提早制定相应的对策,避免不必要的损失.
2.1.3 知识服务方面的机遇大数据技术可以实现高效、便捷地从已有的巨量信息资源中提取最有用的部分,使得信息资源趋于智能化、个性化、网络化,从而可以获得更加及时而准确的洞察读者的意愿、行为、阅读习惯、信息需求等,以便为读者提供交互式的更具个性化的新型知识服务.
2.2 大数据知识服务体系应用于数字图书馆的必然性 2.2.1 数字图书馆自身发展的需求随着大数据时代的到来,数字图书馆也呈现了迅猛发展的态势,数据资源数量、类型迅速增加,除了基本的文献、光盘数据、网络资源,还有读者信息、服务信息、图书馆自身的数据信息以及记录读者阅读行为的大量日志信息,这些信息及数据呈现出结构化、非结构化和半结构化特征,组成了巨量的异构数据,在内部的编码及格式等方面都无法统一.数字图书馆必须对这些价值密度低的异构数据进行处理,使之得到统一,并挖掘其潜在的价值,将大量的数据提炼成有价值的知识,实现图书馆数据、信息服务到知识服务的飞跃.数字图书馆需要应用大数据知识服务体系以解决上述自身存在的问题.
2.2.2 适应数字图书馆用户信息素养提高的需要信息科技高速发展的今天,用户自身的信息素养也不断提高,用户对信息的数量、质量及图书馆的服务都有了更高的要求.为了迎合用户的需求,数字图书馆必须在数据处理、服务方式等方面做出巨大的改进.如通过对读者的阅读习惯、爱好等进行大数据分析,推出更加个性化、智慧化的新型交互式服务.在改进文献服务的同时,数字图书馆的业务要向数据的挖掘和分析方面倾斜,从巨量的数据中挖掘出具有潜在价值的部分,为政府、企业、科研院所等社会机构和个人提供更加有效的信息咨询和学科知识服务.
2.2.3 大数据技术的发展使数字图书馆应用大数据知识服务体系成为必然随着移动网络、物联网、云计算等信息技术的突飞猛进,大数据技术也实现了快速的飞跃,扩展到可视化分析、数据挖掘算法、预测性分析能力、语义引擎、数据质量和数据管理等领域,具体主要有分布式缓存、基于MPP的分布式数据库、分布式文件系统、各种NOSQL分布式存储方案等[6].大数据技术的发展为数字图书馆的资源扩展、技术改进及服务创新等方面提供了强大的支持,使得大数据知识服务体系应用于数字图书馆成为必然.
2.3 大数据知识服务体系应用于数字图书馆的意义 2.3.1 大数据知识服务可以大大扩展数字图书馆的有效信息资源传统知识服务的数据处理能力极其有限,只能够使用户利用极小部分的有效数据.据统计,全球超过85%的信息数据是非结构化和半结构化的数据[7], 而这些数据的绝大部分没有得到充分的利用,数字图书馆的信息资源同样存在这种情况.大数据知识服务体系应用于数字图书馆可以使数字图书馆存储的大量复杂的结构化、非结构化和半结构化数据得到便捷、高效的统一处理, 从而使数字图书馆的信息资源实现横向的扩展,大大地丰富了数字图书馆的有效信息、知识资源.
2.3.2 大数据知识服务可以大大提高数字图书馆的知识服务层次大数据知识服务使数字图书馆除了可以为用户提供大量信息资源的获取、存储、组织、分析和决策等服务,还可以通过对大量结构化、非结构化及半结构化数据的深层次、多维度的智能分析,为用户提供科技、知识创新能力的智能评价与预测性分析以及科研动态和热点的预测、分析等高附加值的服务,大大提高数字图书馆的知识服务层次.
2.3.3 大数据知识服务可以让数字图书馆最大限度地满足用户的知识服务需求大数据知识服务基于网络的自由流通,在服务的形式下促进数字图书馆知识、能力、资源和过程实际的有机融合, 实现数字图书馆知识服务的知识动态协调构建、能力智慧管理、资源按需使用、过程智能控制[8].使数字图书馆能够利用有限的信息资源及现有的知识服务能力根据用户的不同需求提供不同类型、不同功能和不同维度的知识服务组合,从而可以更智能、更有效、更大限度地满足用户的知识服务需求.
3 大数据知识服务体系下数字图书馆的构建 3.1 数字图书馆的总体构建思路每次信息技术的发展与变革,带给图书馆的既有机遇也有挑战,图书馆是消亡于历史还是发展于未来,取决于图书馆自身能否积极面对并运用新技术进行全方位的变革与创新.所以数字图书馆要抓住信息科技革命带来的机遇,积极面对并利用大数据技术、大数据知识服务体系以开创数字图书馆光明而美好的未来.数字图书馆的建设任务是繁重而复杂的, 宏观的构建思路是圆满完成数字图书馆建设任务必不可少的指导.首先,在大数据时代,数字图书馆人要转变思想,寻求与时俱进的生长点,将大数据视为图书馆的最重要资产,熟练掌握和运用大数据分析、挖掘技术及大数据知识服务体系,在各种信息技术共同推动下提供以分析、预测和智能辅助决策等为主要特点的智慧服务,并将智慧服务作为数字图书馆的主要服务内容.其次,要维护并完善数字图书馆的相关制度,指导、调节和约束政府管理部门、数字图书馆和用户的行为,发挥数字图书馆在公益服务、数据安全和隐私权保护等方面的重要作用,为公共的智慧服务提供保障.最后,为实现数字图书馆建设和管理的高效、统一,使大数据知识服务体系得到有效的应用,需要将数字图书馆建设、管理实体的确立作为重中之重,同时加强图书馆内部各部门之间的协调合作以及图书馆与其他合作单位、部门的协同互助.以打造能够提升用户知识、智慧水平的智慧图书馆作为未来发展的终极目标.
3.2 信息、人力、设备——多层次的资源建设 3.2.1 信息资源建设大数据知识服务体系要求数字图书馆转变信息资源建设理念,在数据公开和共享的时代趋势下,努力推进信息资源的开放、共享与共建,让数字图书馆的管理者、信息资源的提供者、云服务的运营商、读者等都能融入大数据知识服务体系中.这就要求数字图书馆在保障已有信息资源安全的前提下,推进信息资源建设的国际化、标准化进程,做到信息资源全球范围内的无缝链接,在世界范围内的信息资源空间发现、采集、分析和组织各种信息资源,完成与各个主体之间的信息资源交换、协作与转换等活动,实现开放化、多元化、支持用户驱动的信息资源体系的构建.
3.2.2 人力资源建设数字图书馆员包括图书馆的管理人员和服务人员,他们是完成数字图书馆运营管理和用户服务的关键.大数据知识服务体系对图书馆员的要求更高,除了要做好智能化设备和信息资源的管理与调度,服务环境的安防与调节,还要做好与用户和其他资源主体等的交互工作.这就要求数字图书馆员不断地充实自身的知识和技能储备,具备大数据知识服务体系要求的专业素养和管理水平.
3.2.3 智能化设备建设大数据知识服务体系对数字图书馆所需设备的要求更高,智能化设备成为数字图书馆大数据知识服务实现的基础和前提,除了数字图书馆必备的电脑、网络等设备,还应包括红外感应、激光扫描器等物联网设备,摄像头、传感器等智能感知设备,检索、查询等自动服务设备,以及虚拟现实等能调动用户兴趣的设备.
3.3 数据、网络、感知——全方位的技术提升 3.3.1 大数据处理系统的建立大数据知识服务体系下数字图书馆的数据处理涉及数据的检索、获取、存储、分析、共享和展示等多个环节[9],数据来源众多、数据格式千差万别,呈现出异构化、多样化、分布式等特征,因此必须建立大数据处理系统才能满足大数据知识服务体系下的数据存储、挖掘和分析等工作要求.基于云计算的数据存储和挖掘平台是大数据处理系统必不可少的组成部分.云储存将数字图书馆的大量数据进行分布式的托管和存储;数据挖掘提供包括算法服务管理、数据并行处理、调度引擎等支撑能力;大数据分析可以通过运用Hadoop等数据处理分析工具在海量的信息资源中找到相关的模式、热点和有用的信息等,最终实现基于云计算的信息资源存储、挖掘、分析和访问服务.
3.3.2 泛在网络的建立大数据知识服务体系下的数字图书馆要做到随时随地为用户提供图书馆的任何信息资源,就必须通过建立泛在网络来实现信息共享下的物联和交互.物联网可以实现文献资源、用户、设备与场馆之间的互联,互联网可以实现用户、数字图书馆与其他资源主体之间的交互.泛在网络整合了互联网、无线网、电信网、电视网等多种网络通信技术,可以使任何用户在任何时间和地点访问任何数字图书馆的信息资源,真正做到了数字图书馆的知识泛在服务.
3.3.3 智能化感知体系的建立大数据知识服务体系下的数字图书馆每时每刻都要接受大量用户的访问,对用户进行实时的身份识别和信息采集是不可缺少的环节.而智能化感知体系的建立可以轻松解决上述问题:运用身份识别技术,如指纹识别、音纹识别、人脸识别等可以快速鉴定用户的身份,简化了服务流程;此外,智能化感知体系还具备感知用户情境的能力,并通过对用户情境的判断为用户提供智慧化的服务.
3.4 个性、互动、共享——智慧化的知识服务 3.4.1 个性、主动的信息推送服务大数据知识服务体系下的数字图书馆应依托大数据、云计算等信息技术对诸如读者的信息资源利用兴趣、效率、满意度、意愿等方面的海量数据进行深层次的跟踪、挖掘、分析与预测,根据用户不同的喜好和需求,为不同用户提供符合各自需求的个性化的信息推送服务,使每个用户都能高效的利用自己需要的有用信息,享受智慧化的知识服务.
3.4.2 多元、全面的信息交互服务大数据知识服务体系下的数字图书馆应在平等、互动的前提下通过云计算平台或移动终端等与用户进行随时随地的信息交互,通过智能搜索引擎和智能聊天机器人等与用户进行随时随地的互动[10].使数字图书馆的信息、人力、技术资源全力配合回馈给用户个性化、多元化、全面化的知识服务.
3.4.3 共享、协作的知识服务大数据知识服务体系下的数字图书馆应积极推进和相关行业的信息共享与协作.让数字图书馆的管理者、信息资源的提供者、云服务的运营商、读者等都能融入大数据知识服务体系中,实现各个群体之间的信息共享与协作.集中发挥各个群体的优势,不断提升数字图书馆自身的服务能力和效率,进而达到智慧化知识服务的水平.
4 结语未来的数字图书馆要想不被历史淘汰,要想与时俱进就必然要依赖大数据技术及知识服务体系而构建.在此主旨下,首先对大数据的内涵、数字图书馆的职能、数字图书馆在大数据时代呈现的数据特征、大数据知识服务的模式和特点做了介绍.在此基础上,讨论了大数据知识服务体系应用于数字图书馆的必然性和意义,提出了大数据知识服务体系下数字图书馆的构建思路并具体从资源、技术、服务三大方面探讨了数字图书馆的构建,以期使数字图书馆跟上大数据时代的步伐,向着能够为最广大用户提供智慧服务,为人类知识、智慧的提升、传播和延续做出不朽贡献的终极目标前进.然而,目前有关大数据知识服务体系的研究和应用还未引起足够的关注和重视,相关的文献也很少,关于大数据技术、大数据知识服务体系如何在数字图书馆领域应用,还有待进一步的研究、验证和探索.
[1] | 李雪. 数字图书馆迎大数据时代: 将整合资源提供深度服务[EB]. 人民网, 2014. 12. 05, http://culture.people.com.cn/n/2014/1105/c172318-25981395.html. |
[2] | 杨雪梅. 数字图书馆和世界文化遗产保存与使用学术会议召开[EB]. 中国社会科网, 2015. 08. 26, http://news.cssn.cn/kgx/kgdt/201508/t20150826_2135600.shtml. |
[3] | 促进大数据发展行动纲要[EB]. 中国政府网, 2015. 09. 05, http://www.gov.cn/xinwen/2015-09/05/content_2925357.html. |
[4] | 谢欢, 沈妍. 移动环境下图书馆的机遇与挑战[J]. 图书与情报, 2011(5): 65–68. |
[5] | 李晨晖, 崔建明, 陈超泉. 大数据知识服务平台构建关键技术研究[J]. 情报资料工作, 2013(2): 30. |
[6] | 黄力. 基于物联网技术的图书馆服务模式与内容的研究[J]. 图书馆学研究, 2011(6): 51–55. |
[7] | 李国杰. 大数据研究的科学价值[J]. 中国计算机学会通讯, 2012(9): 8–15. |
[8] | 秦晓珠, 李晨晖, 麦范金. 大数据知识服务的内涵、典型特征及概念模型[J]. 情报资料工作, 2013(2): 19. |
[9] | 陈臣. 基于大数据的图书馆个性化智慧服务体系构建[J]. 情报资料工作, 2013(6): 75–79. |
[10] | 王浩. 大数据环境下数字图书馆建设初探[J]. 河北科技图苑, 2015(5): 78. |